TIL 09

김지우·2022년 11월 15일

TIL

목록 보기

9/16

TD: review

API에 들어온 데이터를 데이터 베이스에 정의하는 Defining a Model
특정 웹 사이트의 HTML 데이터를 가져올 수 있는 Scraping & Crawling
Scraping의 추가적인 기능을 주는 도구 cheerio

오늘은 mongoose 라이브러리를 사용하기 위해 Model 정의하여 GET API 와 POST API에 요청된 데이터 값을 mongose에 저장되는 과정을 실습하였고 특정 웹페이지의 HTML 데이터를 불러와 사용하는 법을 실습했습니다.

Schema

Schema : 데이터를 데이터베이스에 저장하기 전에 사용자가 작성한 기준으로 먼저 데이터를 검사

mongoose는 요청된 데이터가 저장되기 전에 사용자가 작성한 Schema를 기준으로 먼저 검사를 한 뒤, Schema에 어긋나는 데이터가 있으면 오류를 발생시킵니다. 즉, 테이블과 비슷한 역할을 하는 기능이며 구조에 관한 기능들을 하나로 모아둔 개념입니다.
아래는 Schema 작성 예시 입니다.

Schema Data type

mongoose의 스키마는 mongoDB에 저장되는 document의 Data 구조 즉 필드 타입에 관한 정보를 JSON 형태로 정의한 것입니다.

출처 : Mongoose(몽구스) 스키마(Schema), MongoDB/ 스크래핑

Scraping & Crowling

Scraping: 특정 웹 사이트의 HTML을 긁어온다.
Crowling: 스크래핑을 정기적, 주기적으로 여러번 한다.

Scraping 이란?

Scraping은 특정 웹 사이트나 페이지에서 필요한 데이터를 추출해 내는 것을 말합니다.
특정 웹 사이트에 GET 요청을 보내고 사이트가 이에 응답하면 HTML문서를 분석하여 특정 패턴을 지닌 데이터를 뽑아냅니다.
그 이후에 추출된 데이터를 원하는 대로 사용할 수 있도록 데이터베이스에 저장합니다.