210504_파이썬을 이용한 웹 크롤링_20

정재현·2021년 5월 4일
0

TIL2

목록 보기
62/79

어제에 이어서 진행한다.
굳이 이미지를 저장할 필요가 없었다.
이미지는 URL로 뿌려주면 되기때문이다. 오늘은 우선 그 변경작업을 진행한다.
우선 DB에 이미지로 저장했을 때와 이미지 URL로 저장했을 때 차이점은 없는지부터 알아본다.

첫번째 이미지가 URL로 넣었을 때이고 나머지는 이미지 파일로 넣었을 때다.
차이점은 없어서 이미지 URL로 진행한다.
(이미지 코드 작업한거 아깝다...)

그럼 어제했던 고민들을 다시 살펴보면,
1. 이미지를 어떻게 서버에 올릴 것인가.
2. pk 값인 num을 어떻게 관리할 것인가.

1번은 DB에 이미지 URL값을 올리는 것으로 해결.
2번은 계속 쌓이게 해주는 것으로 결정했다.

이 테이블에서 num값이 pk인데 기사 데이터를 계속해서 쌓아주고
기사 언론사별 페이지에서만 9개씩 노출해주는 작업을 해주기로 했다.
그것이 맞는 방법이다.
그래서 num값에 auto_increment를 걸었다.

걸고~ 크롤링을 여러번 진행해주면,

이렇게 된다.
어차피 DB에 잘 쌓이기만 하면 된다.
9개씩 노출되는 작업은 프론트 팀원분께서 작업해주기로 하셨고,
나는 이제 언론사 별로 노출되는 함수를 작업해야 한다.

근데 보다보니깐 이것도 sql문으로 나눠주는 작업을 하면 될거같은데..?
그러니깐 모든 기사를 테이블에다가 다 가져왔으니깐

원하는 언론사의 버튼을 누르면 쿼리문으로 테이블에서 적합한 언론사의 데이터 값만 가져오면 된다.
왜 메서드를 만드려고 했을까..?
(물론 이미 코드작업을 해놨지만..)

예를들어 이 테이블에서 "연합뉴스"의 기사 값들을 가져오고 싶으면

SELECT * FROM News_Cl WHERE press="연합뉴스";

요렇게 해주면 가져올 수 있다.
음.. 쿼리문 작업은 프론트에서 해주면 되겠지..?
언론사 크롤링은 얼추 끝나가는건가..?

오늘의 코멘트: 아니겠지 설마 ㅋㅋㅋ 프로젝트 기한은 5주정도 남았다.

profile
"돈받고 일하면 프로다"

0개의 댓글