★ 본격적인 웹 크롤링! - BeautifulSoup의 select() 사용
select()
select('태그명')
select('.클래스명')
select('태그명.클래스명')
select('상위태그명.클래스명>하위태그명.클래스명')
- '>' : 자식태그 표현
##~위에 생략 - 로그인 구현 및 사이트 이동 코드~##
#활동스트림 내용 담은 element 가져오기
sleep(5)
response=driver.find_element_by_xpath('//*[@id="body-content"]').get_attribute('innerHTML')
soup = bs(response, 'html.parser')
##최근항목 10개 가져오기##
#수업 코스 이름
#linkToCourse - 수업코스이름 담고있는 a태그의 상위태그 div의 클래스명
cours=soup.select('.js-previousStreamEntries.activity-group.columns.main-column>ul.activity-feed>li>div>div>div>div>div>a') #linkToCourse
#수업 바로 밑 타이틀 내용
#name - 타이틀 내용 담고있는 a태그의 (상위(ng-switch)의)상위태그 div의 클래스명
title=soup.select('.js-previousStreamEntries.activity-group.columns.main-column>ul.activity-feed>li>div>div>div>div>div.name>ng-switch>a') #name
for i in range(0,10,1):
print(cours[i].text)
print("\n")
for i in range(0,10,1):
print(title[i].text)
※ 하면서 알게 된 점