유가분석
001. selenium 세팅
< Beautiful Soup 만으로 해결할 수 없는 것 >
1. 접근 할 웹 주소를 알 수 없을 때
2. 자바스크립트를 사용하는 웹페이지의 경우
3. 웹 브라우저로 접근하지 않으면 안될 때
< selenium >
< selenium 접근 코드 >
from selenium import webdriver
driver = webdriver.Chrome(‘./chromedriver’)
driver.get(‘원하는 링크 주소’)
< 스크롤 가능한 높이를 가져오는 코드 >
last_height = driver.execute_script(“return document.body.scrollHeight”)
last_height
< 화면 스크롤 코드 >
driver.execute_script(“window.scrollTo(0, document.body.scrollHeight);”)
< 화면 페이지를 지정하는 지점의 xpath를 찾은 후 그 지점까지 스크롤 하는 코드 >
from selenium.webdriver import ActionChains
some_tag = driver.find_element_by_xpath(‘’‘//*[@id=“paging”]/ul’‘’)
action = ActionChains(driver)
action.move_to_element(some_tag).perform()