Python/Python Crawling

02. 셀레니움 selenium 01

HicKee 2023. 2. 15. 23:33
# 데이터 수집 - 데이터 (웹) 크롤링, 스크랩핑
# 시스템을 구축 -> 데이터 수집 -> 전처리

# 정형, 반정형, 비정형 ( 3가지로 구분 )
# 정형 - 엑셀, DB, CSV
# 반정형 - html, xml, json
# 비정형 - 소리(음성), 이미지, 영상 등등 ( 실생활에서의 아날로그 데이터들 )

# selenium
import time
from selenium import webdriver
# 크롬 -> 도움말 -> 크롬 정보 -> 버전 확인 109.0.5414.75
# 버전업이 되면서 크롬 드라이버 설치를 안해도 된다
from selenium.webdriver.common.by import By

"""
browser = webdriver.Chrome()  # 브라우저 정보를 얻음
browser.get('http://python.org')
time.sleep(2)  # 2초대기
browser.quit()  # browser 종료
"""

browser = webdriver.Chrome()  # 브라우저 정보를 얻음
browser.get('http://python.org')

menus = browser.find_elements(By.CSS_SELECTOR, '#top ul.menu li')

pypi = None
for m in menus:
    if m.text == 'Docs':
        pypi = m
    print(m.text)
time.sleep(2)

pypi.click()  # 메뉴를 선택

time.sleep(3)

browser.quit()

'Python > Python Crawling' 카테고리의 다른 글

04. 판다스 (pandas) 02  (0) 2023.03.05
03. 판다스 (pandas) 01  (0) 2023.02.24
02. 셀레니움 selenium 02  (0) 2023.02.19
01. 뷰티풀 수프 BeautifulSoup 02  (0) 2023.02.13
01. 뷰티풀 수프 BeautifulSoup 01  (0) 2023.02.12