반응형
Python에서 웹크롤링을 하기 위한 도구로써 selenium을 사용해 보겠습니다.
Selenium을 사용하기 위해서는 pip으로 selenium을 설치하고 브라우저에 알맞은 webdriver를 설치하여야 합니다.
우선 pip으로 selenium을 설치해주세요.
$ pip install selenium
다음 webdriver를 다운로드하여야 합니다. 저는 Chrome을 주로 사용하기 때문에 ChomreDriver를 다운로드하겠습니다.
위 사이트를 들어가서 본인의 크롬 버전에 맞는 ChromeDriver를 다운로드하여야 합니다.
본인의 크롬 버전을 확인하려면 아래 주소를 브라우저 URL에 넣으면 됩니다.
chrome://version
※ 오른쪽 상단의 옵션 메뉴 중 도움말(E)> Chrome 정보(G) 페이지를 통해서도 확인할 수 있습니다.
저는 Windows10 환경의 81 버전이므로 81버전 ChromeDriver를 들어가 win32 파일을 다운로드하였습니다.
다운로드한 압축파일을 해제하면 chromedriver.exe 파일이 있는데 해당 파일을 본인이 접근이 쉬운 폴더로 이동시켜 줍니다. 저는 code와 동일한 폴더에 두겠습니다.
이제 간단히 테스트해보겠습니다.
from selenium import webdriver
# Webdriver 실행
dr = webdriver.Chrome('./chromedriver.exe')
# Webdriver에서 네이버 페이지 접속
dr.get('https://www.naver.com/')
해당 코드를 실행하면 다음과 같이 브라우저가 실행이 되고 크롬 상단 부분에는 'Chrome이 자동화된 테스트 소프트웨어에 의해 제어되고 있습니다.'라는 문구를 통해 해당 브라우저가 chromedriver를 통해 실행되고 있음을 확인할 수 있습니다.
반응형
'취미개발' 카테고리의 다른 글
Windows OpenSSH Server 설치 및 설정 (0) | 2023.03.17 |
---|---|
Python 웹 크롤링 시작하기: 스타벅스 메뉴 정보 크롤링 (0) | 2020.04.19 |
AirFlow 환경 만들기(2) - Airflow 설치하기(feat. docker) (0) | 2020.02.21 |
AirFlow 환경 만들기(1) - Postgres 설치하기(feat. docker) (0) | 2020.02.21 |