Beautifulsoup 용도와 세팅방법을 알아보자!


# 개발환경

필자는 다음 환경에서 개발을 진행하였습니다.
주의 ) 앞으로 포스팅될 Beautifulsoup 관련 코드가 Python 2 에서 정상적 수행이 이루어지지 않을 수 있음을 사전공지합니다.

-------------------Develop Environment-------------------
O.S : vmware - linux ubuntu desktop 16.04
Python Version : Python 3
Browser : FireFox의 요소검사 ( 어느 브라우저든 '요소검사' 기능만 있으면 됨 )

# Beautifulsoup 이란?

Beautiful Soup은 HTML 및 XML 파일에서 데이터를 가져오는 Python 라이브러리입니다.
다만, 아쉽게도 Beautiful Soup을 이용해서 가져올 수 있는 Page Source는 정적 스크립트입니다.
따라서 javascript로 생성되는 동적 스크립트는 Python의 또 다른 라이브러리인 Selenium을 이용해 Pulling 할 수 있습니다.
( 웹에서 웬만한 Data는 Beautiful Soup와 Selenium을 이용해 가져올 수 있습니다. )


# Beautifulsoup 설치?

먼저 우분투 환경에서 Beautifulsoup를 세팅하는 방법은 다음과 같습니다.
( 혹시Python3 설치가 안된 분들을 위해 Python3 설치법부터 적어놓겠습니다. )

sudo apt-get update // 사용 가능한 패키지들과 그 버전들의 리스트를 업데이트 하는 명령어.
sudo apt-get install python3 // Python 3 설치
sudo apt-get install python3-pip // pip은 Python 라이브러리 패키지 관리 시스템
pip3 install beautifulsoup4 // beautifulsoup4 설치 명령어

위 코드를 치면 Beautifulsoup 초기 세팅이 완료됩니다.
다음 글에서 Beautifulsoup 사용법을 알려드리겠습니다.

+ Recent posts