반응형
BeautifulSoup 모듈은 웹페이지에서 자료를 추출하고 분석하는 모듈입니다.
https://pypi.org/project/beautifulsoup4/
현재 4 버전까지 출시되어 있고, 외부모듈이기 때문에 명령 프롬포트에서 직접 설치해야 합니다.
시작 -> 검색 -> cmd -> python 파일을 실행할 폴더로 이동
>> cd 파일경로 입력
>> pip install beautifulsoup4 (혹은 bs4) 엔터
설치 완료
# 네이버 코스피 지수를 추출하는 태그
## from urllib import request # 소스를 가져와서 바이너리 형태로 읽어 들인다.
import requests # 외부 모듈이므로 install 해야 한다.
from bs4 import BeautifulSoup
response = requests.get("https://finance.naver.com/") # .get() 은 이 주소로부터 소스코드를 가져오는 것
code = response.text
#이제 bs 뒤에 생성자 인수를 붙이면 bs가 분석해줄 것
soup = BeautifulSoup(code, "html.parser") #code 를 따와서 웹페이지를 분석하고(파싱) 그 결과를 soup로 반환한다.
# 수프 자료에서 한 개를 뽑는다.
kospi = soup.select_one("span.dn > span.num") #span.dn 하단에 있는 span.num 을 뽑아온다.
# 네이버 파이넨스 페이지의 코스피 지수 자료를 개발자모드에서 클릭했을 때 뜨는 소스 참조
print(kospi.string) #kospi 변수에서 string 문자열만 가져온다.
반응형
'파이썬 > 파이썬 코드 예제 만들기' 카테고리의 다른 글
파이썬 코드. Turtle 모듈(거북이 모듈) 키보드로 그림 그리기 (0) | 2022.10.20 |
---|