728x90
Python으로 BeautifulSoup4를 사용해서 웹크롤링 해보자.
예제로 Naver 배당주 페이지를 크롤링 해보자
※ BeautifulSoup4 설치
pip install BeautifulSoup4
※ 소스
import requests
from bs4 import BeautifulSoup as bs
arr = []
for i in range(1, 28): #28
page = requests.get("https://finance.naver.com/sise/dividend_list.naver?field=dividend_rate&sosok=&ordering=desc&page=" + str(i))
soup = bs(page.text, "html.parser")
elements = soup.select('table.type_1 tr td a')
# append() [-6:] strip() replace() float() .parent
for index, element in enumerate(elements, 1):
a = element
b = a.parent.parent.select('td')
arr2 = [a.attrs['href'][-6:], a.text]
for i in range(1,12):
if b[i].text.strip() != '-':
arr2.append(float(b[i].text.strip().replace(',','')))
else:
arr2.append('')
arr.append(arr2)
print(arr)
※ 실행
728x90
반응형
'Software > Python' 카테고리의 다른 글
Python 시작하기 - Flask 소개 (0) | 2024.07.16 |
---|---|
Python 시작하기 - Mysql 활용 (0) | 2024.07.07 |
Python 시작하기 - selenium 활용 (0) | 2024.07.02 |
Python 시작하기 - selenium 소개 (0) | 2024.07.02 |
Python 시작하기 - JSON 변환 (0) | 2024.06.23 |