728x90

Python으로 BeautifulSoup4를 사용해서 웹크롤링 해보자.

 

예제로 Naver 배당주 페이지를 크롤링 해보자

 

※ BeautifulSoup4 설치

pip install BeautifulSoup4

 

※ 소스

import requests
from bs4 import BeautifulSoup as bs

arr = []
for i in range(1, 28): #28
  soup = bs(page.text, "html.parser")
  elements = soup.select('table.type_1 tr td a')
  # append() [-6:] strip() replace() float() .parent
  for index, element in enumerate(elements, 1):
    a = element
    b = a.parent.parent.select('td')
    arr2 = [a.attrs['href'][-6:], a.text]
    for i in range(1,12):
      if b[i].text.strip() != '-':
        arr2.append(float(b[i].text.strip().replace(',','')))
      else:
        arr2.append('')
    arr.append(arr2)

print(arr)

 

※ 실행

 

728x90
반응형

'Software > Python' 카테고리의 다른 글

Python 시작하기 - Flask 소개  (0) 2024.07.16
Python 시작하기 - Mysql 활용  (0) 2024.07.07
Python 시작하기 - selenium 활용  (0) 2024.07.02
Python 시작하기 - selenium 소개  (0) 2024.07.02
Python 시작하기 - JSON 변환  (0) 2024.06.23

+ Recent posts