220928 colab으로 웹스크래핑&엑셀로 저장

티스토리 뷰

language/python

kirinman 2022. 9. 28. 21:28

#@title

import requests

from bs4 import BeautifulSoup

from openpyxl import Workbook

from datetime import datetime

def get_news(keyword):

wb= Workbook()

sheet = wb.active

headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}

soup = BeautifulSoup(data.text, 'html.parser')

lis = soup.select('#main_pack > section > div > div.group_news > ul > li')

for li in lis:

a = li.select_one('a.news_tit')

row = [a.text, a['href']]

sheet.append(row)

today = datetime.today().strftime("%Y-%m-%d")

wb.save(f"news/{today}_{keyword}.xlsx")

wb.close()

smtp를 이용한 메일 자동화 코드 (0)	2023.07.14
어미새 페이지 크롤링 후 알림 (0)	2023.07.14
dart api 활용 (0)	2022.10.04
220922. jinja2.exceptions.TemplateNotFound: index.html에러 (0)	2022.09.22
220921 - text[0:2] / strip() (0)	2022.09.21

공지사항

최근에 올라온 글

최근에 달린 댓글

링크

글 보관함