티스토리 뷰
#@title
import requests
from bs4 import BeautifulSoup
from openpyxl import Workbook
from datetime import datetime
def get_news(keyword):
wb= Workbook()
sheet = wb.active
headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
data = requests.get(f'https://search.naver.com/search.naver?where=news&ie=utf8&sm=nws_hty&query={keyword}',headers=headers)
soup = BeautifulSoup(data.text, 'html.parser')
lis = soup.select('#main_pack > section > div > div.group_news > ul > li')
for li in lis:
a = li.select_one('a.news_tit')
row = [a.text, a['href']]
sheet.append(row)
today = datetime.today().strftime("%Y-%m-%d")
wb.save(f"news/{today}_{keyword}.xlsx")
wb.close()
'language > python' 카테고리의 다른 글
smtp를 이용한 메일 자동화 코드 (0) | 2023.07.14 |
---|---|
어미새 페이지 크롤링 후 알림 (0) | 2023.07.14 |
dart api 활용 (0) | 2022.10.04 |
220922. jinja2.exceptions.TemplateNotFound: index.html에러 (0) | 2022.09.22 |
220921 - text[0:2] / strip() (0) | 2022.09.21 |
댓글
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- 인덱스
- Lock
- Python
- 자바
- pessimisticlock
- jmeter시나리오
- jmeter쿠키
- hackerrank
- jwt
- 프로그래머스
- Redisson
- 토큰
- 항해
- jmeter부하테스트
- 스프링faker
- CorrectnessAndTheLoopInvariant
- jmeter토큰
- jmeter세션
- Spring
- index
- bankersRounding
- jmeter로그인
- jmeter테스트
- 부하테스트시나리오
- 동적크롤링
- Redis
- Java
- CheckedException
- 대규모더미데이터
- EC2
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
글 보관함