티스토리 뷰
#@title
import requests
from bs4 import BeautifulSoup
from openpyxl import Workbook
from datetime import datetime
def get_news(keyword):
wb= Workbook()
sheet = wb.active
headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
data = requests.get(f'https://search.naver.com/search.naver?where=news&ie=utf8&sm=nws_hty&query={keyword}',headers=headers)
soup = BeautifulSoup(data.text, 'html.parser')
lis = soup.select('#main_pack > section > div > div.group_news > ul > li')
for li in lis:
a = li.select_one('a.news_tit')
row = [a.text, a['href']]
sheet.append(row)
today = datetime.today().strftime("%Y-%m-%d")
wb.save(f"news/{today}_{keyword}.xlsx")
wb.close()
'language > python' 카테고리의 다른 글
| smtp를 이용한 메일 자동화 코드 (0) | 2023.07.14 |
|---|---|
| 어미새 페이지 크롤링 후 알림 (0) | 2023.07.14 |
| dart api 활용 (0) | 2022.10.04 |
| 220922. jinja2.exceptions.TemplateNotFound: index.html에러 (0) | 2022.09.22 |
| 220921 - text[0:2] / strip() (0) | 2022.09.21 |
댓글
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- 토큰
- 항해
- jmeter토큰
- Redisson
- pessimisticlock
- Spring
- Redis
- Python
- EC2
- 대규모더미데이터
- jmeter부하테스트
- jmeter쿠키
- Java
- hackerrank
- jmeter로그인
- jmeter테스트
- 프로그래머스
- 동적크롤링
- 스프링faker
- CheckedException
- 부하테스트시나리오
- index
- bankersRounding
- Lock
- 인덱스
- jmeter세션
- jwt
- 자바
- CorrectnessAndTheLoopInvariant
- jmeter시나리오
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
글 보관함