티스토리 뷰
#@title
import requests
from bs4 import BeautifulSoup
from openpyxl import Workbook
from datetime import datetime
def get_news(keyword):
wb= Workbook()
sheet = wb.active
headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
data = requests.get(f'https://search.naver.com/search.naver?where=news&ie=utf8&sm=nws_hty&query={keyword}',headers=headers)
soup = BeautifulSoup(data.text, 'html.parser')
lis = soup.select('#main_pack > section > div > div.group_news > ul > li')
for li in lis:
a = li.select_one('a.news_tit')
row = [a.text, a['href']]
sheet.append(row)
today = datetime.today().strftime("%Y-%m-%d")
wb.save(f"news/{today}_{keyword}.xlsx")
wb.close()
'language > python' 카테고리의 다른 글
smtp를 이용한 메일 자동화 코드 (0) | 2023.07.14 |
---|---|
어미새 페이지 크롤링 후 알림 (0) | 2023.07.14 |
dart api 활용 (0) | 2022.10.04 |
220922. jinja2.exceptions.TemplateNotFound: index.html에러 (0) | 2022.09.22 |
220921 - text[0:2] / strip() (0) | 2022.09.21 |
댓글
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- jmeter로그인
- 부하테스트시나리오
- jmeter테스트
- 항해
- 프로그래머스
- EC2
- 대규모더미데이터
- jwt
- jmeter토큰
- Lock
- 토큰
- 자바
- CorrectnessAndTheLoopInvariant
- bankersRounding
- CheckedException
- index
- pessimisticlock
- Java
- 스프링faker
- jmeter쿠키
- Redisson
- hackerrank
- Redis
- jmeter부하테스트
- jmeter세션
- 인덱스
- Python
- Spring
- jmeter시나리오
- 동적크롤링
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
글 보관함