티스토리 뷰
[Crawling 이란?]
크롤링이란 말 그대로 긁어 오다 라는 뜻이다.
웹에 있는 문서중에 원하는 내용만 긁어 오는 것을 말한다.
날씨나 쇼핑몰의 상품정보, 주식, 뉴스기사 등등
굉장히 유용하고 활용범위는 굉장히 넓다.
[HTML]
크롤링이란 말 그대로 긁어 오다 라는 뜻이다.
웹에 있는 문서중에 원하는 내용만 긁어 오는 것을 말한다.
날씨나 쇼핑몰의 상품정보, 주식, 뉴스기사 등등
굉장히 유용하고 활용범위는 굉장히 넓다.
import requests
from bs4 import BeautifulSoup
def get_html(url):
resp = requests.get(url)
return resp.text if resp.status_code == 200 else ""
def get_items(keyword):
url = "https://search.shopping.naver.com/search/all.nhn?query=" + keyword
html = get_html(url)
soup = BeautifulSoup(html, 'html.parser')
return soup.find("div",{"class": "search_list basis"}).find_all("a",{"class": "tit"})
def parser(items):
return [item["href"]+"\n"+item.text.strip() for item in items]
def out(items):
return "\n".join([item for item in items])
def request(keyword):
items = get_items(keyword)
items = parser(items)
return out(items)
if __name__ == "__main__":
print(request("롱패딩"))
'python lecture > project' 카테고리의 다른 글
[edu] 가위바위보 게임 (랜덤, 확률, 결과 예측) (0) | 2019.01.10 |
---|---|
[edu] 계산기 테스트 자동화 (수식 자동생성) (0) | 2019.01.09 |
[edu] 연락처 (push, pull, csv) (0) | 2018.12.31 |
[edu] 계산기 (사칙연산, 괄호, 입력식 오류 처리) (0) | 2018.12.28 |
[edu] slack bot (0) | 2018.08.28 |
댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- 장고
- GIT
- Tistory
- 파이썬 강좌
- 엑셀 비교
- 모바일 스킨 적용
- 문서 비교
- 파이썬 독학
- 면접정답
- admin.py
- gitlab
- django chatbot
- virtualenv
- 파이썬 입문
- 이미지 비교
- wsgi
- pycrypto
- 모바일 테마 적용
- 장고 플러스친구 자동응답
- 파이썬
- gitignore
- 플러스친구 자동응답
- 장고 카톡 자동응답
- 문과 코딩
- chatbot
- 파이썬 프로그래밍
- PuTTYGen
- django
- 면접답변
- Python
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
글 보관함