파이썬
BeautifulSoup vs Scrapy
gyuho.kim
2018. 7. 19. 22:32
BeautifulSoup
- html에서 원하는 정보를 손쉽게 가져올 수 있다
- 자동으로 인코딩을 유니코드로 변환
- lxml, html5lib 사용
- BeautifulSoup4 : https://www.crummy.com/software/BeautifulSoup/bs4/doc/
Scrapy
- web scrapper famework
- 다양한 selector 지원
- 파이프 라인
- logging
- 이메일 : 어떤 데이터가 들어왔을때 이메일을 보내줌
Result : 기능면에서 보았을때 상대적으로 Scrapy > BeautifulSoup