1. DOM
- HTML => HTML PARSER => DOM 트리 형태로 변환
2. BeautifulSoup
- navigating, searching, modifying DOM을 쉽게 분석할 수 있도록 도와줌
1) 주요 parser
- lxml은 빠르고 html.parser는 오류 문법에 강하다
- 오류: No\t Well-formed
BeautifulSoup(markup, "html.parser")
BeautifulSoup(markup, "lxml")
BeautifulSoup(markup, "lxml-xml")
BeautifulSoup(markup, "xml")
BeautifulSoup(markup, "html5lib")
'데이터 분석가 역량' 카테고리의 다른 글
day 6 ] parsing 익히기 (0) | 2019.05.08 |
---|---|
day 4] BeautifulSoup (0) | 2019.05.03 |
day 3 ] Requests (0) | 2019.05.02 |
Day 2] Reqeusts (0) | 2019.04.30 |
Day 2] Crawling (0) | 2019.04.30 |