1. DOM
- HTML => HTML PARSER => DOM 트리 형태로 변환


2. BeautifulSoup
- navigating, searching, modifying DOM을 쉽게 분석할 수 있도록 도와줌
1) 주요 parser
- lxml은 빠르고 html.parser는 오류 문법에 강하다
- 오류: No\t Well-formed
BeautifulSoup(markup, "html.parser")
BeautifulSoup(markup, "lxml")
BeautifulSoup(markup, "lxml-xml")
BeautifulSoup(markup, "xml")
BeautifulSoup(markup, "html5lib")

'데이터 분석가 역량' 카테고리의 다른 글

day 6 ] parsing 익히기  (0) 2019.05.08
day 4] BeautifulSoup  (0) 2019.05.03
day 3 ] Requests  (0) 2019.05.02
Day 2] Reqeusts  (0) 2019.04.30
Day 2] Crawling  (0) 2019.04.30

+ Recent posts