1. Grammar Rules

- 여러가지 룰을 직접 만드는 것(패턴화)

- 정규 표현식을 이용하여 만든다

 

 

1) 구문 분석

from konlpy.tag import Okt
ma = Okt().pos

sentence = "내 친구가 잠을 많이 잔다."
tokens = ma(sentence)

 

2) grammar 출력

from nltk.chunk.regexp import RegexpParser

grammar = RegexpParser("""
    DT: {}
    JJ: {}
    NN: {}
    VBD: {}
    IN: {}
    DP: {*}
""")
parseTree = grammar.parse(token)
parseTree.draw()

#for _ in parseTree.subtrees():
#parseTree.pprint()

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

'데이터 분석가 역량' 카테고리의 다른 글

day 16 ] 전체 과정 정리(막 정리함...)  (0) 2019.05.22
day 15 ] 내 데이터로 출력해보기  (0) 2019.05.21
day 15 ] GitHub  (0) 2019.05.20
day 13 ] pos  (0) 2019.05.16
day 12 ] 불용어  (0) 2019.05.16

+ Recent posts