KoNLPy

KSS

PyKoSpacing

Py-Hanspell

Soynlp


전처리 과정

  1. 토큰화

  2. 품사 태깅

  3. 불용어 제거

    word =[]
    for tag in oktTag:
      if tag[1] not in stopPos:
        if tag[0] not in stopWord:
          word.append(tag[0])
    
    print(word)