금융거래의 적요 텍스트 분석을 위한 한국어 형태소 분석기 라이브러리 이며, KoNLPy의 customized version입니다. 본 코드는 lovit 님의 코드를 기반으로 작성하였으며 pypi에 배포되어 있습니다.
윈도우:
-
자바 설치 (JDK)
JDK에 접속해서 본인 OS에 맞는 자바를 설치합니다. -
jpype 설치
jpype로 접속해서 본인 OS와 사용하는 환경의 파이썬 버전과 맞는 jpype를 다운받고 pip 명령어로 설치합니다.
# ex-윈도우
pip install JPype1-1.4.0-cp38-cp38-win_amd64.whl- 환경변수 편집
-
'시스템 환경 변수 편집'에 들어가서 '시스템 변수' JAVA_HOME이라는 변수로 1.에서 설치한 자바 경로를 설정합니다. ex) C:\Program Files\Java\jdk-19
-
그 후 Path를 편집해서 %JAVA_HOME%\bin\server를 추가해줍니다. ※ 이전 버젼에서는 %JAVA_HOME%\bin 여기까지만 저장하라고 되어있을텐데 19버젼부터는 server란 경로가 추가되었고 이 안에 jvm.dll 파일이 들어있으니 주의해야 합니다.
- install 이제 해당 패키지를 설치해줍니다.
git clone https://github.com/whfh3900/ats_ckonlpy.git
cd ats_ckonlpy
python setup.py install- pip install 마지막으로 재부팅하여 아래 코드를 통해 정상적으로 실행되는지 확인합니다.
from ckonlpy.tag import Twitter
twitter = Twitter()konlpy에는 한국어를 위한 많은 분석기법을 제공하지만 여기에서는 품사 태깅 기능만을 보여줍니다.
from ckonlpy.tag import Twitter, Postprocessor
post = Postprocessor(Twitter())
post.pos("신한이경진") # [('신한', 'Nic'), ('이경진', 'Name')]'신한'은 금융용어 말뭉치에 의해 Nic이란 품사로 '이경진'은 사람이름이므로 Name이란 품사로 태깅되는 것을 볼 수 있습니다.
더 많은 예제와 사용법은 customized KoNLPy 를 참고하세요.
최승언 – @velog – [email protected]
라이센스: GNU General Public License v3.0