10000 GitHub - hanbit/blueprints-text: 『파이썬 라이브러리를 활용한 텍스트 분석』(한빛미디어, 2022)의 예제 코드 저장소입니다.
[go: up one dir, main page]

Skip to content

hanbit/blueprints-text

Repository files navigation

파이썬 라이브러리를 활용한 텍스트 분석

텍스트에서 통찰을 이끌어내는 98가지 자연어 처리 전략

표지

오류 신고

코드에서 오류를 발견한다면 저자들의 깃허브에서 이슈를 남겨주세요.

스페이시 3.0과 젠심 4.0 이 도서의 코드는 스페이시(spaCy) 2.3.2과 젠심(gensim) 3.8.3을 기준으로 작성되어 있습니다. 하지만 현재 스페이시는 3.0이 릴리즈 되었으며 이에 따라 API도 변화되었습니다. 저자들 또한 실습 코드를 스페이시 3.0에 맞춰 업데이트 했습니다. 하지만 textacy는 스페이시 3.0을 지원하지 않으므로 저자들이 수정을 가한 파일을 제공하고 있습니다.

노트북 실행법

각 노트북은 세 가지 링크를 제공합니다.

  • "git" 링크는 깃허브에서 노트북을 확인합니다.
  • "nbviewer" 링크는 nbviewer.ipython.org에서 노트북을 확인합니다.
  • "colab" 링크는 구글 콜랩에서 노트북을 확인합니다(저자들은 콜랩 사용을 권장합니다).

노트북을 콜랩이나 로컬 환경에서 실행할 경우, Shift + Enter 키를 눌러 셀을 실행할 수 있습니다. 첫 셀부터 차례로 모든 셀을 실행하세요.

로컬 환경 설정법

git clone 명령어를 사용해 저장소를 내려받습니다.

git clone https://github.com/blueprints-for-text-analytics-python/blueprints-text.git
cd blueprints-text

로컬 환경을 구성하기 위해 Miniconda를 추천합니다. Miniconda 공식 홈페이지에서 제공하는 설치 방법을 따라 Miniconda를 설치합니다.

Miniconda의 설치를 마쳤다면 프로젝트 디렉터리에서 아래 명령어를 실행합니다.

conda env create --name blueprints --file blueprints.yml
conda activate blueprints

환경이 실행되면 프롬프트에 blueprints 라는 문구가 출력됩니다. 환경 설정 파일에 추가되어있는 주피터 노트북용 확장기능들을 활성화합니다.

jupyter nbextension enable toc2/main
jupyter nbextension enable execute_time/ExecuteTime
jupyter nbextension enable varInspector/main

이제 주피터 노트북 서버를 실행합니다.

jupyter notebook

만약 WSL 환경이라면 --no-browser 옵션을 추가하세요.

이제 각 장마다 있는 .ipynb를 열어 노트북을 확인합니다.

About

『파이썬 라이브러리를 활용한 텍스트 분석』(한빛미디어, 2022)의 예제 코드 저장소입니다.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 6

0