# konlpy

28개의 포스트

[docker][Dockerfile] anaconda 이미지로 텍스트 마이닝 개발환경 만들기

Dockerfile은 아래와 같다. 용량은 약 5GB 정도COPY 부분은 데이터와 코드를 바로 옮겨서 실행시킬 수 있도록 짜둔것이다. 삭제해도 무방.완료되면 build 명령어로 이미지를 만들자.마지막으로 run 명령어로 컨테이너를 실행시키면 끝.

2023년 2월 28일
·
0개의 댓글
·

[nlp] konlpy 설치방법 필독!!!

진짜 오랜시간 동안 konlpy 설치안되서 애먹었었는데 진짜 확실하게 알았다. 까먹지 않게 적어두자.https://www.oracle.com/java/technologies/downloads/ 로 들어가서 자바를 설치한다. exe, msi 중 아무거나 선택해서

2023년 1월 19일
·
0개의 댓글
·
post-thumbnail

[nlp] konlpy mecab 사용법

지금까지 konlpy 형태소 분석기 중 mecab만 사용할 수 없었는데 방법을 알아냈다.pip install mecab 명령어로 mecab을 설치하면 C://에 mecab이라는 폴더가 생성될 것이다.python에서 Mecab을 호출할 때 경로를 다음과 같이 설정해주자.

2023년 1월 8일
·
0개의 댓글
·
post-thumbnail

M1 Part11 - '복불복설치' konlpy.tag MECAB on M1

M1을 사용하다보면, 마주하는 난관들이 있다. 그 중 하나가 MECAB이 아닐까 싶다. 사실은 KONLPY의 다른 형태소분석기 친구들을 사용하려면, JAVA SDK(?)가 필요한 것으로 알고 있다. 그래서 zulu 혹은 ORACLE JAVA가 설치가 필요하다고 알고

2023년 1월 2일
·
1개의 댓글
·
post-thumbnail

윈도우에 Mecab 설치(Python)

윈도우에 Mecab 설치 및 기본 사용법

2022년 12월 21일
·
0개의 댓글
·
post-thumbnail

한국어 형태소분석

한국어 텍스트 분석을 위해서는 문장을 형태소 단위로 나누어 분석을 해줘야 한다. (띄어쓰기, 조사, 품사 등을 구분..) 이를 위한 라이브러리는 크게 4가지가 있다.konlpy : hannanum, kkma, okt, komoran 등 java 기반komoran은 상대

2022년 12월 15일
·
0개의 댓글
·
post-thumbnail

NLP - klue 뉴스 토픽 분류 (KoNLPy)

데이콘 대회https://dacon.io/competitions/official/235747/overview/descriptiontqdm 으로 전처리 진행 상태 표시HannanumKkmaKomoranMecabOkt📌 형태소(morpheme) : 뜻을 가진 가

2022년 12월 14일
·
0개의 댓글
·
post-thumbnail

[Konlpy / TF-IDF] 한글 문장 유사도 측정

한글 문장 사이의 유사도는 어떻게 계산할까? 비슷한 문장은 어떻게 찾지?? 인공지능 없이도 아주 간단하게 만들 수 있습니다😎

2022년 11월 21일
·
3개의 댓글
·
post-thumbnail

pytorch study 2일차

자연어 처리

2022년 10월 20일
·
0개의 댓글
·

[linux] 리눅스 jdk 설치

아마 리눅스에서 konlpy를 처음 설치하고 import하면 다음과 같은 에러가 뜰것이다. 이건 간단하게 jdk만 설치해주면 된다.

2022년 10월 5일
·
0개의 댓글
·
post-thumbnail

윈도우 konlpy 설치

JAVA 설치 https://www.oracle.com/java/technologies/downloads/ 에서 본인 컴퓨터 환경에 맞는 자바 설치 환경 변수 설정 고급 -> 시스템변수 -> 새로만들기 -> JAVA_HOME: 자바 설치 경로 -> 확인 path에 자

2022년 8월 1일
·
0개의 댓글
·
post-thumbnail

[Jupyter Notebook] 빅데이터 분석 - 웹 크롤링과 워드 클라우드 만들기

[Jupyter Notebook] 웹 크롤링에서 키워드 입력받기 / 코엔엘파이(konlpy)와 파이태그클라우드(pytagcloud) 라이브러리를 활용한 워드 클라우드 시각화

2022년 7월 13일
·
0개의 댓글
·
post-thumbnail

데이터분석종합반 3일차

데이터분석종합반 3일차 스파르타코딩클럽 데이터분석종합반 학습일자: 2022/06/04 강의: 데이터분석종합반 진도: 2-1 ~ 2-5

2022년 6월 4일
·
0개의 댓글
·
post-thumbnail

Sagemaker에서 Mecab을 설치해보자

Sagemaker Terminal에서 진행해야함.

2022년 5월 10일
·
0개의 댓글
·
post-thumbnail

파이썬 _ KoNLPy (한국어 NLP)

제가 챗봇을 개발할 때 아주 유용했던 패키지입니다. 보통 요즘 챗봇은 RNN 구조나 트랜스포머까지 주로 AI로 구현하는 것 같더군요. 거기서도 주로 토크나이징 과정에서 정규화 기능으로 사용할 수 있을까요? (리턴 문자열을 다시 자연스럽게 변형해줘야 할 것 같은...)

2022년 5월 3일
·
0개의 댓글
·

구민제안 데이터 시각화 (워드클라우드)

1. 강서구 구민제안 데이터 시각화 2. 워드클라우드 코드 0 화곡동 1041-4호 막다른골목~일방로, 동양하우징 건물 우측 전봇대에 후사 보조경... 1 곰달래로35길 보행로 설치

2022년 3월 16일
·
0개의 댓글
·

[macOS] mecab 설치(for konlpy 0.6.0 & kss 3.3.1.1) (22.01.17 기준)

해결법은 두 가지.1.Konlpy 공식홈가이드2.mecab-ko 설치 - mecab-dic 설치 - mecab-python 설치(아래 링크1 or 링크2 참고)링크1https://lovablebaby1015.wordpress.com/2018/09/24/meca

2022년 1월 16일
·
1개의 댓글
·
post-thumbnail

[졸프] KoNLPy 사용하기

KoNLPy 사용 튜토리얼

2021년 11월 25일
·
1개의 댓글
·
post-thumbnail

[mecab] 윈도우에서 사용자 사전 추가

C:\\mecab\\user-dic에 들어가면 기존에 정의된 사전 csv 파일이 있다. 그러나 이 csv들은 excel로 열면 인코딩이 깨져 보인다. mac os나 linux 기반 os에서는 vi 편집기 같은걸로 열어도 무방하나,window에서는 개인이 활용하는 편집기

2021년 11월 2일
·
0개의 댓글
·
post-thumbnail

Personal Project-논문제목 분석을 통한 선행연구 분석:Keyword를 중심으로💻

주제선정 이유📃 필자는 2018년 12월부터 두 달간 국토연구원에서 연구인턴 생활을 한 적이 있다. 비록 짧은 기간이지만 정말 많은 것을 배울 수 있었던 기간이었으며, 이러한 주제를 생각할 수 있도록 도움을 주신 권영섭 선임연구원님께 이 글을 통해 감사의 말씀을 드린

2021년 8월 17일
·
0개의 댓글
·