워드클라우드 만들기 - 파이썬 데이터분석 첫걸음 - 3주차

·2021년 11월 18일
0

주피터노트북에 wordcloud 라이브러리를 설치

숙제1 - 최애곡 가사 대신 카카오톡 단체 대화방의 대화내보내기를 통해 해당 대화방에서 가장 많이 쓴 단어에 대해 진행.

특수기호는 굳이 제거하지 않고, ㅋㅋㅋ 이 가장 많이 나와서 'ㅋ'을 제거함으로써 ㅋㅋㅋ을 제외한 다른 단어들 위주로 나오게 하였음.

import pandas as pd
import matplotlib.pyplot as plt
from wordcloud import WordCloud
import re

text = open('./KakaoTalk.csv')
text = text.read()

text = text.replace('ㅋ', " ")
font_path = '/System/Library/Fonts/Supplemental/AppleGothic.ttf'

wc = WordCloud(font_path=font_path, background_color="white")
wc.generate(text)

plt.figure(figsize=(10,10))
plt.axis("off")
plt.imshow(wc)
plt.show()
### 숙제1 끝
profile
백엔드 개발자. 공동의 목표를 함께 이해한 상태에서 솔직하게 소통하며 일하는 게 가장 즐겁고 효율적이라고 믿는 사람.

0개의 댓글