자연어 처리 ( text에 있는 word에 대한 빈도수 도출하기 )

인공지능/RNN

자연어 처리 ( text에 있는 word에 대한 빈도수 도출하기 )

쿠와와 2020. 11. 24. 16:22

import nltk
import collections
import matplotlib.pyplot as plt

# 세익스피어의 헴릿에 등장하는 주인공들의 출현 빈도로 막대 그래프를 그려보세요
# gutemberg
# 햄릿, 거트루드, 오필리어, 클로디어스, 레어티스, 호레이쇼

# print(nltk.corpus.gutenberg.fileids())

# 1. 햄릿 읽기
txt = nltk.corpus.gutenberg.raw('shakespeare-hamlet.txt') # text 전체

# 2. actors 찾기
names = ['hamlet', 'gertrude', 'claudius', 'laertes', 'ophelia', 'polonius', 'horatio']
txt = txt.lower()

docs = nltk.tokenize.regexp_tokenize(txt, r'\w+')
print(docs)
# 3. 빈도 계산
freq = collections.Counter(docs)

values = [freq[name] for name in names]
print(values)
# print(docs)

# 4. 빈도 그래프 작성
plt.bar(names, values)
plt.show()

'인공지능 > RNN' 카테고리의 다른 글

pop corn DBset으로 Baseline, rnn, cnn, cnn-tf, word2vec, nltk 구성하기 (0)	2020.12.15
자연어 처리 - 영화 리뷰 분석해서 그래프로 그려보기 (0)	2020.11.25
자연어 처리 (Gensim) (0)	2020.11.24
자연어처리( doc2vec ) (0)	2020.11.22
자연어 처리 (빈도수) 공부 (0)	2020.11.21

현재글자연어 처리 ( text에 있는 word에 대한 빈도수 도출하기 )

하루를 정리하기 위한 블로그 - 배운 것들을 정리하는 블로그로 수익은 없습니다.

1``,

Today :
Yesterday :

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

쿠와와의 하루정리

자연어 처리 ( text에 있는 word에 대한 빈도수 도출하기 )

'인공지능 > RNN' 카테고리의 다른 글

'인공지능/RNN'의 다른글

티스토리툴바

자연어 처리 ( text에 있는 word에 대한 빈도수 도출하기 )

'인공지능 > RNN' 카테고리의 다른 글

'인공지능/RNN'의 다른글

관련글

티스토리툴바