python统计单词出现次数最多的5个单词,python统计单词出现次数字典
python统计单词出现次数
要做词频统计,字典无疑是最合适的数据类型。单词作为字典的键,单词出现的次数作为字典的值。记录每个单词的出现频率很方便。字典和我们的电话簿很像,每个名字都和一个电话号码相关联。
下面是具体的实现代码,实现了从importthis.txt文件中读取单词,统计了出现频率最高的五个单词。
# -*-编码:utf-8 -*-
导入io
进口re
类别计数器:
def __init__(self,path):
:参数路径:文件路径
self.mapping=dict()
用io.open(路径,编码=utf-8 )作为f:
data=f.read()
words=[s . lower()for s in re . find all( w ,data)]
对于word中的words:
self . mapping[word]=self . mapping . get(word,0) 1
def most_common(self,n):
断言n 0, n应该大于0
返回排序后的(self.mapping.items(),key=lambda item: item[1],reverse=True)[:n]
if __name__==__main__:
most _ common _ 5=Counter( import this . txt )。最常见的(5)
对于most_common_5:中的项目
打印(项目)的执行效果:
(是,10)
(“更好”,8)
(“比”,8)
(《the》,第6页)
( to ,5)更多python教程,建议学习:python视频教程。以上是Python对出现字数的统计细节。更多请关注盛行IT软件开发工作室的其他相关文章!
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。