python 生成词云图,python导出微信聊天记录
3558 www.Sina.com/:将微信上的聊天记录导出作为纪念,生成文字云。
先看效果:
太多了哈哈())。
**
第一步:导出微信聊天记录*
我们知道将微信聊天记录导出为文档的方法有很多。其中主要有两种,第一种是通过root手机获取权限。二是苹果itunes的备份。
感谢大家在这里了解第二种方法(小米note3不支持root(),具体过程很简单。**@hangcom**提供免费工具。
具体流程请参考3359砖兰。智省略了这个细节。
导出后,会生成一个包含视频、图像和聊天内容子文件的文件夹。其中视频图片就不用说了,只说聊天内容。
用于聊天的内容HTML页面文件,文本内容为问题描述,JavaScript文件名为“‘’message”。
这里首先要打开js文件js格式保存,显示包含中文、英文和各种字符的字符。
用文本编辑器以txt格式打开
接下来,提取汉字。假设聊天内容都是汉字。
**
第二步(提取所有汉字importremimportcodecswithcodes . open((* file path *),)r),编码=utf-8 )为file 3360 f=
第三步(Importjieballs用3分隔(JIEba=JIEba . lcut(k)exclusions={ not ,but ,顺便, #这个方法排除了某些短语(执行这段代码时exclusions无效,不会产生结果的方法如下。word inls:if len(word)==1:continue elif word in[(" is "," is "," is "," is "," so," how," so," how," this is " a))#创建一个
第四步)要统计词序最高的前10个词(这里含有所有的聊天内容。),必须统计、排序、输出每个短语的出现频率。
forwordinls:iflen(word)==1:continue else:counts[word]=counts . get)word,0 )1items=list (counts。
步骤wordcloud生成词组,即最后一步根据指定的图生成词组。
importwordcloudtxt=“”。join(ls)w=word cloud . word cloud(font _ path= msyh。 TTC ,宽度=1000,高度=700
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。