python提取关键词分类,文本分析提取关键词
这篇文章主要介绍了使用计算机编程语言来分析评论并且提取其中的关键词,用于制作精美词云的方法,感兴趣的朋友来看看吧
目录
一、抓取全部评论1、找到评论接口2、Python获取评论二、文本分词、词云制作1、文本分析2、生成词云3、初步效果-模糊不清4、最终效果-高清无马
一、抓取全部评论
吾的这篇文章,有1022 次评论,一条条看,吾看不过来,于是想到计算机编程语言词云,提取关键词,倒也是一桩趣事。
评论情况:{android: 545次, ios: 110次, pc: 44次, uniapp: 1次}
一个小细节:给我评论的设备中,安卓苹果比是5:1。
从默认字典构建前缀字典.加载模型花费了0.361秒。前缀字典已成功构建。
1、找到评论接口
打开铬浏览器,开发者模式
点击评论列表(图标1)
点击接口链接(图标2)
查看反应返回值(评论结果的数据格式)
2、Python 获取评论
def get _ comments(articleId):
# 确定评论的页数
main _ RES=get _ comment id(articleId,1)
页数=JSON。loads(main _ RES)[ data ][ page count ]
comment_list,comment_list2=[],[]
source_analy={}
对于范围(1,页数1):中的英语字母表中第十六个字母
res=get_commentId(articleId,p)
尝试:
注释ids=JSON。负载(RES)[数据][列表]
因为我在评论:
评论id=I[信息][评论id ]
用户名=我[信息][用户名]
昵称=我[信息][昵称] ##获取用户名
source _ DVS=I[ info ][ commentFromTypeResult ][ key ]#操作设备
content=i[信息][内容]
comment_list.append([commentId,用户名,昵称,源dvs,内容])
comment_list2.append(%s丨% s“%(用户名,昵称))
如果source_dvs不在source_analy.keys():中
源分析[源dvs]=1
else:
源分析[源dvs]=源分析[源dvs] 1
#打印(来源_分析)
例外:
打印(本页失败!)
打印(评论数: str(len(comment_list)))
返回源_分析,注释_列表,注释_列表2
二、文本分词、词云制作
1、文本分析
西红柿采用的是结巴分词,和wordcloud。
# -*-编码:utf8 -*-
进口洁霸
导入关键字云
代码实现:
seg_list=jieba.cut(comments,cut_all=False) #精确模式
word=" .加入(seg_list)
2、生成词云
背景图西红柿采用的是心形图片
pic=mpimg。im read(/Users/pray/Downloads/艾欣。JPEG’)
完整代码:
def word_cloud(articleId):
source_analy,comment_list,comment _ list 2=get _ comments(articleId)
打印(评论情况:,源分析)
注释=
对于comment_list:中的一个
comment=one[4]
如果"面"不在注释:中
评论=评论评论
seg_list=jieba.cut(comments,cut_all=False) #精确模式
word=" .加入(seg_list)
pic=mpimg。im read(/Users/pray/Downloads/艾欣。JPEG’)
wc=wordcloud .WordCloud(mask=pic,font _ path=/Library/Fonts/songti。TTC,宽度=1000,高度=500,
背景色=白色).生成(word)
3、初步效果-模糊不清
西红柿发现文字模糊、图像曲线边缘不清晰的问题。
于是,指定分辨率,高清整起来。
# 保存
plt.savefig(xin300.png ,dpi=300) #指定分辨率保存
4、最终效果-高清无马
到此这篇关于计算机编程语言超简单分析评论提取关键词制作精美词云流程的文章就介绍到这了,更多相关计算机编程语言制作词云内容请搜索盛行信息技术软件开发工作室以前的文章或继续浏览下面的相关文章希望大家以后多多支持盛行信息技术软件开发工作室!
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。