自然语言处理是什么技术的一种应用,什么是自然语言处理的重要应用,也可以说

  自然语言处理是什么技术的一种应用,什么是自然语言处理的重要应用,也可以说

  1.软件基础:

  python 3.7

  熊猫库

  excel(选用)

  2.思路分析:

  读文本拆分文本单词计数归纳整合最终效果展示

  3.代码:

  #编码=utf-8 #由李夏薇1996 @展望。com导入熊猫def读取上下文(输入路径):f=open(输入路径, r) #按行读取存入列表,列表中子元素为一行文字text=f . readlines()return text def split words(text):re=[]#将列表中的每行文字按空格拆分,去掉换行,大写转成小写对于文本中的I:re。扩展(str(I)).长条(。\n ).降低()。split())return redef create _ and _ calucatedict(re):#因为是单词计数,字典比较适合worddict={} for i in re: #每读入单词判断在字典键中是否存在,不存在创建该单词钥匙,vulue默认=1如果我不在单词词典中:worddict[i]=1 #读入单词在字典键存在,值1 else:word dict[I]=1返回word dict def output _ txt(输出路径,worddict): #将结果输出到txt f=open(outputpath, w ,encoding= utf-8 )string=str(word dict).lstrip({ ).rst rip(“}”).替换(,, \n ).替换(, )。replace(, )f . write(string)f . closed def output _ html(word dict):#将结果利用熊猫输出到html df=熊猫DataFrame(worddict,index=[0]) df_T=df .T#因为结果横向显示太长,转为转置矩阵#我试了一下好像超文本标记语言不能转,只有超过能转,尴尬.df。to _ html(字数。html )def output _ excel(word dict):#将结果利用熊猫输出到excel df=熊猫DataFrame(worddict,index=True) df_T=df .T#因为结果横向显示太长,转为转置矩阵,df _ t . to _ excel(字数。xlsx )def main():text=read context( article。txt )re=拆分单词(text)word dict=create _ and _ calucatedict(re)output _ excel(word dict)if _ _ name _ _= _ _ main _ _ :main()4 .结果展示:

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: