jieba是python中一个重要的标准函数库,Python中jieba库

  jieba是python中一个重要的标准函数库,Python中jieba库

  内容1。概述2。洁霸库3的使用。例子

  一.概述

  1.jieba库概述

  解霸库是一个重要的第三方中文分词函数库,不包含在安装包中,需要通过pip指令安装。

  Pip3安装洁霸II。街霸图书馆使用1.库函数

  Jieba.cut(s)——精确模式,返回迭代数据类型。

  Jieba.cut(s,cut_all=True)——全模式,输出文本s中可能的单词。

  Jieba.cut_for_search(s)——搜索引擎模式,适用于搜索引擎索引的分词结果。

  Jieba.lcut (s,cut _ all=true) ——完整模式,返回列表类型

  Jieba.lcut_for_search(s)——搜索引擎模式,返回列表类型

  Jieba.add_word(w)——向分词词典中添加一个新单词W

  2.使用

  导入jiebalist(jieba.cut(中华人民共和国(PRC)是一个伟大的国家))转换为列表类型#结果为[中华人民共和国(PRC),是,一,伟大,国家]导入jiebalist(jieba.cut(中华人民共和国(PRC)是一个伟大的国家),,,,,,,,

  三。示例导入jiebatxt=open(E:\\从百草园到三潭印月. txt , r ,编码=utf-8 )。read()words=jieba . lcut(txt)counts={ } for word in words:counts[word]=counts . get(word,0)1 items=list(counts . items())items . sort(key=lambda x:x[1],reverse=True)for I in range(20):word,count=items[I]print( { 0:10 } { 1:6 } 。格式(word,co

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: