Python中jieba库,python中jieba库的使用
1.街霸图书馆基本介绍(一)街霸图书馆概述
Jieba是一个优秀的中文分词第三方库。
-中文文本需要通过分词得到单个单词。
-jieba是一个优秀的中文分词第三方库,需要额外安装。
-杰霸库提供三种分词模式,最简单的是只掌握一种功能。
(2)街霸分词原则
街霸分词依赖于汉语词库。
-使用中文词库确定汉字之间的关联概率。
-汉字大概率组成短语形成分词结果。
-除了分词,用户还可以添加自定义短语。
2.洁霸库使用说明(1)。街霸分词的三种模式。
精确模式、完整模式和搜索引擎模式。
-精准模式:精准切文,无多余文字。
-全模式:扫描出文本中所有可能有冗余的单词。
-搜索引擎模式:在精确模式的基础上,对长词进行再次切分。
(2)街霸图书馆的常用功能
函数 描述jieba.lcut (s)精确模式,返回列表类型的分词结果。
Jieba.lcut(中国是一个伟大的国家)
[中国,是,一,伟大,国家]jieba.lcut(s,
Cut_all=True)全模式,返回列表类型的分词结果。存在冗余。
Jieba.lcut(中国是一个伟大的国家,cut_all=True)
[中国,中国是,一,伟大,国家]函数 描述jieba . lcut _ for _ seal
Ch(s)搜索引擎模式返回列表类型的分词结果,具有冗余性。
Jieba.lcut_for_search("中华人民共和国(PRC)是伟大的")
[中国,中国人,人民,共和国,共和国,中华人民共和国
和,是,很好,的]jieba.add_word(w)在分词词典中添加一个新词W。
Jieba.add_word (Python语言)(3),Jieba分词要点
jieba.lcut(s)
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。