Python中jieba库,python中jieba库的使用

　　1.街霸图书馆基本介绍(一)街霸图书馆概述

　　Jieba是一个优秀的中文分词第三方库。

　　-中文文本需要通过分词得到单个单词。

　　-jieba是一个优秀的中文分词第三方库，需要额外安装。

　　-杰霸库提供三种分词模式，最简单的是只掌握一种功能。

　　(2)街霸分词原则

　　街霸分词依赖于汉语词库。

　　-使用中文词库确定汉字之间的关联概率。

　　-汉字大概率组成短语形成分词结果。

　　-除了分词，用户还可以添加自定义短语。

　　2.洁霸库使用说明(1)。街霸分词的三种模式。

　　精确模式、完整模式和搜索引擎模式。

　　-精准模式：精准切文，无多余文字。

　　-全模式：扫描出文本中所有可能有冗余的单词。

　　-搜索引擎模式：在精确模式的基础上，对长词进行再次切分。

　　(2)街霸图书馆的常用功能

　　函数描述jieba.lcut (s)精确模式，返回列表类型的分词结果。

　　Jieba.lcut(中国是一个伟大的国家)

　　[中国，是，一，伟大，国家]jieba.lcut(s，

　　Cut_all=True)全模式，返回列表类型的分词结果。存在冗余。

　　Jieba.lcut(中国是一个伟大的国家，cut_all=True)

　　[中国，中国是，一，伟大，国家]函数描述jieba . lcut _ for _ seal

　　Ch(s)搜索引擎模式返回列表类型的分词结果，具有冗余性。

　　Jieba.lcut_for_search("中华人民共和国(PRC)是伟大的")

　　[中国，中国人，人民，共和国，共和国，中华人民共和国

　　和，是，很好，的]jieba.add_word(w)在分词词典中添加一个新词W。

　　Jieba.add_word (Python语言)(3)，Jieba分词要点

　　jieba.lcut(s)

郑重声明：本文由网友发布，不代表盛行IT的观点，版权归原作者所有，仅为传播更多信息之目的，如有侵权请联系，我们将第一时间修改或删除，多谢。