Python中jieba库,python中jieba库的使用

  Python中jieba库,python中jieba库的使用

  1.街霸图书馆基本介绍(一)街霸图书馆概述

  Jieba是一个优秀的中文分词第三方库。

  -中文文本需要通过分词得到单个单词。

  -jieba是一个优秀的中文分词第三方库,需要额外安装。

  -杰霸库提供三种分词模式,最简单的是只掌握一种功能。

  (2)街霸分词原则

  街霸分词依赖于汉语词库。

  -使用中文词库确定汉字之间的关联概率。

  -汉字大概率组成短语形成分词结果。

  -除了分词,用户还可以添加自定义短语。

  2.洁霸库使用说明(1)。街霸分词的三种模式。

  精确模式、完整模式和搜索引擎模式。

  -精准模式:精准切文,无多余文字。

  -全模式:扫描出文本中所有可能有冗余的单词。

  -搜索引擎模式:在精确模式的基础上,对长词进行再次切分。

  (2)街霸图书馆的常用功能

  函数 描述jieba.lcut (s)精确模式,返回列表类型的分词结果。

  Jieba.lcut(中国是一个伟大的国家)

  [中国,是,一,伟大,国家]jieba.lcut(s,

  Cut_all=True)全模式,返回列表类型的分词结果。存在冗余。

  Jieba.lcut(中国是一个伟大的国家,cut_all=True)

  [中国,中国是,一,伟大,国家]函数 描述jieba . lcut _ for _ seal

  Ch(s)搜索引擎模式返回列表类型的分词结果,具有冗余性。

  Jieba.lcut_for_search("中华人民共和国(PRC)是伟大的")

  [中国,中国人,人民,共和国,共和国,中华人民共和国

  和,是,很好,的]jieba.add_word(w)在分词词典中添加一个新词W。

  Jieba.add_word (Python语言)(3),Jieba分词要点

  jieba.lcut(s)

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: