Python层次聚类,层次聚类有两种类型

  Python层次聚类,层次聚类有两种类型

  你的下一步应该是收集整理过的文本,每个整理过的句子都是一个数据点。

  您可以在任何数据挖掘python库中使用k-means来获得聚类。在

  ======聚类====

  现在,如何确定K-means中的K(即聚类数):1)通过绘制K-means的目标曲线,然后选择膝盖对应的K,或者2)使用贝叶斯信息准则,或者3)通过其他一些适合特定数据集的流行方法。如果你现在还不知道,我在用k-means聚类的时候是怎么确定k的?

  因为这是一个作业,所以我想说的是,学习经验更重要,所以你要多尝试上面的一个,才能有“感觉”。在

  在此过程结束时,您将拥有K个集群。在

  现在是分类部分。在

  ======分类====

  将每个k簇视为一个类。

  有许多方法可以将每个数据点(即,清除的句子)分成K个类别:

  1不管每个数据点在k的末尾被分配到哪个簇,都意味着你可以把这个数据点当作拥有这个类。

  2将每个聚类的质心作为每一类的代表点,利用余弦、kl散度等相似性度量来寻找给定数据点与K个代表类点之间的相似性。并将该类的数据点分配给该类。在

  上面的(1)是最简单的。在

  =========================================

  还有各种其他聚类方法(球形k均值、聚集等。)那也会改变你的分类步骤。在

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: