轮廓系数怎么算,Python求特征值
如果你想要最好的位置,你应该选择最高的位置。
1.通过设置不同的K值来测试计算轮廓系数,可以得到最佳K值对应的最佳轮廓系数。
2.也可以画,观察,选最高的。但为了防止拟合现象,也可以通过弯头选择最佳k值。
实例
fromsk learn . clusterimportkmeans
Fromsklearn。预处理ImportMaxAbsscaler #十进制缩放标准化
Fromsklearn。预处理Importminmaxscaler #偏差标准化
Fromsklearn。预处理ImportStandardScaler #标准偏差标准化
#评价指标-剖面系数
fromsk learn . metricsimportsilhouetee _ score
#因为是聚类算法,所以数据可能有维度,需要标准化。在使用该算法之前
#实例化
sca=MaxAbsScaler()
sca=MinMaxScaler()
sca=标准定标器()
#配件
Sca.fit(训练集功能)
#处理数据
X_train=sca.transform(训练集功能)
#实例化
km=均值()
#参数:
#n_clusters=3,表示k=3,即三个随机的聚类中心,最小值为2。
#init,聚类中心初始化方法,默认k均值
#max_iter,迭代次数,默认为300。如果后期不能收敛,可以尝试增加迭代次数。
#random_state=1,随机种子,默认值为无
#配件
Km.fit(训练集功能)
#查看聚类中心
打印(聚类中心:,km.cluster_centers_)
#查看预测结果
#您可以直接传入训练集或自定义二维数组。
Y_pred=km.predict(训练集功能)
Print(整个数据的类别:,y_pred)
#检查SSE -误差平方和
#默认为逆运算,多数情况下得到负值[-inf,0]。
#绝对值越小越好
score=km.score(X_train,y_pred)
打印(“SSE”,分数)
#评价指标-剖面系数(-1,1),越大越好。
Print(轮廓系数:,silhouete e _ score (x _ train,y _ pred))。以上就是python如何获取最优轮廓系数的方法。希望对你有帮助。更多python学习方向:Python基础课程
本教程运行环境:windows7系统,Python 3.9.1,DELL G3电脑。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。