python做pca分析,pca降维后生成新的特征

  python做pca分析,pca降维后生成新的特征

  转载:Python实现主成分分析(PCA)的降维:原理及实例分析

  引言降维是由一些问题引起的:

  可以缓解维度(高维)诅咒带来的问题;可用于压缩数据,最大限度地减少数据丢失;可以将高维数据降维为低维数据进行可视化。主成分分析是最重要的降维方法之一。一般来说,PCA是最容易想到的降维算法。我们来总结一下PCA的原理。PCA的Scikit-learn实现scikit-learn集成了PCA方法,调用起来更方便。应该注意的是,在scikit-learn中使用奇异值分解来计算特征向量和特征值。PCA的调用方法很简单,这里列出了所有的代码。

  import numpy as NP import matplotlib . py plot as PLT from sk learn . decomposition import PCA from sk learn . datasets . samples _ generator import make _ blobsX,y=make_blobs(n_samples=10000,n_features=3,centers=[[3,3,3],[0,0,0],[1,1,1],[2,2,2]],cluster_std=[0.2,0.1,0.2,0.2],Random_state=9)#Fit (x) #输出特征值print(pca.explained_variance_)输出特征向量print(pca.components_)#约简数据x _ new=PCA . transform(x)print(x _ new)fig=PLT . figure()PLT . scatter(x _ new [:0],x _ new[:1],marker= o) plt.show()。

  结果如下:

  #特征值[3.78521638 0.03272613]#特征向量[[0.57601622 0.57846191 0.57757002][-0.32920617-0.48256882 0.8163454]]#降维后的结果[[1[-2.590227-0.04141849][2.88.[2.52492314-0.0935418] [2.248478484

  pca=PCA(n_components=0.95)

  当n_components=0.95时,指定那些主分量相加至少为95%的分量。

  pca=PCA(n_components=mle )

  当n_components=MLE 表示让MLE算法自己选择降维的效果。

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: