pandas随机采样,pandas随机抽取数据

  pandas随机采样,pandas随机抽取数据

  随机抽样是统计学中常用的方法。本文主要介绍Pandassample随机抽样的实现,通过实例代码详细介绍,具有一定的参考价值。感兴趣的朋友可以参考一下。

  随机抽样是统计学中常用的方法,可以帮助我们从大量的数据中快速构建一套数据分析模型。在Pandas中,如果想要随机采样一个数据集,需要使用sample()函数。

  sample()函数的语法格式如下:

  data frame . sample(n=无,frac=无,replace=假,weights=无,random _ state=无,axis=无)

  参数如下表所示:

  Name参数description n表示要提取的行数。Frac表示提取的比例,例如frac=0.5,表示提取的总数据的50%。替换布尔参数,指示是否选择替换样本。默认值为False,数据取出后不会被替换。Weights可选参数,代表每个样品的重量值。参数值是字符串或数组。Random_state可选参数,控制随机状态。默认值为None,表示随机数据不会重复;如果为1,将获得重复数据。轴表示提取数据的方向(轴=1表示列/轴=0表示行)。该函数返回一个与dataset相同类型的新对象,相当于numpy.random.choice()。例子如下:进口熊猫作为pd

  dict={name:[Jack , Tom , Helen , John], age: [28,39,34,36], score:[98,92,91,89]}

  info=pd。数据帧

  #默认情况下,随机选择两条线

  信息样本(n=2)

  #随机选择两列

  info.sample(n=2,轴=1)

  输出结果:

  姓名年龄分数

  约翰三书36章89节

  0插孔28 98

  乐谱名称

  0 98插孔

  1 92汤姆

  2 91海伦

  3 89约翰

  让我们看另一组例子:

  进口熊猫作为pd

  info=pd。DataFrame({data1: [2,6,8,0], data2: [2,5,0,8], data3: [12,2,1,8]},index=[John , Parker , Smith , William])

  信息

  #随机抽取3个数据

  信息[数据1]。样本(n=3)

  #总数的50%

  info.sample(frac=0.5,replace=True)

  #data3序列是一个权重值,允许有重复数据。

  info.sample(n=2,权重=data3 ,random_state=1)

  输出结果:

  随机选择3行数据:

  威廉0

  史密斯8

  帕克6号

  名称:数据1,数据类型: int64

  数据1数据2数据3

  约翰福音2 2 12

  威廉0 8 8

  数据1数据2数据3

  约翰福音2 2 12

  威廉0 8 8

  这就是本文关于PandaSample随机抽样的实现。更多相关PandaSample随机抽样内容,请搜索热门IT软件开发工作室往期文章或继续浏览下方相关文章。希望大家以后多多支持热门IT软件开发工作室!

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: