pandas随机采样,pandas随机抽取数据
随机抽样是统计学中常用的方法。本文主要介绍Pandassample随机抽样的实现,通过实例代码详细介绍,具有一定的参考价值。感兴趣的朋友可以参考一下。
随机抽样是统计学中常用的方法,可以帮助我们从大量的数据中快速构建一套数据分析模型。在Pandas中,如果想要随机采样一个数据集,需要使用sample()函数。
sample()函数的语法格式如下:
data frame . sample(n=无,frac=无,replace=假,weights=无,random _ state=无,axis=无)
参数如下表所示:
Name参数description n表示要提取的行数。Frac表示提取的比例,例如frac=0.5,表示提取的总数据的50%。替换布尔参数,指示是否选择替换样本。默认值为False,数据取出后不会被替换。Weights可选参数,代表每个样品的重量值。参数值是字符串或数组。Random_state可选参数,控制随机状态。默认值为None,表示随机数据不会重复;如果为1,将获得重复数据。轴表示提取数据的方向(轴=1表示列/轴=0表示行)。该函数返回一个与dataset相同类型的新对象,相当于numpy.random.choice()。例子如下:进口熊猫作为pd
dict={name:[Jack , Tom , Helen , John], age: [28,39,34,36], score:[98,92,91,89]}
info=pd。数据帧
#默认情况下,随机选择两条线
信息样本(n=2)
#随机选择两列
info.sample(n=2,轴=1)
输出结果:
姓名年龄分数
约翰三书36章89节
0插孔28 98
乐谱名称
0 98插孔
1 92汤姆
2 91海伦
3 89约翰
让我们看另一组例子:
进口熊猫作为pd
info=pd。DataFrame({data1: [2,6,8,0], data2: [2,5,0,8], data3: [12,2,1,8]},index=[John , Parker , Smith , William])
信息
#随机抽取3个数据
信息[数据1]。样本(n=3)
#总数的50%
info.sample(frac=0.5,replace=True)
#data3序列是一个权重值,允许有重复数据。
info.sample(n=2,权重=data3 ,random_state=1)
输出结果:
随机选择3行数据:
威廉0
史密斯8
帕克6号
名称:数据1,数据类型: int64
数据1数据2数据3
约翰福音2 2 12
威廉0 8 8
数据1数据2数据3
约翰福音2 2 12
威廉0 8 8
这就是本文关于PandaSample随机抽样的实现。更多相关PandaSample随机抽样内容,请搜索热门IT软件开发工作室往期文章或继续浏览下方相关文章。希望大家以后多多支持热门IT软件开发工作室!
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。