pandas随机采样,pandas随机抽取数据

　　随机抽样是统计学中常用的方法。本文主要介绍Pandassample随机抽样的实现，通过实例代码详细介绍，具有一定的参考价值。感兴趣的朋友可以参考一下。

　　随机抽样是统计学中常用的方法，可以帮助我们从大量的数据中快速构建一套数据分析模型。在Pandas中，如果想要随机采样一个数据集，需要使用sample()函数。

　　sample()函数的语法格式如下：

　　data frame . sample(n=无，frac=无，replace=假，weights=无，random _ state=无，axis=无)

　　参数如下表所示：

　　Name参数description n表示要提取的行数。Frac表示提取的比例，例如frac=0.5，表示提取的总数据的50%。替换布尔参数，指示是否选择替换样本。默认值为False，数据取出后不会被替换。Weights可选参数，代表每个样品的重量值。参数值是字符串或数组。Random_state可选参数，控制随机状态。默认值为None，表示随机数据不会重复；如果为1，将获得重复数据。轴表示提取数据的方向(轴=1表示列/轴=0表示行)。该函数返回一个与dataset相同类型的新对象，相当于numpy.random.choice()。例子如下：进口熊猫作为pd

　　dict={name:[Jack ， Tom ， Helen ， John]， age: [28，39，34，36]， score:[98，92，91，89]}

　　info=pd。数据帧

　　#默认情况下，随机选择两条线

　　信息样本(n=2)

　　#随机选择两列

　　info.sample(n=2，轴=1)

　　输出结果：

　　姓名年龄分数

　　约翰三书36章89节

　　0插孔28 98

　　乐谱名称

　　0 98插孔

　　1 92汤姆

　　2 91海伦

　　3 89约翰

　　让我们看另一组例子：

　　进口熊猫作为pd

　　info=pd。DataFrame({data1: [2，6，8，0]， data2: [2，5，0，8]， data3: [12，2，1，8]}，index=[John ， Parker ， Smith ， William])

　　信息

　　#随机抽取3个数据

　　信息[数据1]。样本(n=3)

　　#总数的50%

　　info.sample(frac=0.5，replace=True)

　　#data3序列是一个权重值，允许有重复数据。

　　info.sample(n=2，权重=data3 ，random_state=1)

　　输出结果：

　　随机选择3行数据：

　　威廉0

　　史密斯8

　　帕克6号

　　名称：数据1，数据类型： int64

　　数据1数据2数据3

　　约翰福音2 2 12

　　威廉0 8 8

　　数据1数据2数据3

　　约翰福音2 2 12

　　威廉0 8 8

　　这就是本文关于PandaSample随机抽样的实现。更多相关PandaSample随机抽样内容，请搜索热门IT软件开发工作室往期文章或继续浏览下方相关文章。希望大家以后多多支持热门IT软件开发工作室！

郑重声明：本文由网友发布，不代表盛行IT的观点，版权归原作者所有，仅为传播更多信息之目的，如有侵权请联系，我们将第一时间修改或删除，多谢。

相关文章阅读