dataframe 数据分析,dataframe的特点

  dataframe 数据分析,dataframe的特点

  keras数据集有七种:(可以从官方的keras文档中读取。https://keras.io/datasets/).他们中的一些人被研究和实践,并写了笔记。

  为多个数据集添加下载位置。

  狗狗图片:https://S3-us-west-1.amazonaws.com/uda市-aind/dog-project/dog images . zip

  cifa r10:https://www . cs . Toronto . edu/~ kriz/cifar-10-python . tar . gz

  1.CIFAR10小图

  训练集:分为50000张大小为32 * 32的彩色图像,10种。

  测试集:10,000幅彩色图像,尺寸为32*32

  from keras . datasetsimportcifar 10(x _ train,y_train),)x_test,y _ test)=cifar 10 . load _ data)3http://www

  我的博客“x_train, x_test”对CIFAR10数据集进行了分类。

  2.CIFAR100小图

  训练集:分为50000幅大小为32 * 32100的彩色图像。

  测试集:10,000幅彩色图像,尺寸为32*32

  来自keras . datasetsimportcifar 100(x _ train,y_train),)x_test,y_test(=CIFAR100.load_data)标签

  3.IMDB影评人的情感分类

  训练集:25000条评论,正面评价1,负面评价0。

  测试集:25,000条评论

  每条评论都不是特定的单词结构,而是所有的单词都被转换成了数字。例如,如果您只想查看前1000个单词,则训练集中的每个评论都由0-999个数字组成。如果出现其他单词,它们将被参数oov_char替换。

  弗洛克拉斯。DatasetSimportimDB (x _ train,y_train),)x_test,y _ test)=imdb。Load _ data) Path= imdb。给出了seed=113,start_char=1,oov_char=2,index _ from=3。

  http://www.Sina.com//数据的存储位置。如果你不在当地,请从网上下载http://www.Sina.com//最常用的词语。如果你不想想到模糊的语言(比如“Ultracrepidarian”),这是很有用的。y_train, y_test:被忽视的热词。如果你不想想最常见的单词,这很有用。例如,单词“the”不会向注释添加信息,因此可以通过将skip_top设置为2或更大来跳过它。keras中用CNN实现CIFAR-10图像分类:数组的最大长度。如果数组超过maxlen,它将被截断。无表示长度不限。x_train, x_test:播放数据的种子y_train, y_test:标记序列的开始。

  Rongoov_char:已删除的单词(例如,由于num_words或skip_top的限制)使用此字符代替x_train, x_test:查找当前索引和大于当前索引的单词。我的博客“index_from项目实战二:学生录取优化”对IMDB进行了分类。

  4.路透社新闻专线的主题分类

  总数据集:11228条新闻线,46个话题。

  和IMDB数据集一样,新闻也不是一个具体的词,而是被转换成了数字。

  从keras.datasets导入reuters(x_train,y_train),(x_test,y _ test)=Reuters . load _ data(path= Reuters . npz ,num_words=None,skip_top=0,Maxlen=none,,seed=113,start _ char=1,oov _ char=2,index _ from=3)test_split=0.2,seed=113,start _ char=1,oov _ char=2,index _ from=

  5.手写数字MNIST数据集

  训练集:60,000幅灰度图像,大小为28*28,有10个类别(0-9)

  测试集:10,000幅灰度图像,尺寸为28*28

  从keras.datasets导入mnist (x _ train,y _ train),(x _ test,y _ test)=Mn ist . load _ data()test_split=0.2:参数规格分别为(60000,28,28)和(10000,28,28)。test_split:数字标签(0-9)参数规格为(60000,)和(10000),我的博客“x_train, x_test”对MNIST手写数字进行了分类。

  6.MNIST时尚元素数据库

  训练集:60,000幅灰度图像,大小为28*28,有10个类别(0-9)

  测试集:10,000幅灰度图像,尺寸为28*28

  Fromkeras.datasets导入fashion _ mnist (x _ train,y _ train),(x _ test,y _ test)=fashion _ mnist . load _ data()y_train, y_test:参数规格为(60000,28,28)和(1000)MLP实现MNIST分类:数字标签(0-9),参数规格为(60000,)和(10000,)

  7.波士顿房价回归数据集

  20世纪70年代波士顿周边地区的房价。

  从keras.datasets导入boston_housing(x_train,y_train),(x_test,y _ test)=Boston _ housing . load _ data()

郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: