dataframe 数据分析,dataframe的特点
keras数据集有七种:(可以从官方的keras文档中读取。https://keras.io/datasets/).他们中的一些人被研究和实践,并写了笔记。
为多个数据集添加下载位置。
狗狗图片:https://S3-us-west-1.amazonaws.com/uda市-aind/dog-project/dog images . zip
cifa r10:https://www . cs . Toronto . edu/~ kriz/cifar-10-python . tar . gz
1.CIFAR10小图
训练集:分为50000张大小为32 * 32的彩色图像,10种。
测试集:10,000幅彩色图像,尺寸为32*32
from keras . datasetsimportcifar 10(x _ train,y_train),)x_test,y _ test)=cifar 10 . load _ data)3http://www
我的博客“x_train, x_test”对CIFAR10数据集进行了分类。
2.CIFAR100小图
训练集:分为50000幅大小为32 * 32100的彩色图像。
测试集:10,000幅彩色图像,尺寸为32*32
来自keras . datasetsimportcifar 100(x _ train,y_train),)x_test,y_test(=CIFAR100.load_data)标签
3.IMDB影评人的情感分类
训练集:25000条评论,正面评价1,负面评价0。
测试集:25,000条评论
每条评论都不是特定的单词结构,而是所有的单词都被转换成了数字。例如,如果您只想查看前1000个单词,则训练集中的每个评论都由0-999个数字组成。如果出现其他单词,它们将被参数oov_char替换。
弗洛克拉斯。DatasetSimportimDB (x _ train,y_train),)x_test,y _ test)=imdb。Load _ data) Path= imdb。给出了seed=113,start_char=1,oov_char=2,index _ from=3。
http://www.Sina.com//数据的存储位置。如果你不在当地,请从网上下载http://www.Sina.com//最常用的词语。如果你不想想到模糊的语言(比如“Ultracrepidarian”),这是很有用的。y_train, y_test:被忽视的热词。如果你不想想最常见的单词,这很有用。例如,单词“the”不会向注释添加信息,因此可以通过将skip_top设置为2或更大来跳过它。keras中用CNN实现CIFAR-10图像分类:数组的最大长度。如果数组超过maxlen,它将被截断。无表示长度不限。x_train, x_test:播放数据的种子y_train, y_test:标记序列的开始。
Rongoov_char:已删除的单词(例如,由于num_words或skip_top的限制)使用此字符代替x_train, x_test:查找当前索引和大于当前索引的单词。我的博客“index_from项目实战二:学生录取优化”对IMDB进行了分类。
4.路透社新闻专线的主题分类
总数据集:11228条新闻线,46个话题。
和IMDB数据集一样,新闻也不是一个具体的词,而是被转换成了数字。
从keras.datasets导入reuters(x_train,y_train),(x_test,y _ test)=Reuters . load _ data(path= Reuters . npz ,num_words=None,skip_top=0,Maxlen=none,”,seed=113,start _ char=1,oov _ char=2,index _ from=3)test_split=0.2,seed=113,start _ char=1,oov _ char=2,index _ from=
5.手写数字MNIST数据集
训练集:60,000幅灰度图像,大小为28*28,有10个类别(0-9)
测试集:10,000幅灰度图像,尺寸为28*28
从keras.datasets导入mnist (x _ train,y _ train),(x _ test,y _ test)=Mn ist . load _ data()test_split=0.2:参数规格分别为(60000,28,28)和(10000,28,28)。test_split:数字标签(0-9)参数规格为(60000,)和(10000),我的博客“x_train, x_test”对MNIST手写数字进行了分类。
6.MNIST时尚元素数据库
训练集:60,000幅灰度图像,大小为28*28,有10个类别(0-9)
测试集:10,000幅灰度图像,尺寸为28*28
Fromkeras.datasets导入fashion _ mnist (x _ train,y _ train),(x _ test,y _ test)=fashion _ mnist . load _ data()y_train, y_test:参数规格为(60000,28,28)和(1000)MLP实现MNIST分类:数字标签(0-9),参数规格为(60000,)和(10000,)
7.波士顿房价回归数据集
20世纪70年代波士顿周边地区的房价。
从keras.datasets导入boston_housing(x_train,y_train),(x_test,y _ test)=Boston _ housing . load _ data()
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。