今天边肖就和大家分享一下Python数据存储的h5py的详细讲解,有很好的参考价值。希望对你有帮助。来和边肖一起看看吧。
1、Python数据存储(压缩)
(1)numpy.save,numpy.savez,scipy.io.savemat
Numpy和scipy内置数据存储方法。
(2)cPickle gzip
CPickle是Pickle内置的数据存储方式,gzip是常用的文件压缩模块。
(3)h5py
H5py是一个用于读写HDF5文件格式的python包。更多h5py的介绍和安装,请参考官网。
HDF5请参考官网。
HDF5文件是通过两个基本数据对象(组和数据集)存储各种科学数据的容器:
HDF5数据集:数据元素和支持元数据的多维数组;HDF5组:包含0个或多个hdf5对象和支持元数据的组结构;
总之,dataset是一个类似数组的数据集,而group是一个类似文件夹的容器,存储数据集和其他组。h5py中group和dataset的使用有点类似于字典和Numpy中数组的使用。
h5py的优点:速度快,压缩效率高。在一个作品中,numpy.savez和cPickle无论有没有工作存储都可以给h5py一个尝试!
2、h5py读取和存储数据示例
导入h5py
X=np.random.rand(100,1000,1000)。astype('float32 ')
y=np.random.rand(1,1000,1000)。astype('float32 ')
#创建新文件
f=h5py。文件(' data.h5 ',' w ')
f.create_dataset('X_train ',data=X)
f.create_dataset('y_train ',data=y)
f.close()
#加载hdf5数据集
f=h5py。文件(' data.h5 ',' r ')
X=f['X_train']
Y=f['y_train']
f.close()
详细用法请参考官网。
以上关于Python数据存储的h5py的详细讲解,就是边肖分享的全部内容。希望给大家一个参考,支持我们。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。