python操作HDF5文件
HDF5一种能高效存储和分发科学数据的新型数据格式,然后主要有group和dataset两种概念。每个文件都类似于linux文件系统,其中group类似于文件夹,dataset类似于文件。
首先python要读写hdf5格式文件首先要安装一个库:h5py
然后就跟平时的文件读写是一样的,下面给出例子:
# coding:UTF-8 import h5py with h5py.File("data/1.data", "w") as fp: fp.create_group("/b/b1") fp.create_group("/b/b2") fp.create_group("/a/a1") fp.get("/b").create_group("b3") fp.get("/b/b3").create_dataset("data", data="abc") fp.get("/b/b3").attrs['data'] = True fp["/b/b3"]['data'].attr = True del fp['/b/b3']['data'] for k in fp['/b']: print(k) del fp['/b']
其中File对象默认指向于根目录,然后create_group是创建一个group,create_dataset是创建一个dataset。然后创建的group时候指定的名字,等同于文件系统创建文件夹,例如/b/b1是两级结构了。dataset可以存储各种基础类型数据。然后读取可以像字典一样操作,修改数据可以通过group的attrs属性修改对应的dataset,或者dataset的attr属性直接修改内容。删除数据,直接像操作字典一样即可。