python操作HDF5文件

HDF5一种能高效存储和分发科学数据的新型数据格式,然后主要有group和dataset两种概念。每个文件都类似于linux文件系统,其中group类似于文件夹,dataset类似于文件。

 

首先python要读写hdf5格式文件首先要安装一个库:h5py

然后就跟平时的文件读写是一样的,下面给出例子:

 

# coding:UTF-8

import h5py

with h5py.File("data/1.data", "w") as fp:

    fp.create_group("/b/b1")
    fp.create_group("/b/b2")
    fp.create_group("/a/a1")
    fp.get("/b").create_group("b3")
    fp.get("/b/b3").create_dataset("data", data="abc")
    fp.get("/b/b3").attrs['data'] = True
    fp["/b/b3"]['data'].attr = True
    del fp['/b/b3']['data']

    for k in fp['/b']:
        print(k)

    del fp['/b']

 

其中File对象默认指向于根目录,然后create_group是创建一个group,create_dataset是创建一个dataset。然后创建的group时候指定的名字,等同于文件系统创建文件夹,例如/b/b1是两级结构了。dataset可以存储各种基础类型数据。然后读取可以像字典一样操作,修改数据可以通过group的attrs属性修改对应的dataset,或者dataset的attr属性直接修改内容。删除数据,直接像操作字典一样即可。

 

发表评论

电子邮件地址不会被公开。 必填项已用*标注