在 Python 中读取 .dss 数据库文件



我有一个DSS数据库文件,我想使用Python从文件中提取数据库模式。我实际上需要在这个数据库上执行查询,但我找不到任何好的文档来开始。因此,我决定如果可以提取模式,我可以创建一个SQLite数据库并在那里运行我的实验。

文件内容如下:

5a44 5353 8854 0000 6e04 0000 0700 0000
362d 5146 14a2 2001 85a9 8c00 3037 4a55
4c31 3400 3330 4e4f 5631 3700 3132 3a35
393a 3134 0000 0000 0010 0000 0100 0000
2000 0000 0500 0000 7f00 0000 df10 0000
...  ...  ...  ...
...  ...  ...  ...

注意。我不熟悉DSS数据库。

任何帮助将不胜感激。

DSS或HEC-DSS是由美国陆军工程兵团水文工程中心(HEC)开发的数据库系统。它不是一个关系数据库,而是一个旨在更有效地检索和存储大量数据的数据库,这些数据不一定与其他数据集相互链接。HEC-DSS支持时间序列数据、配对数据(如熊猫数据帧)、面向空间的网格化数据等数据类型。HEC-DSS通过路径名引用数据集或记录。路径名分为六个部分,标记为"A"到"F"为/A/B/C/D/E/F/。HEC-DSS被纳入HEC的主要项目,如HEC-RAS,HEC-HMS,HEC-RTS等。

HEC发布了Java库和基于Java的可视化实用程序HEC-DSSVue,用于查看,编辑或操作HEC-DSS。Java库可以在Jython中使用,但是Jython缺少numpy,pandas,matplotlib和其他流行的科学库。所以我在2017年底开始研究pydsstools,一个用于HEC-DSS的python库。目前,pydsstools支持主要的HEC-DSS数据类型和基本的复制,删除操作,并且可以像发行版一样在Windows和Ubuntu中工作。以下 python 代码是读取和绘制时间序列数据的示例:

from pydsstools.heclib.dss import HecDss
import matplotlib.pyplot as plt
import numpy as np
dss_file = "example.dss"
pathname = "/REGULAR/TIMESERIES/FLOW//1HOUR/Ex1/"
startDate = "15JUL2019 19:00:00"
endDate = "15JUL2019 21:00:00"
with HecDss.Open(dss_file) as fid:
ts = fid.read_ts(pathname,window=(startDate,endDate),trim_missing=True)
times = np.array(ts.pytimes)
values = ts.values
plt.plot(times[~ts.nodata],values[~ts.nodata],"o")
plt.show()

操作其他数据类型(配对数据、网格化数据)的示例在 GitHub pydsstools 存储库的自述文件中提供。

如果你在Windows环境中,这个库看起来很有前途。我在 Linux 环境中,所以我无法使用它,但示例显示了我想做的事情:

https://github.com/gyanz/pydsstools

最新更新