我正在为大学学生实现开放的数据门户,这样他们就可以访问大学不同建筑中生成的所有数据集,并可以利用这些数据开发有趣的应用程序。
我已经安装了CKAN。它运行良好。我也实施了收割机。
我主要关心的是:该大学有一个系统,存储来自不同传感器的数据,如温度、光线、噪音等。该项目的目的是将存储在系统上的数据连接到ckan,以便在存储在系统和开放数据平台上的数据之间进行同步。我尝试了几种源类型的收割。
你能告诉我什么是最好的功能,可以帮助我连接到大学的数据存储系统吗。
大学需要从哪里设置网络服务器吗?我们可以通过CKAN收割连接CKAN?
我们是否需要实现像publicopendataeu使用的新扩展(例如opengov_se等)来连接到不同的资源,或者我们可以使用现有的扩展?
你建议uni以什么格式存储数据?目前数据存储为SQL数据库。
有什么方法可以将这些SQL表连接到Ckan并将这些表作为数据集导入吗?
一些建议:
- 试试这个CKAN扩展。其想法是允许查看远程SQL表。我上一次尝试它时没有成功,但它看起来是最近更新的,并声称与CKAN 2.5兼容
- 使用Datastore和Datastore API使底层传感器/数据源直接写入CKAN
- 让当前系统直接写入CKAN数据存储表(即忽略API)。虽然不太好,但如果您已经为DB写入设置了所有内容,那么工作量可能会减少。您需要首先创建初始CKAN数据集和资源(每个资源1个SQL表)
- (与上面类似)在数据库表之间创建一些优雅的镜像/复制系统。也许只有当两个数据库都是Postgres时才可能/直接
- 收获是可行的,但你必须编写自己的收获器,从数据库中查询/执行导出,并将其导入/更新到CKAN资源中
- (与上面类似)使用CKAN/CKAN Datastore API从数据库查询/执行导出并将其导入/更新到CKAN资源的独立脚本