如何将SQL数据库中的表作为数据集自动发布到CKAN中

  • 本文关键字:数据集 CKAN SQL 数据库 ckan
  • 更新时间 :
  • 英文 :


我正在为大学学生实现开放的数据门户,这样他们就可以访问大学不同建筑中生成的所有数据集,并可以利用这些数据开发有趣的应用程序。

我已经安装了CKAN。它运行良好。我也实施了收割机。

我主要关心的是:该大学有一个系统,存储来自不同传感器的数据,如温度、光线、噪音等。该项目的目的是将存储在系统上的数据连接到ckan,以便在存储在系统和开放数据平台上的数据之间进行同步。我尝试了几种源类型的收割。

你能告诉我什么是最好的功能,可以帮助我连接到大学的数据存储系统吗。

大学需要从哪里设置网络服务器吗?我们可以通过CKAN收割连接CKAN?

我们是否需要实现像publicopendataeu使用的新扩展(例如opengov_se等)来连接到不同的资源,或者我们可以使用现有的扩展?

你建议uni以什么格式存储数据?目前数据存储为SQL数据库。

有什么方法可以将这些SQL表连接到Ckan并将这些表作为数据集导入吗?

一些建议:

  • 试试这个CKAN扩展。其想法是允许查看远程SQL表。我上一次尝试它时没有成功,但它看起来是最近更新的,并声称与CKAN 2.5兼容
  • 使用Datastore和Datastore API使底层传感器/数据源直接写入CKAN
  • 让当前系统直接写入CKAN数据存储表(即忽略API)。虽然不太好,但如果您已经为DB写入设置了所有内容,那么工作量可能会减少。您需要首先创建初始CKAN数据集和资源(每个资源1个SQL表)
  • (与上面类似)在数据库表之间创建一些优雅的镜像/复制系统。也许只有当两个数据库都是Postgres时才可能/直接
  • 收获是可行的,但你必须编写自己的收获器,从数据库中查询/执行导出,并将其导入/更新到CKAN资源中
  • (与上面类似)使用CKAN/CKAN Datastore API从数据库查询/执行导出并将其导入/更新到CKAN资源的独立脚本

最新更新