要构建的数据库是否正确:关系数据库还是文档存储



我想创建一个研究数据库,该数据库主要返回用户创建的.pdfs,但可以算术处理文档中的信息或标记的元数据。正确的方法是像Access这样的传统关系数据库,还是像MongoDB这样的NoSQL数据库?最终,我想创建一个公司内部网站,作为报告的前端。

我不知道有任何数据库服务器可以算术处理可移植文档格式(PDF(文档中的信息。

您需要在数据库之外解析PDF文档。拔出重要零件。如果每个PDF中都有一组固定的特定值,请将这些值存储在一个表的列字段中。PDF文档可以存储在同一表格的一列中。

如果通过";标记的元数据";如果您的意思是一个零、一个或多个标记值的集合,以便与每个PDF文档关联,那么您将使用其他表。

我建议使用Postgres这样的关系数据库,它可以将PDF存储为二进制大对象类型,通常称为BLOB。关于Postgres中的二进制数据类型,请参阅本页。

最新更新