我在一家公司工作,该公司目前使用SAS数据文件集合(sas7bdat(作为数据仓库。我试图证明,从SAS迁移到SQL数据库将带来巨大的性能提升。根据SAS目前执行查询所需的时间,我有一种直觉,即在相同硬件上运行PostgreSQL中的数据仓库会更快。
问题是,很难将性能苹果与苹果进行比较(例如,在相同的硬件上(。我很想在我的家庭服务器上启动一个虚拟机,在SAS上运行相同的操作集,并与SQL数据库进行比较,但我不愿意为SAS昂贵的许可付费。
是否有人对SAS数据集与SQL表相比执行查询所需的时间进行了基准测试?
我以前作为顾问做过这个分析。我面前没有具体的细节,但它是巨大的(SQL Server的速度大约快10-100倍(。使用索引创建表。
作为SAS的前顾问,我们曾鼓励客户使用RDBMS与SAS数据集。sas7bdat是很久以前设计的专有二进制格式。它的速度和功能远远不及RDBMS。
此外,从SAS数据集转换为SQL表也很容易。
我不确定Postgres的性能如何,但我想这些数字会与SQL Server相当(可能没有那么快,但非常接近(。我已经使用了所有主要的数据库,但我在SQL Server上进行了测试。