我正在启动一个新软件,它应该能够处理大型数据集,即数TB的数据。
我已经看到 Rocksdb 允许存储大型数据集,但我不确定它是一个核心外功能?我的意思是,如果数据集大于计算机RAM,它会处理它吗?
此外,如果没有交换,是否有一些关于使用此类内存中数据存储的性能影响研究?谢谢
RocksDB对超过RAM大小的数据集没有困难。但是,您几乎必须使用布隆过滤器来保持性能,并且它们会占用RAM。因此,随着数据库的增长,您将看到一些线性内存增长。但它远非1比1,更像是1/50左右。