我是Cassandra和Hadoop的新手。在寻找两种产品的整合时,我遇到了Brisk。从描述中我了解到,Brisk将HDFS替换为CassandraFS。所以这个替代品是Hadoop小文件问题的解决方案吗?如果是这样,那么大文件呢?目前,我需要实现一个资源存储,其中包含大型二进制数据文件及其元数据和小文件,如图像。
两者都是,真的(尽管我认为Brisk现在已经被纳入了一个商业产品DataStax Enterprise,并且没有积极地开发自己的权利)。
Brisk包含CassandraFS (cfs),它是HDFS的临时替代品,因此支持大文件。在底层,这些数据被分成块并存储在Cassandra的行/列中。
对于小文件,您可以将数据存储在本机Cassandra行中,而不是CassandraFS中,并在这些行上运行Hadoop作业。