1)我在Hadoop作业的Map中有行键、列和值,我知道我可以使用BulkOutputFormat将其直接流式传输到Cassandra。
2) 我已经浏览了代码,但很难理解如何使用它。如何使用BulkOutputFormat API将数据流式传输到Cassandra?
由于还没有关于这方面的更多文件,我请求卡桑德拉专家指导我完成这项工作。一个小的代码片段将非常有帮助。我计划用当前的开发版本来测试它。
通过研究cassandra源代码和cassandra JIRA,我已经找到了使用BulkOutputFormat的方法,并在这里进行了描述:使用BulkOutputFormat将数据加载到带有Hadoop 的cassandra