我是Cassandra和Column家族数据库世界的新手。我有一个场景,我需要将数据从一个Column系列数据库(如Scylla数据库)移动到另一个Columns系列数据库Datastax Cassandra。要传输的数据量将以百万为单位。我希望这种数据传输在固定的时间间隔内进行,比如说2分钟。我正在探索表加载程序选项。还没有运气。对于我的场景,还有其他更好的方法吗?任何建议都将不胜感激。
(免责声明:我是ScyllaDB的员工)
有三种方法可以做到这一点:
- 从带有客户端时间戳的客户端向两个数据库进行双重写入
- 使用sstableloader工具将数据从一个数据库迁移到另一个数据库
- 使用
nodetool refresh
命令加载sstables
您可以在下面的文档中阅读更多关于从Cassandra迁移到Scylla的信息,其中还描述了如何从客户端执行双重写入(选项1),并提供了代码示例+如何使用sstableloader工具(选项2)
http://docs.scylladb.com/procedures/cassandra_to_scylla_migration_process/
有关nodetool refresh
的用法,您可以查看以下内容:http://docs.scylladb.com/nodetool-commands/refresh/
一种常见的方法是让客户端并行写入两个数据库,而不是同步两个数据库。这使两个数据库在每次写入时保持同步。