我目前正在研究sparklyr,我正在尝试在Cassandra中创建一个新的密钥空间。可能吗?如果是这样,如何?
我正在尝试以下表达:
sql(sqlContext, "CREATE KEYSPACE key1 WITH REPLICATION = {'class': 'SimpleStrategy', 'replication_factor': 1 }")
但结果我得到了错误:
Error in invokeJava(isStatic = FALSE, objId$id, methodName, ...) :
java.lang.RuntimeException: [1.1] failure: ``with'' expected but identifier CREATE found
Spark SQL中没有用于创建新的Cassandra表或键空间的SQL
命令。Spark Sql 只能创建或销毁与已经存在的 Cassandra 表相关的元数据。要创建新表,您需要使用 Scala/Java 中添加的自定义数据帧 API。
val renamed = df.withColumnRenamed("col1", "newcolumnname")
renamed.createCassandraTable(
"test",
"renamed",
partitionKeyColumns = Some(Seq("user")),
clusteringKeyColumns = Some(Seq("newcolumnname")))
数据帧文档
这基本上意味着你必须从R对Java进行某种跨语言调用。我不知道有什么简单的方法可以做到这一点,我建议只从支持的语言调用任何 Cassandra 驱动程序。例如,仅使用Python和python驱动程序。