在 scala 代码中使用的分隔符 ^_ 的相应 unicode 是什么



如果记录由 ^A 分隔,那么在我的 scala 代码中,我可以用作 "\u0001" 来获取每个字段

 val fileLoc         = "/user/cloudera/inputfiles/records.txt"
 val custAccountRDD  =    sc.textFile(fileLoc)
 val splitRDD        =    custAccountRDD.map(elem => elem.split("\u0001"))

我想要^_的等效分隔符

示例输入记录

 4^_123123123^_Any Purchase^_ACTIVE^_1^_DATA^_Published

我的问题是我如何根据分隔符拆分这些记录^_

我直接尝试了下面它不起作用

 val splitRDD        =    custAccountRDD.map(elem => elem.split("^_"))

这是你要找的吗?

scala> "4^_123123123^_Any Purchase^_ACTIVE^_1^_DATA^_Published".split("\^\_")
res5: Array[String] = Array(4, 123123123, Any Purchase, ACTIVE, 1, DATA, Published)

最新更新