如果记录由 ^A 分隔,那么在我的 scala 代码中,我可以用作 "\u0001" 来获取每个字段
val fileLoc = "/user/cloudera/inputfiles/records.txt"
val custAccountRDD = sc.textFile(fileLoc)
val splitRDD = custAccountRDD.map(elem => elem.split("\u0001"))
我想要^_的等效分隔符
示例输入记录
4^_123123123^_Any Purchase^_ACTIVE^_1^_DATA^_Published
我的问题是我如何根据分隔符拆分这些记录^_
我直接尝试了下面它不起作用
val splitRDD = custAccountRDD.map(elem => elem.split("^_"))
这是你要找的吗?
scala> "4^_123123123^_Any Purchase^_ACTIVE^_1^_DATA^_Published".split("\^\_")
res5: Array[String] = Array(4, 123123123, Any Purchase, ACTIVE, 1, DATA, Published)