如何在火花上应用正则表达式,仅在火花上提取数字



我正在尝试对我的数据集进行正则表达式。我的问题是我想用空替换字母。

我试过以下代码

   val test_reg = xmlData.withColumn("volume",regexp_replace($"trans_volume", "[^0-9]", ""))

但是如果我的输入包含 alpahabets 以外的内容,那也替换为空

  lets say my input contains 34m89 it replaces as 3489 which is perfectly fine.
  but if my input contains 34.78 that is getting replaced as 3478 which actually should not happen. 

有些人可以帮助我如何解决我的问题吗?

val test_reg = xmlData.withColumn("volume",regexp_replace($"trans_volume", "[^0-9].", ""))

也许你应该添加 . 到你的正则表达式"[^0-9]"。

最新更新