Scala 正则表达式和部分函数



我想将 Scala 的 collect 函数与正则表达式一起使用。 理想情况下,我只想收集那些与正则表达式匹配的术语。 到目前为止,我已经实现了以下工作正常的方法

val regex = "(^([^:]+):([^:]+):([^:]+):([+]?[0-9]*\.?[0-9]+([eE][-+]?[0-9]+)?)$".r
<other_code>.collect{case x: String if regex.pattern.matcher(x).matches =>
    x match {
      case regex(feature, hash, value, weight) => (feature.split("\^"), weight.toDouble)
    }
  }

不过,这似乎有一个额外的步骤。 我首先检查正则表达式是否与 case 语句中的 case 语句匹配以进行收集,然后检查它是否再次匹配以提取匹配的组。 有没有办法只检查一次正则表达式匹配?

你不需要第一个匹配项:

<other_code>.collect {
    case regex(feature, hash, value, weight) => (feature.split("\^"), weight.toDouble)
}
检查正

则表达式是否匹配是不必要的,因为模式匹配将为您执行此操作。让我用一个稍微简单的例子来说明。

val regex = "(\d+),([A-z]+)".r
val input = List("1,a", "23,zZ", "1", "1ab", "")
scala> input collect { case regex(a, b) => (a, b) }
res2: List[(String, String)] = List((1,a), (23,zZ))

使用 x match { ... } 可能会导致匹配错误。

相关内容

  • 没有找到相关文章

最新更新