在 Scala 中对文件中的字符使用迭代器时出现令人惊讶的行为

  • 本文关键字:迭代器 文件 Scala 字符 scala
  • 更新时间 :
  • 英文 :


我在迭代文本文件的字符时遇到一些不一致的行为。

以下脚本

import io.Source
val source = Source.fromFile("blah")
val iter = source.buffered
iter.dropWhile(_.isWhitespace)
for( c <- iter ) {
    println("""char="%c", byte=%d, isWhitespace=%b""".format(c, c.toByte, c.isWhitespace))
}
source.close()

读取以下文件(以 3 个空格开头,然后是"a"和第二行文本)

   a
bc de

输出以下内容

char=" ", byte=32, isWhitespace=true
char=" ", byte=32, isWhitespace=true
char=" ", byte=32, isWhitespace=true
char="a", byte=97, isWhitespace=false
char="
", byte=10, isWhitespace=true
char="b", byte=98, isWhitespace=false
char="c", byte=99, isWhitespace=false
char=" ", byte=32, isWhitespace=true
char="d", byte=100, isWhitespace=false
char="e", byte=101, isWhitespace=false
char="
", byte=10, isWhitespace=true

dropWhile(_.isWhitespace)没有删除 3 个空格,但c.isWhitespace之后立即在 for 循环中迭代时返回 true。

有人可以为我阐明这一点吗?我已经在十六进制编辑器中打开了文本文件,对我来说看起来还可以(纯 ascii,没有 UTF 的东西)。

编辑:在Ubuntu上使用Scala 2.9.2

编辑2:现在我很困惑。以下内容来自 Windows 7 上的 REPL:

c:projectsscratch>scala
Welcome to Scala version 2.10.2 (Java HotSpot(TM) 64-Bit Server VM, Java 1.7.0_21).
Type in expressions to have them evaluated.
Type :help for more information.
scala> val it = Iterator("a", "b", "cde", "f")
it: Iterator[String] = non-empty iterator
scala> val it2 = it.dropWhile(_.length < 2)
it2: Iterator[String] = non-empty iterator
scala> println(it.next)
cde
scala> println(it2.next)
f

将这段确切的代码作为脚本运行,而是从原始问题生成行为(迭代器不会被dropWhile修改)。

在 scala 中,vals 是不可变的对象。一旦设置了 val,就无法更改它。调用 iter.dropWhile(_.isWhitespace) 时,正在创建一个新对象,但不会存储在任何位置。如果要删除空格,则应将iter.dropWhile(_.isWhitespace)分配给新 val,并在 for 表达式中调用此新 val。

最新更新