我想将一个制表符分隔的文本文件读取到Breeze DenseMatrix中。我在ScalaDoc中看到这应该是可能的,并且有一整套I/O类,但我找不到任何例子,很难消化ScalaDoc。
有人能提供一个简单的读写示例吗?
有一种方法可以将csv文件读取到densematrix 中
import breeze.linalg._
import java.io._
val matrix=csvread(new File("your file localtion"),',')
api:http://www.scalanlp.org/api/breeze/index.html#breeze.linalg.package
您可以使用scala.io.Source
从文件中读取制表符分隔的数据。
一些样本数据:
0 1 2 3 4 5
6 7 8 9 10 11
其中一个DenseMatrix
构造函数的形式是new DenseMatrix(rows: Int, data: Array[V], offset: Int = 0)
,所以我将使用它。
获取行数:
scala> scala.io.Source.fromFile("TabDelimited.txt").getLines.size
res 0:Int = 2
然后获取数据作为Array[Int]
:
scala> scala.io.Source.fromFile("TabDelimited.txt").getLines.toArray.flatMap(_.split("t")).map(_.toInt)
res1: Array[Int] = Array(0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
则可以使用CCD_ 5和CCD_ 6来创建新的CCD_。