我需要通过火花流读取 CSV 文件,并将输出流写入具有特定行/大小块的控制台。
使用火花流式处理readStream
读取 CSV,writeStream
在控制台中写入。
val df: DataFrame = sparkSession.readStream
.option("sep", ",")
.schema(userSchema)
.csv("path")
val res: StreamingQuery = df.writeStream
.format("console")
.start()
我希望所有 50000 行都以 50 行的块显示在控制台中,但我只得到 20 行,或者我需要设置一个数字以显示在控制台中。
您可以通过在写入流上设置">numRows"属性来设置要显示的行数。
df.writeStream
.option("numRows",50)