从 DataSet Spark Java API 生成 Excel 文件?



我想从我的数据集生成一个 excel 文件?

有人可以用一个示例表达式来指导我。

这样的事情可以为你工作。(语法是错误的,但这个想法可以工作(

import org.apache.poi.hssf.usermodel.HSSFSheet;
import org.apache.poi.hssf.usermodel.HSSFWorkbook;
import org.apache.poi.ss.usermodel.Cell;

HSSFWorkbook new_workbook = new HSSFWorkbook();
HSSFSheet sheet = new_workbook.createSheet(obj.getSheetName());
org.apache.poi.ss.usermodel.Row header = sheet.createRow(0);
// Assume there are data already in an array which contains all the header field names
for (int y = 0; y < len; y++) {
header.createCell(y).setCellValue(fieldAr[y]);
}

接下来,您可以通过迭代数据集中的数据来填充工作表(我无法详细说明如何为您的情况执行此操作(,但这样的事情可以工作

for (String key : keySet) {
org.apache.poi.ss.usermodel.Row row = sheet.createRow(rowNum++);
List<Object> objArr = excel_data.get(key);
int cellNum = 0;
for (Object object : objArr) {
Cell cell = row.createCell(cellNum++);
}
FileOutputStream output_file = new FileOutputStream(new File(output)); //create XLS file
new_workbook.write(output_file);//write converted XLS file to output stream
output_file.close();

val ds = Seq(1,2,3,4,5(.toDS

ds.write.csv("/tmp/file"(//给出一些 hdfs 或文件系统路径

它会根据数据集的分区数将数据存储到多个文件中。

  • 如果我们将数据存储在 HDFS 中,请使用 HDFS 合并命令
  • 使用 cat 命令并将所有输出重定向到单个 CSV 文件 像猫*.csv>>决赛.csv

相关内容

  • 没有找到相关文章

最新更新