使用 R 将 Excel (.xlsx) 工作表打印/保存为 PDF



我想在操作后将Excel文件打印到pdf文件中。对于操作,我使用了工作正常的.xlsx包。printSetup有一个功能,但我找不到开始打印的功能。有解决方案吗?

library(xlsx)
file <- "test.xlsx"
wb <- loadWorkbook(file)  
sheets <- getSheets(wb)       # get all sheets
sheet <- sheets[[1]]          # get first sheet
# HERE: MAGIC TO SAVE THIS SHEET TO PDF

这可能是通过RDCOMClient包使用 DCOM 的解决方案,尽管当我在 MacOS 上工作时,我更喜欢独立于平台的解决方案(例如使用 xlsx)。有什么想法吗?

下面是通过RDCOMClient使用DCOM接口的解决方案。这不是我的首选解决方案,因为它仅适用于Windows。平台式独立解决方案仍将受到赞赏。

library(RDCOMClient)
library(R.utils)
file <- "file.xlsx"                   # relative path to Excel file
ex <- COMCreate("Excel.Application")  # create COM object
file <- getAbsolutePath(file)         # convert to absolute path
book <- ex$workbooks()$Open(file)     # open Excel file
sheet <- book$Worksheets()$Item(1)    # pointer to first worksheet
sheet$Select()                        # select first worksheet
ex[["ActiveSheet"]]$ExportAsFixedFormat(Type=0,    # export as PDF
                                        Filename="my.pdf", 
                                        IgnorePrintAreas=FALSE)
ex[["ActiveWorkbook"]]$Save()         # save workbook
ex$Quit()                             # close Excel

一个开源和跨平台的方法就是使用libreoffice,如下所示:

library("XLConnect")
x <- rnorm(1:100)
y <- x ^ 2
writeWorksheetToFile("test.xlsx", data.frame(x = x, y = y), "Data")
tmpDir <- file.path(tempdir(), "LOConv")
system2("libreoffice", c(paste0("-env:UserInstallation=file://", tmpDir), "--headless", "--convert-to pdf",
    "--outdir", getwd(), file.path(getwd(),"test.xlsx")))

理想情况下,您将删除 tmpDir 引用的文件夹,但这将是特定于平台的。

请注意,这假设libreoffice在你的路径上。如果不是,则需要更改该命令以包含 libreoffice 可执行文件的完整路径。

env 位的原因是,如果无头 libreoffice 尚未在 GUI 模式下运行,则只会做任何事情。有关详细信息,请参阅 http://ask.libreoffice.org/en/question/1686/how-to-not-connect-to-a-running-instance/。

您可以使用 pdf 函数:
pdf(file="myfile.pdf", width=8.5, height=11)
打印(首页)
grid.newpage()
打印(第二张)
grid.newpage()
打印(第三张)
dev.off()

最新更新