所以我的任务是将rtfd文件转换为tiffs。
第一件事。我们取下文件夹中的附件(在mac上称为"rtfd")并对其进行成像。
我的问题在于将rtf分解为多个rtf文件。一位同事建议通过我们访问权限有限的mac将文件转换为html。他在一天内转换了文件,但输出并不像他想象的那样是html,而是.webarchive.
从我读到的内容来看,这两种格式都是仅限mac的格式。我拒绝接受。。。
rtf包含一个名为TXT.rtf的文件,它是一个富文本文件,但具有不可显示的字符和奇怪的格式。
我可以很容易地进入rtf文件,使用脚本在分页符处拆分文件,但奇怪的格式和不可播放的字符仍然存在。当使用.webarchive格式时,文件与文本内联,因此无法呈现(至少就我所见)
目前我不知所措,我唯一没有尝试过的选择是从safari中获取网络档案并将其打印成PDF。
有人在linux环境中使用过这些文件吗?
我不知道为什么要将可搜索的文本转换为巨大的图像。除此之外,RTF是一种Mac格式,所以这就是你应该使用它的地方:
- 编写一个简单的AppleScript,在TextEdit中打开Finder中选择的文件,并将其打印为PDF(最后一部分可能需要一些UI脚本)
- 使用内置的"将PDF页面渲染为图像"创建Automator工作流
在类Unix环境中读取.webarchive文件
PC-BSD读取应用程序/x-webarchive.webarchive(web归档)文件的方法(2015-07-21)-我将交叉参考这个答案,如果找到解决方案,我将在这里发布。
在类Unix环境中编写.webarchive文件
由于2008年对创建Safari网络档案的跨平台方式有一个公认的答案,所以我想2015年可以/应该有一种读取格式的方法…