将 Word 文档解析为 Oracle Apex 表单页面



目前在Apex 5.1中内置了一个自定义的申请人跟踪系统/客户关系管理系统,ATS部分的一部分允许招聘人员将候选人数据输入系统并附上简历。

我现在的要求是他们不喜欢打字,因为它需要太长时间,所以他们想要一种方法,您可以上传和解析简历的内容来为他们填写表单字段。

Apex 5.1中是否有一种方法允许解析Word文档并将联系人和技能信息放入表单中,甚至直接放入表中,完全绕过表单?

还没有回复,所以 - 让我试试(恐怕不会有太大帮助)。

如果您在任何文本编辑器中打开 Word 文档,您将看到它看起来像一个二进制文件。出于测试目的,我创建了一个新的MS Word 2010(docx)文档,并在其中输入了一个单词:"Littlefoot"。然后我用记事本++打开它并搜索"小脚" - 什么也没找到,好像Word"加密"了文件内容。

因此,我相信这不是一项单一的任务 - 不是"我将使用UTL_FILE并找到一些关键字并提取它们背后的内容并将这些值放入我的 Oracle 表中"的意思。

我想我记得有人试图解析 Word 文件,就好像它们是 XML 一样,但是......呵呵,什么都没得到,有什么意外,再也想不起来了。

我的下一个想法是使用扫描仪和OCR(光学字符识别)软件,其输出将是TXT文件 - 如果你设法做到这一点,那么编写一些UTL_FILE代码并收集你需要的信息是一个相对简单的任务。

另一种选择是创建一个供候选人使用的应用程序 - 他们会输入您感兴趣的值并上传他们的简历(您可以将其放入 BLOB 数据类型列),但如果您的网络没有暴露在互联网上,这可能会有些棘手,因此候选人必须进入您的场所才能填写该信息。

或者,创建一个"虚拟"应用程序(再次供候选人使用)来填充所需的信息;应用程序将生成一个包含这些信息的二维条形码,您只需使用条形码扫描仪读取它。

正如我所说,不是很有用,但我有很多想法。我相信其他人有更多的人。

最新更新