如何从pdf文件中提取关键字asp.net c#



我有pdf格式的cv,我想提取关键字NLP(自然语言处理)。以下是附件图片。

但是我不知道怎么做,我是初学者,请帮助我谢谢img img2

有一个叫做iTextSharp的开源库。

你可以上传简历并把它放在服务器的特定路径上,然后你可以阅读它的字符串内容,看看你的文本是否存在,如下所示。

public bool KeywordExists(string keyWord)
{
    using (PdfReader reader = new PdfReader(pdfPath))
    {
        StringBuilder strText = new StringBuilder();    
        for (int i = 1; i <= reader.NumberOfPages; i++)
        {
            strText.Append(PdfTextExtractor.GetTextFromPage(reader, i));
            if(strText.Contains(keyWord)) return true;
        }
        return false;
     }
}

相关内容

  • 没有找到相关文章

最新更新