小贝子编程

使用c#识别从pdf文档中提取的文本的段落和/或页面边界

本文关键字：段落边界文本使用识别 pdf 文档提取 c#
更新时间 : 2023-09-01
英文 : identify paragraph and or page boundaries of extracted text from pdf documents using c#

我正在开发应用程序，需要从pdf中识别段落
我需要提取文本并识别段落
是否有任何方法可以使用c#从pdf文档中提取文本并识别提取文本的段落和/或页面边界

PDF是一种二进制格式，请尝试使用其中一种读取：
http://www.pdflib.com/
http://sourceforge.net/projects/itextsharp/

一旦你有了流，你应该能够检查
换行符/回车符（\n/\r）或制表符\t以查找新段落。

最新更新

Mapbox -悬停在多边形上根本不起作用.如何让它与矢量数据的工作?
CSS z-index和移动设备
找不到 Flutter 'FirebaseCore/FirebaseCore.h' 文件
curl:(26)从appcenter的文件/应用程序打开/读取本地数据失败
剧本无法从角色内部的循环变量中找到"{{ item }}"
当imagflow删除缓存图像时
为什么concat也显示在这个选择查询中
将python控制台应用程序转换为web应用程序的最简单方法
JavaFX 将折线图导出到 png 不会正确呈现图表，如果图表未置于前台
获取用户定义对象数组的最后一个元素
Bash脚本导入sql转储到正确的数据库
Pyomo MINLP解算器没有选择最优结果
如果对象id在其他对象id中有自己的属性，则更改数组中的对象值
AssertionError:此优化器没有记录inf检查
数据导入问题
如何从两个不同的房间表中收集流，并将数据组合在android的recyclerview中显示
DynamoDB全局索引vs本地索引
防止从iframe滚动，但仍然可以点击javascript
使用正则表达式将'team'标签动态添加到普罗米修斯中的警报
无法在nextjs 13中更新next-auth v4的会话
R rlang: call_args in dplyr::mutate
如何在Azure容器应用程序上部署React Python应用程序时解决此错误?
如何在不泄露源代码的情况下销售chrome扩展
wp.blocks.blockRegisterType在控制台显示错误- Gutenberg Wordpress.<
物质化在shadowroot内的Modal内初始化自动完成不工作
如何使用micronaut实现基于模式的多租户
授权非admin用户在Google Apps Script中运行admin SDK
需要退出函数，但没有得到一个不允许的值错误
合并两个调用并使用typeahead ngx-bootstrap显示结果?
如何发送文本和二进制套接字在单一消息在C?

使用c#识别从pdf文档中提取的文本的段落和/或页面边界

相关内容

最新更新

热门标签：