(Re)从多个源/文本编辑器格式化HTML



我正在一个工作板上工作,该工作板接受来自许多其他服务的API帖子。我们经常遇到收到的html问题,例如<div>标签没有关闭,使用内联CSS样式等。

我们接收到的每个服务都有它自己的规则和怪癖。这个问题很复杂,因为最终用户是从Word文件复制/粘贴到他们的所见即所得编辑器中,然后才发送给我们!

似乎唯一可靠的解决方案是剥离所有的html。但这惹恼了用户,因为所有的项目符号、粗体文本和标题都不见了。

我试过用换行符等代替<p>标签的公式,但我从来没有设法使它令人满意地工作。

谁能提出一个对他们有效的方法或解决方案?

我特别关注修复不良标记的方法,而不是强制执行好的标记。这是因为在很多情况下,最终用户被一个糟糕的系统困住了,大多数人都不知道如何理解或修复糟糕的html。

(我们使用的是经典ASP,正在向MVC迁移)

也许你可以通过实现浏览器怪癖模式来部分解决这个问题。如果客户发送给你足够好的标记,那么将其作为"丰富"标记发布,并以"成功"回应。如果客户端发送给你一些太混乱的东西-将其作为条纹版本发布,并响应标记错误列表。如果他想要很酷的"丰富"标记,他应该修复它。

在iframe中显示客户端的响应

由于Iframe不会干扰你的设计布局-客户端将看到他们发送给你的东西(要么修复他们的错误,要么得到他们应得的),你的页面将看起来完整和漂亮

最新更新