我想从包含html代码的字符串中检索图像(img
标签(的文件名。
下面的示例:包含 2 个 img
html 标记的字符串(html 代码(。需要获取图像的文件名(不是完整的 url(。
<p>One two thre four</p>
<img src="http://localhost:5000/uploads/360e2b55a984178fd102a6cff9d70bc943936461.jpg"
style="width: 300px; display: block; vertical-align: top; margin: 5px auto;
text-align: center;">
<p>Five six seven</p>
<img src="http://localhost:5000/uploads/a77381fa354a067ed128bc8fe5cdfc8f85aaedea.jpg"
style="width: 300px; display: block; vertical-align: top; margin: 5px auto;
text-align: center;">
<p>Eight nine ten</p>
也许这可以通过正则表达式来实现,但我不是专家。
使用此问题获取 src 正则表达式以获取 C# 中图像的 SRC然后使用这个作为基本名称新的文件信息(路径(。名称与路径.获取文件名(路径(
所以它是"有点重复",但两个问题的组合代码可以完成你想要的。 一般来说,使用正则表达式来解析 HTML 并不是最好的主意,所以 HTML 可以构造很多东西,然后放在页面上,请务必测试您的所有定义。
我建议不要使用正则表达式,而是使用 html 敏捷包 https://html-agility-pack.net/
以下正则表达式来捕获带有图像元素扩展名的文件名
<imgs+.*?src=['"]?.*/(.*?..{3,4})['"]?
您也可以在以下链接中检查其匹配项
此正则表达式模式: ([^/]+jpg)
你可以检查:链接