用于从 html 代码的 img 标签获取文件名的正则表达式



我想从包含html代码的字符串中检索图像(img标签(的文件名。

下面的示例:包含 2 个 img html 标记的字符串(html 代码(。需要获取图像的文件名(不是完整的 url(。

<p>One two thre four</p>
<img src="http://localhost:5000/uploads/360e2b55a984178fd102a6cff9d70bc943936461.jpg" 
style="width: 300px; display: block; vertical-align: top; margin: 5px auto; 
text-align: center;">
<p>Five six seven</p>
<img src="http://localhost:5000/uploads/a77381fa354a067ed128bc8fe5cdfc8f85aaedea.jpg" 
style="width: 300px; display: block; vertical-align: top; margin: 5px auto; 
text-align: center;">
<p>Eight nine ten</p>

也许这可以通过正则表达式来实现,但我不是专家。

使用此问题获取 src 正则表达式以获取 C# 中图像的 SRC然后使用这个作为基本名称新的文件信息(路径(。名称与路径.获取文件名(路径(

所以它是"有点重复",但两个问题的组合代码可以完成你想要的。 一般来说,使用正则表达式来解析 HTML 并不是最好的主意,所以 HTML 可以构造很多东西,然后放在页面上,请务必测试您的所有定义。

我建议不要使用正则表达式,而是使用 html 敏捷包 https://html-agility-pack.net/

您可以使用

以下正则表达式来捕获带有图像元素扩展名的文件名

<imgs+.*?src=['"]?.*/(.*?..{3,4})['"]?

您也可以在以下链接中检查其匹配项

您可以使用

此正则表达式模式: ([^/]+jpg)

你可以检查:链接

最新更新