SAS 中的正则表达式将 <= 转换为 #8805 到 LE



i使用; prxparse("s/<[a-zA-Z/][^>]*>//")清理我发现的绝大多数HTML标签的字符串。但是我需要添加一些东西以转换&amp;#8805,即是a&lt; =但其中&lt;在 - 在同一空间中。

我想将其转换为" le"或"&lt; =" ...我已经尝试了很多事情,但似乎没有任何事情。我以正则表达方式很新,所以如果外面有人可以提供帮助,这将不胜感激。

只要这是普通文本html,您就可以使用

s/&#8805;/ LE /

什么都没有是正则表达式。

可能需要在LE周围的空间。

完全在SAS中:

data test;
format htmlcode $15.;
input htmlcode $;
html_parsed = prxchange('s/&#8805;/ LE /',-1,htmlcode);
put _all_;
datalines4;
x&#8805;15
x &#8805; 15
;;;;
run;

最新更新