i使用; prxparse("s/<[a-zA-Z/][^>]*>//")
清理我发现的绝大多数HTML标签的字符串。但是我需要添加一些东西以转换&amp;#8805,即是a&lt; =但其中&lt;在 - 在同一空间中。
我想将其转换为" le"或"&lt; =" ...我已经尝试了很多事情,但似乎没有任何事情。我以正则表达方式很新,所以如果外面有人可以提供帮助,这将不胜感激。
只要这是普通文本html,您就可以使用
s/≥/ LE /
什么都没有是正则表达式。
可能需要在LE周围的空间。完全在SAS中:
data test;
format htmlcode $15.;
input htmlcode $;
html_parsed = prxchange('s/≥/ LE /',-1,htmlcode);
put _all_;
datalines4;
x≥15
x ≥ 15
;;;;
run;