如何防止美丽汤转换实体



我有一个名为关键字的美丽汤标签,当我使用keyword.decode(formatter=None)要获取 html 文本,我得到了这个

<pre><span id="VAL(<>)"><span class="keyword">val</span> (<>)</span> : <code class="type">'a -> 'a -> bool</code></pre>

但是原始的html文本是

<pre><span id="VAL(<>)"><span class="keyword">val</span> (&lt;&gt;)</span> : <code class="type">'a -> 'a -> bool</code></pre><div class="info ">

您可以看到&lt;&gt;已转换为<>。我只希望文本与原始 html 文件中的文本完全相同。那么如何防止这种转换呢?

我认为它在原文中缺少一些东西

<pre><span id="VAL(<>)"><span class="keyword">val</span> <span>(&lt;&gt;)</span> : <code class="type">'a -> 'a -> bool</code></pre><div class="info ">
<span>(&lt;&gt;)</span>

或者它有一个额外的

 </span>

与其使用 formatter=None ,顺其自然。美丽汤不会转换它。

>>> soup.prettify(formatter=None)
u'<pre>n <span id="VAL(<>)">n  <span class="keyword">n   valn  </span>n  (<>)n </span>n :n <code class="type">n  'a -> 'a -> booln </code>n</pre>n<div class="info ">n</div>'
>>> soup
<pre><span id="VAL(&lt;&gt;)"><span class="keyword">val</span> (&lt;&gt;)</span> : <code class="type">'a -&gt; 'a -&gt; bool</code></pre><div class="info ">
</div>
>>> soup.prettify()
u'<pre>n <span id="VAL(&lt;&gt;)">n  <span class="keyword">n   valn  </span>n  (&lt;&gt;)n </span>n :n <code class="type">n  'a -&gt; 'a -&gt; booln </code>n</pre>n<div class="info ">n</div>'

相关内容

  • 没有找到相关文章

最新更新