我有一个名为关键字的美丽汤标签,当我使用keyword.decode(formatter=None)
要获取 html 文本,我得到了这个
<pre><span id="VAL(<>)"><span class="keyword">val</span> (<>)</span> : <code class="type">'a -> 'a -> bool</code></pre>
但是原始的html文本是
<pre><span id="VAL(<>)"><span class="keyword">val</span> (<>)</span> : <code class="type">'a -> 'a -> bool</code></pre><div class="info ">
您可以看到<>
已转换为<>
。我只希望文本与原始 html 文件中的文本完全相同。那么如何防止这种转换呢?
我认为它在原文中缺少一些东西
<pre><span id="VAL(<>)"><span class="keyword">val</span> <span>(<>)</span> : <code class="type">'a -> 'a -> bool</code></pre><div class="info ">
<span>(<>)</span>
或者它有一个额外的
</span>
与其使用 formatter=None
,顺其自然。美丽汤不会转换它。
>>> soup.prettify(formatter=None)
u'<pre>n <span id="VAL(<>)">n <span class="keyword">n valn </span>n (<>)n </span>n :n <code class="type">n 'a -> 'a -> booln </code>n</pre>n<div class="info ">n</div>'
>>> soup
<pre><span id="VAL(<>)"><span class="keyword">val</span> (<>)</span> : <code class="type">'a -> 'a -> bool</code></pre><div class="info ">
</div>
>>> soup.prettify()
u'<pre>n <span id="VAL(<>)">n <span class="keyword">n valn </span>n (<>)n </span>n :n <code class="type">n 'a -> 'a -> booln </code>n</pre>n<div class="info ">n</div>'