当页面以其他方式编码为 UTF-8 时,像 ø 这样的 ISO-8858-1 实体是否表示'ø'有效?



假设我们有一个网站,它返回一个HTTP报头,像这样:

text/html; charset=utf-8

(编辑过的)来源包含:

<title>Weird char: &#248;</title>
<meta charset="utf-8" />

是有效的HTML吗?这显然是一个UTF-8编码的页面,&#248;ø(也称为&oslash;)的ISO-8851-1实体。

我不是在问是否使用&oslash;或甚至原始的utf -8编码的ø会更好(它会)-但我在问HTML实体&#248;是否在utf -8编码的页面上有效。

Chrome和Firefox都可以正常显示页面,https://validator.w3.org也没有问题。

Unicode是Latin-1的超集(Latin-1是ASCII的超集)(用于数字值到grapheme的关系)。因此,ASCII和Latin1的每个码点在unicode中都保持相同的码点,因此您可以使用相同的结构和相同的值。

但这只适用于Latin1和ASCII

相关内容

  • 没有找到相关文章