假设我们有一个网站,它返回一个HTTP报头,像这样:
text/html; charset=utf-8
(编辑过的)来源包含:
<title>Weird char: ø</title>
<meta charset="utf-8" />
是有效的HTML吗?这显然是一个UTF-8编码的页面,ø
是ø
(也称为ø
)的ISO-8851-1实体。
我不是在问是否使用ø
或甚至原始的utf -8编码的ø
会更好(它会)-但我在问HTML实体ø
是否在utf -8编码的页面上有效。
Chrome和Firefox都可以正常显示页面,https://validator.w3.org也没有问题。
Unicode是Latin-1的超集(Latin-1是ASCII的超集)(用于数字值到grapheme的关系)。因此,ASCII和Latin1的每个码点在unicode中都保持相同的码点,因此您可以使用相同的结构和相同的值。
但这只适用于Latin1和ASCII