HTML字符集窗口1255工作,但utf-8



我写了一个显示希伯来语/英语混合内容的html页面。它可以很好地与字符集"窗口-1255"

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN""http://www.w3.org/TR/html4/loose.dtd">
<html dir="rtl" lang="he">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=windows-1255">

,但我想如果他们的机器不支持希伯来语,人们会有麻烦的。我把字符集改为utf-8,得到了

HTML:

 meta http-equiv="Content-Type" content="text/html; charset=utf-8"

视图:

"��� ��� ������, ��� ����� �����, �� ������ ���� ��� ���� �� ������"
Read zohar ��� ����
....

utf-8不是应该比windows 1255支持更多的字符吗?

我想当您更改标记时,您没有告诉编辑器将文件转换为UTF-8。因此,该文件仍然是Windows-1255格式,但浏览器试图将其读取为UTF-8格式,因此会出现错误/无法读取的字符。

我不知道你使用的是哪种编辑器,所以我不能告诉你如何将其置于UTF-8模式。请尝试在选项中查找有关要使用的角色集的设置。或者,在Windows记事本中打开文件,保存时,确保从保存按钮旁边的下拉框中选择"Codepage:UTF-8"。

与Unicode 的关系

Unicode希伯来语块(U+0590–U+05FF)遵循Windows-1255,将字母和元音点编码在与Windows-1255相同的相对位置。Unicode在较低位置对摇摆标记进行编码方面走得更远。Unicode希伯来语总是按逻辑顺序排列。

对于现代应用程序,UTF-8或UTF-16是首选编码。

来源:http://en.wikipedia.org/wiki/Windows_1255

在我看来,如果您的字符在Unicode希伯来语块内,那么您的编码应该仍然有效。

最新更新