PC-DOS vs MS-DOS vs Windows 多语言文本文件



我所知,1987年PC-DOS 3.3和MS-DOS 3.3发布,它们有几个代码页(850,860,863,865(。

这是否意味着用户可以在一个文件中使用葡萄牙语(cp860(和北欧(cp865(符号编写文本?

或者它类似于每个操作系统一个代码页。例如,葡萄牙的PC-DOS只有860个代码页,用户只能使用该代码页中的符号,而来自斯堪的纳维亚的PC-DOS只有865个代码页。

关于Windows的相同问题。从哪个版本开始支持多语言文本文档?

DOS对代码页并不真正了解。它们只是 ASCII 字符串(以零或美元终止(。

代码页

主要用于显示:更改代码页,它将更改字节码在屏幕上的打印方式。

你在这里描述的,是一个常见的问题:在一个文本中混合编码。如果你足够大,你会记得网络上很多这样的问题。文本文件没有关于代码页的标记或元数据。如果混合它,则只会根据活动代码页看到字符。你改变屏幕的代码页,你会得到一个新的字符解释。

您可以在自己的文件中执行任何操作。它正在传达如何向其他人阅读它,这将是一个问题。

所以,不,不是真的。在一个文件中使用多个字符编码并将其称为文本文件将比它的价值更麻烦。

操作系统的设置与文件的内容没有直接关系。在系统之间交换文件(例如通过 Internet(的程序可能会了解源字符编码和字符编码的本地设置,并执行有损转码。

除了 25 多年前 Unicode 的出现之外,没有任何变化,一个字符集中可用的脚本比您想象的要多。 因此,如果要进行任何转码,理想情况下,它只会是 UTF-8。

最新更新