我正在设计一个API,它将URL作为输入,并读取该URL中的内容。当URL是"file:"协议时,字符编码的默认值会更好吗?
- 系统的本机编码
- UTF-8
API允许显式设置。此外,我们可以使用一些启发式方法来确定字符编码,比如BOM(如果可用),但当所有这些都失败时,默认值应该是什么?
据我所知,标准在这个问题上是沉默的。在其他条件相同的情况下,我希望正确的事情经常发生在那些甚至不知道有字符编码这回事的人身上。
如果可能,请始终使用UTF-8,并将其记录在API文档中。UTF-8是一个坚如磐石的编码标准,非常经得起未来的考验-我会通过支持其他编码来避免为自己产生潜在的工作-如果您将API迁移到可以通过Web服务访问的方式使用,UTF-8也将很容易使用。