在 Python 中处理 Unicode 范围



我正在尝试测试给定的字符串是否在片假名范围内。

我尝试了这里提出的解决方案:用于正则表达式的 Python 和 Unicode 块。但是,我的输出仍然是"无"。 我在这里错过了什么?

#!/usr/bin/env python
# -*- coding: utf-8 -*-
import re
print re.search(u'[u30A0-u30FF]', u'カタカ')

你的问题是你使用的是Windows。您指定源文件为 UTF-8,但 Windows 不使用 UTF-8 - 它使用各种代码页,具体取决于 Windows 本身的语言版本和设置。

许多编辑器都有办法覆盖 Windows 代码页并将文件另存为 UTF-8。例如,记事本在"另存为"对话框中有一个Encoding列表。

最新更新