我目前在我的网站的文本段落中有以下文本片段
let’s get to it
撇号字符是UTF-8字符集的一部分,它以的形式正确地保存在指定为VARCHAR列的表列中
let’s get to it
我的客户对其进行了正确的分析。如果我将相同的文本放入MySQL中的text列中,它存储如下:
let’s get to it.
两者有什么不同的原因吗?如果有,我该如何改变?
let’s
是Mojibake。Latin1正在悄悄进入。
"文本blob"--它是TEXT
还是BLOB
?它们是不同的数据类型。
CCD_ 4来源于CCD_。可以在VARCHAR
、TEXT
或BLOB
中存储和检索,而与CHARACTER SET
无关。MySQL不会转换为。
Mojibake可能来自
- 客户端中的字节以utf8正确编码(良好)
- 您连接了
SET NAMES latin1
(或set_charset('latin1')
或…),可能是默认情况。(应该是utf8
。) - 表中的列可能是
CHARACTER SET utf8
,也可能不是,但应该是