我正在尝试上传一个包含多种语言和多个字符的列的 csv。一旦它们被暂存,我不确定选择或搜索该列的最佳方法。
这是几行csv的示例,为格式错误表示歉意,我无法共享数据,但它的相似之处如下:
+----+--------------+-----------+----------------------------------------------------------------------+
| id | username | tweet_id | tweet_content |
+----+--------------+-----------+----------------------------------------------------------------------+
| 03 | generationz | 123345 | "toto je nejlepší zpětná vazba na světě" |
| 04 | generationz | 122334 | "¿Dónde está el mejor lugar para comer? estoy realmente hambriento" |
+----+--------------+-----------+----------------------------------------------------------------------+
如果要在此列上搜索此数据,则可以使用特殊字符进行的最佳转换或索引是什么?
几个想法:使用 TRANSLATE(( 有效地替换或消除不需要的字符。 更好的是,为不区分重音的比较配置表排序规则。