无法理解的字符串编码python



我失去了字符串编码,我有一个法国城市的CSV文件,某些城市有特殊字符,如:ç和è,所以我得到了一些很多字符串,如Péron, SaôneÉtienne,我尝试了两种编码utf-8和latin-1,没有积极的结果。

import pandas as pd
df = pd.read_csv('villes_france.csv', encoding='latin-1')
print(df.head(10))

所以这里的基本问题是你不知道使用的编码。在这种情况下,您可以使用chardet命令行工具。通过在终端中执行pip install chardet,然后在终端cd中执行chardetect villes_france.csv

来安装它。

最新更新