我有一个数据集,其中一些样本标识符(在索引列中找到(可以解释为数字。 示例:20010104123140E5 和 2001010412314529。我尝试指定索引列具有字符串类型,但pandas.read_csv坚持将标识符转换为浮点数。请参阅下面的示例。
有谁知道我该如何解决这个问题?还是我在这里做错了什么?
import pandas as pd
with open('test.data', mode = 'w') as infile:
infile.write('idtvaln20010104123140E5t1n2001010412314529t2')
df = pd.read_csv('test.data', dtype = {'id':'str', 'val':'float'}, sep='t', index_col='id')
print(df)
使用 df.index = df.index.astype(str(