这是我要导入的数据的链接。文件为.data,.names和.lisp。如何将它们导入Python作为数据框架?我尝试了:
df = pd.read_table('http://archive.ics.uci.edu/ml/machine-learning-databases/credit-screening/crx.data', sep='')
以及pd.read_csv()
,但由于文件不是CSV,因此不起作用。感谢您的帮助!
使用read_table
时需要定义分离器。在这种情况下,您的列被,
分开。您还应该设置header=None
,因为数据文件不包含标头(列名)。尽管read_table
可能有效,但现在已弃用,因此您可以使用read_csv
。
import pandas as pd
df = pd.read_csv(
'http://archive.ics.uci.edu/ml/machine-learning-databases/credit-screening/crx.data',
sep=',',
header=None
)
print(df)
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
0 b 30.83 0.000 u g w v 1.250 t t 1 f g 00202 0 +
1 a 58.67 4.460 u g q h 3.040 t t 6 f g 00043 560 +
2 a 24.50 0.500 u g q h 1.500 t f 0 f g 00280 824 +
3 b 27.83 1.540 u g w v 3.750 t t 5 t g 00100 3 +
4 b 20.17 5.625 u g w v 1.710 t f 0 f s 00120 0 +
5 b 32.08 4.000 u g m v 2.500 t f 0 t g 00360 0 +
6 b 33.17 1.040 u g r h 6.500 t f 0 t g 00164 31285 +
7 a 22.92 11.585 u g cc v 0.040 t f 0 f g 00080 1349 +
...
[690 rows x 16 columns]