如何修复从熊猫数据帧运行回归时"ValueError: could not convert string to float"?



我已经查看了Stack Overflow,不幸的是,现有的答案对我没有帮助。

我的代码如下:

def regress(data1, data2, data3, data4):
df = insert_worldbankdata(data1, data2, data3, data4) 
X = df['Women in Parliament (%)'], df['Inflation (%)'], df['Individuals using Internet (%)']
y = df['Annual Mean Sat.']
regr = linear_model.LinearRegression()
regr.fit(X, y)
model = sm.OLS(y, X).fit()
predictions = model.predict(X) 
print_model = model.summary()
return print_model 

它返回以下错误:ValueError:无法将字符串转换为浮点值:

我尝试过的例子有:

map(float, x)
df['VARIABLE'] = df['VARIABLE'].astype(float)

以及替换功能。

我真的很感激任何帮助。在过去的几天里,我一直在努力弄清楚这一点,并浏览Stack Overflow档案。

谢谢!

检查列的值,它们应该采用以下格式"10.5674">

因此,您必须删除所有其他字符以避免此错误。此外,你必须删除所有的"nan"empty"。。。字符串。它们将导致相同的错误。

相关内容

最新更新