这里是初学者,希望得到一些帮助。
我有一个很大的数据集,包含Int和Float字段,其中有几个包含NaN值。
当最初从csv导入时,序列被归类为对象,因此使用以下内容转换为浮动:
data['bu'] = pd.to_numeric(data['bu'], errors='coerce').astype('float')
现在,用平均值填充NaN值。正在尝试此代码:
num_bu = data['bu'].dropna()
mean_bu = sum(num_bu) / len(num_bu)
我得到了这个错误:
TypeError Traceback(最后一次调用(在里面5#num_bu6.---->7 mean_bu=sum(num_bu(/len(num_bu(8.9均值_bu
TypeError:"NAType"对象不可调用
我原以为dropna会解决这个问题,但我被难住了。你知道我做错了什么吗?
继续编辑。。。不确定这是否是我的问题所在。注意数据类型为:
pandas.core.series.系列
已经尝试过将此代码更改为Int或Float(取决于列(:
data["age"]= data["age"].astype('Int64')
当我在这之后检查类型时,仍然说它是:pandas.core.series.系列
奇怪的是,当我检查数据帧上的数据类型时,这些类型看起来都是正确的(都是Int或Float(
不知道我做错了什么:/
一切都很好。。。。更改为系列功能并工作。