在熊猫系列中添加NaN时,保留bools和float之间的区别



我正在通过Series#append方法向Panda Series添加数据。不幸的是,当nan添加到bool系列时,它会自动转换为float系列。是否有任何方法可以避免这种转换,或者至少将其强制为objectdtype,以保留bools和floats之间的区别?

>>> Series([True])                            
0    True
dtype: bool
>>> Series([True]).append(Series([np.nan]))
0     1
0   NaN
dtype: float64

正如@Jeff所说,最好的方法是用object dtype 附加一个Series

以下是使用Series 的示例

s = Series([True])
s.append(Series([nan], index=[1], dtype=object))

产生

0    True
1     NaN
dtype: object

还有一个带有DataFrame:

df = DataFrame({'a': rand(10) > 0.5, 'b': randn(10)}, columns=list('ab'))
df2 = DataFrame({'a': Series([nan], dtype=object), 'b': [1.0]}, columns=df.columns, index=[len(df)])
df3 = df.append(df2)
print df3
print
print df3.dtypes

它给出

        a      b
0   False -0.865
1    True -0.186
2    True  0.078
3    True  0.995
4   False -1.420
5    True -0.340
6    True  0.042
7    True -0.627
8    True -0.217
9    True  1.226
10    NaN  1.000
a     object
b    float64
dtype: object

它看起来有点笨拙,但如果你已经有了Series,那么你可以在添加之前执行s.astype(object)将它们转换为objectdtype

最新更新