我正在尝试为不同的领域计算斜度和峰度。我想进入每个字段名称的最终表。峰度和偏度。 为此,我编写了下一个代码:
for i in data_dis.columns:
print('skewness',i,':',i.skew())
print('Kurtosis',i,':',i.kurtosis())
属性错误:"str"对象没有属性"倾斜">
我 100% 确定我的数据库中没有字符串,您可以从信息中看到:
data_dis.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1412 entries, 0 to 1411
Data columns (total 13 columns):
HR90 1412 non-null float64
HC90 1412 non-null float64
PO90 1412 non-null int64
RD90 1412 non-null float64
PS90 1412 non-null float64
UE90 1412 non-null float64
DV90 1412 non-null float64
MA90 1412 non-null float64
POL90 1412 non-null float64
DNL90 1412 non-null float64
BLK90 1412 non-null float64
GI89 1412 non-null float64
FH90 1412 non-null float64
我看到倾斜在这里起作用: http://www.christianherta.de/lehre/dataScience/exploratory/intro-explorative-data-analysis.php
我的最终目标是创建一个表,其中包含每个字段的偏度和峰度数据。
您不需要 for 循环,您可以使用数据帧方法计算每个数字列的偏度和峰度:
data_dis.skew()
data_dis.kurtosis()
它们都返回一个 Pandas 系列,其中索引分别列名和列偏度和列峰度作为值。
请注意,data_dis.columns
提供列名,而不是值。