Python熊猫如何打印数据帧中的前10个最大值和最小值



如何只获取值最高的10项?以及价值最低的10项?我试过.max((,它只返回值在此处输入图像描述

import warnings
warnings.filterwarnings('ignore')
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt

df=df = pd.read_csv('steam55.csv')
df.head()
df.shape
df.describe()
df.dtypes
X = df[['genres']]
X = pd.get_dummies(data=X, drop_first=True)
X.head()
Y = df['c.owners']
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size=0.4, random_state=101)
print(X_train.shape)
print(X_test.shape)
print(y_train.shape)
print(y_test.shape)
from sklearn.linear_model import LinearRegression
model = LinearRegression()
model.fit(X_train,y_train)
coeff_parameter = pd.DataFrame(model.coef_,X.columns,columns=['Coefficient'])
coeff_parameter

coeff_parameter变量中存储的数据我试过

coeff_parameter.sort_values

但不起作用

coeff_parameter = pd.DataFrame(model.coef_,X.columns,columns=['Coefficient'].sort_values().head())

AttributeError:"list"对象没有属性"sort_values">

您应该真正利用搜索引擎并查看panda的文档。谷歌pandas sort_valuespandas nlargest会把你带到正确的地方。

看看熊猫。DataFrame.sort_values((,sort_values处理DataFrame对象,而不是列表对象。它使用方法参数中的ascending=True按deflut升序排序,这意味着越低的值索引越小。

coeff_parameter = pd.DataFrame(model.coef_,X.columns,columns=['Coefficient'])已经返回DataFrame对象。您所需要做的就是对这个coeff_parameter数据帧对象进行操作。

得到CCD_ 8的CCD_ 7的最大/最小值。您可以先对该列进行排序,然后从中提取第一个第n行,也可以只使用panda。DataFrame.nlargest((或pandas。DataFrame.nsmallst((.

coeff_parameter.nlargest(10)
coeff_parameter.nsmallest(10)
coeff_parameter.sort_values(['Coefficient']).head()
coeff_parameter.sort_values(['Coefficient']).tail()

coeff_parameter.nsmallest(n=10)

coeff_parameter.nlargest(n=10)

最新更新