当我运行代码时,出现错误:
名称错误: 未定义名称"df_test"
我在另一台计算机上没有收到此错误,但在新计算机上我会收到此错误。我认为这与全局变量和局部变量有关,但这很奇怪,因为在第二个单元格中创建的变量实际上在第三个单元格中使用,问题发生在第四个单元格中。
我尝试声明全局,然后是第一个单元格中的变量,这不起作用。在第三个单元格中执行此操作确实有效。但我不想继续这样做,因为我从另一台计算机上知道这是不正常的。
### cell 1
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split,cross_val_score,ShuffleSplit
import os
import scipy
### cell 2
df=pd.read_csv("pandas2.txt",sep=';').drop('listened',axis=1).drop('Usercount',1)
temp_u=df['User'].unique()
temp_s=df['Song'].unique()
avg=df['rating'].mean()
### cell 3
lamda=0.05
gamma=0.04
m=128
splits=20
df_train,df_test=train_test_split(df,test_size=0.1, random_state=1)
beta_u=pd.DataFrame(temp_u,columns=['User'])
beta_s=pd.DataFrame(temp_s,columns=['Song'])
beta_u['beta_u']=0
beta_s['beta_s']=0
for chunk in np.array_split(df_train, splits):
x=chunk.merge(beta_u, on='User',how='left').merge(beta_s,on='Song',how='left')
x['pred']=avg+x['beta_u']+x['beta_s']+(x[pnames]*x[qnames]).sum(axis=1)
x['gradu']=gamma*(x['rating']-x['pred']-lamda*x['beta_u'])
beta_u=beta_u.merge(x[['User','gradu']].groupby('User').mean(),on='User',how="left").groupby('User').mean().fillna(0)
beta_u['beta_u']+=beta_u['gradu']
beta_u=beta_u.drop(['gradu'],axis=1)
x['grads']=gamma*(x['rating']-x['pred']-lamda*x['beta_s'])
beta_s=beta_s.merge(x[['Song','grads']].groupby('Song').mean(),on='Song',how="left").fillna(0)
beta_s['beta_s']+=beta_s['grads']
beta_s=beta_s.drop(['grads'],axis=1)
x[pgrad]=(x[qnames].multiply(x['rating']-x['pred'], axis="index")+np.array(x[qnames]**2)*np.array(x[pnames]))#.divide((x[qnames]*x[qnames]).sum(axis=1),axis=0)
beta_u=beta_u.merge(x[['User']+pgrad].groupby('User').mean(),on='User',how="left").fillna(0)
beta_u[pnames]=beta_u[pgrad]#np.array(beta_u[pnames])+np.array(beta_u[pgrad])
beta_u[pnames]=np.where(beta_u[pnames]>0,beta_u[pnames],10**(-6))
beta_u=beta_u.drop(pgrad,1)
x[qgrad]=(x[pnames].multiply(x['rating']-x['pred'], axis="index")+np.array(x[pnames]**2)*np.array(x[qnames]))#.divide((x[pnames]*x[pnames]).sum(axis=1),axis=0)
beta_s=beta_s.merge(x[['Song']+qgrad].groupby('Song').mean(),on='Song',how="left").fillna(0)
beta_s[qnames]=beta_s[qgrad]#np.array(beta_s[qnames])+np.array(beta_s[qgrad])
beta_s[qnames]=np.where(beta_s[qnames]>0,beta_s[qnames],10**(-6))
beta_s=beta_s.drop(qgrad,1)
x=df_test.merge(beta_u, on='User',how='left').merge(beta_s,on='Song',how='left').fillna(0)
x['pred']=x['beta_u']+x['beta_s']+avg+(np.array(x[pnames])*np.array(x[qnames])).sum(axis=1)
x['pred2']=np.where(x['pred']>0.5,1,0)
RMSE=np.mean((x['rating']-x['pred'])**2)
RMSE2=np.mean((x['rating']-x['pred2'])**2)
print(RMSE)
print(RMSE2)
### cell 4
t=len(df_test)
sim_Song=pd.DataFrame(scipy.sparse.load_npz('simUser.npz').todense())
sim_Song.index=pd.read_csv('Itemnames.csv',sep=';')['Song']
sim_Song.columns=pd.read_csv('Itemnames.csv',sep=';')['Song']
beta_s=beta_s.set_index('Song')
名称错误: 未定义名称"df_test">
当global df_train, df_test, df, x, beta_s, beta_u
放在单元格 3 的顶部时,它可以正常工作
不知何故,问题%%time
.如果我突然删除它,一切正常。