我导入了一个CSV文件,其中包括grad_year,grad_major,grad_gender,gpa等毕业生数据...
目标是找到毕业生最初申报的专业和完成课程后毕业生的专业相同的所有情况(分别为original_major和grad_major(
我想我已经做对了,但我不确定我是否会使用以下代码计算空值,如果可能的话,我想从计数中删除空值
import pandas as pd
grads_df = pd.read_csv('Users/Sas0908/Downloads/grads.csv')
major_same = (grads_df['original_major'] == grads_df['grad_major']).sum()
您可以使用nansum而不是sum(https://docs.scipy.org/doc/numpy-1.15.0/reference/generated/numpy.nansum.html(
import pandas as pd
import numpy as np
grads_df = pd.read_csv('Users/Sas0908/Downloads/grads.csv')
major_same = np.nansum((grads_df['original_major'] == grads_df['grad_major']))