如何在python中添加Stata/CSV文件的两列



我有一个CSV文件,有两列(permn_adj和publn_year(,我想把它们组合起来,但不知道怎么做。

我正在使用的代码:

patents = pd.read_csv('E:/Work/file.csv')
patents = patents[['publn_nr', 'permno_adj', 'publn_year', 'IPC1']].dropna().drop_duplicates().reset_index(drop=True)
patents = patents[(patents['publn_year'] >= 1980) & (patents['publn_year'] < 2016)].reset_index(drop=True)
print(patents)

我当前得到的输出I:

publn_nr permno_adj  publn_year  IPC1
0            1830    US4060B        2005  F16F
1           24429    US4060A        2004  B29C
2           24943     US1794        2006  C08J
3           26115  US133366B        1999  A61B
4           31737    US4060A        2004  C08F

我正在寻找的输出是类似于";US4060B2005";

您可以像字符串一样进行连接

patents['new_column'] = patents['permno_adj'].astype(str) + patents['publn_year'].astype(str)

遵循assign函数熊猫分配

d = {'col1': ['c11', 'c12'], 'col2': ['c21', 'c22']}
df = pd.DataFrame(d)
df = df.assign(col3=df['col1'] + df['col2'])
df
col1 col2    col3
0  c11  c21  c11c21
1  c12  c22  c12c22

相关内容

  • 没有找到相关文章

最新更新