我有一个数据帧,它的列是具有级别的多索引
[['a','b'],['one','two']]
我有另一个数据帧,它的列是具有级别的多索引
[['c'],['one','two']]
我想以自然的方式合并这些多个索引,使其具有级别
[['a','b','c'], ['one', 'two']]
我尝试了大约100种方法,从联接、合并、set_names、set_index、concats和重命名级别以及提供键、名称和标签,但我不知道自己做错了什么。这似乎是一件很自然的事情。我知道一定有一个简单的方法可以做到这一点。我基本上是在索引树中添加一个分支。
这实际上只是一个concat。
In [14]: arrays = [['bar', 'bar', 'baz', 'baz'],['one', 'two', 'one', 'two']]
In [15]: tuples = list(zip(*arrays))
In [16]: index1 = pd.MultiIndex.from_tuples(tuples, names=['first', 'second'])
In [17]: arrays = [['foo', 'foo', 'qux', 'qux'],['one', 'two', 'one', 'two']]
In [18]: tuples = list(zip(*arrays))
In [19]: index2 = pd.MultiIndex.from_tuples(tuples, names=['first', 'second'])
In [21]: df1 = pd.DataFrame(np.random.randn(4,4), columns=index1)
In [23]: df2 = pd.DataFrame(np.random.randn(4,4), columns=index2)
In [25]: pd.concat([df1, df2], axis=1)
Out[25]:
first bar baz foo qux
second one two one two one two one
0 0.192217 -1.392671 1.229953 0.558334 -0.908125 0.934284 -1.240591
1 0.816492 -0.157933 0.058365 -1.115411 -0.488677 0.204860 -0.268372
2 -0.160077 -1.825912 0.615397 0.570057 -0.699260 -0.552970 0.056875
3 1.308078 0.018694 1.047227 1.047585 0.172404 0.861871 0.569599
first
second two
0 -2.234618
1 -1.604534
2 0.151859
3 0.522803