从Dataframe组件创建一个数组



我从Python开始。我想创建一个新的数组,它将包含数据帧中一列中存储的所有单词。

此列已包含包含单词的数组:

这里有一个例子:

df['Body_A'].values[0]

输出:

['p','open','terminal','application','gt','utility','gt',"terminal"、"type"、"p"、"pre"、"code"、"locate",'insertfonthere','br','code','pre','p','sput','every','file','p','p:,'warning','may','alot','wade','p']

我已经尝试过存储所有这样做的东西:

rows = []
[rows + row['Body_A'] for index, row in df.iterrows()]

我的想法是将数据帧中每一行的值存储在一个新的数组行中。

但当我想打印行时:

print(rows)

它还给我一个空位。我没有意识到我做错了什么可以告诉我更多?

您可以使用嵌套列表理解来平面化列表

df = pd.DataFrame({"a":[['Hello', 'I', 'am', 'fine'], ['How', 'are', 'you', '?']]})
flat_list = [item for sublist in df['a'] for item in sublist] 
df::
a
0   [Hello, I, am, fine]
1   [How, are, you, ?]

输出:

['Hello', 'I', 'am', 'fine', 'How', 'are', 'you', '?']

最新更新