我从Python开始。我想创建一个新的数组,它将包含数据帧中一列中存储的所有单词。
此列已包含包含单词的数组:
这里有一个例子:
df['Body_A'].values[0]
输出:
['p','open','terminal','application','gt','utility','gt',"terminal"、"type"、"p"、"pre"、"code"、"locate",'insertfonthere','br','code','pre','p','sput','every','file','p','p:,'warning','may','alot','wade','p']
我已经尝试过存储所有这样做的东西:
rows = []
[rows + row['Body_A'] for index, row in df.iterrows()]
我的想法是将数据帧中每一行的值存储在一个新的数组行中。
但当我想打印行时:
print(rows)
它还给我一个空位。我没有意识到我做错了什么可以告诉我更多?
您可以使用嵌套列表理解来平面化列表
df = pd.DataFrame({"a":[['Hello', 'I', 'am', 'fine'], ['How', 'are', 'you', '?']]})
flat_list = [item for sublist in df['a'] for item in sublist]
df::
a
0 [Hello, I, am, fine]
1 [How, are, you, ?]
输出:
['Hello', 'I', 'am', 'fine', 'How', 'are', 'you', '?']