我有一个.txt文件,需要将其转换为CSV
这是我用来转换文件的代码:
import pandas as pd
wb = pd.read_csv('12.txt', encoding='utf-8', delimiter = '،', header = None)
wb.to_csv('12.csv',encoding='utf-8-sig', index = None)
问题是,在每一行中,第一个和第二个单词都需要在单独的单元格中,但它们没有用逗号分隔:
This is an, example, to show, you
The second line, is, the, same
My file contains, thousands of, sentences
如示例所示,每行只有第一个和第二个单词应该在单独的单元格中(其他单元格可能包含多个单词!(。如何使用Python在每行的第一个和第二个单词后面只添加逗号?
感谢
我会在这里使用str.replace
:
wb['col'] = wb['col'].str.replace('^(S+) (S+)', '1, 2,')
如果你想让每个单词都在不同的单元格中,你可以对每一行应用以下内容:
line = "This is an, example, to, show, you"
split = line.split(",")
x = [item for sublist in [k.split(" ") for k in s] for item in sublist]
y = list(filter(lambda x: x != "", x))
output: ['This', 'is', 'an', 'example', 'to', 'show', 'you']