如何拆分具有多个拆分参数并包含拆分元素的句子



我有一个文本假设'this is my a,b,c,and d.'

我想要一个与文本对应的列表

['this',' ','is',' ',my,' ','a',',','b',',','c',' ','and',' ','d','.']

当前的split()方法消除了用于拆分的元素,并且不支持多个拆分参数。

我想要一个列表,从一个字符串拼接关于特殊字符,包括在列表中的特殊字符。最简单的方法是什么?

可以找到所有连续的单词字符和非单词字符。结果如下:

data = 'this is my a,b,c,and d.'
import re
print re.findall(r"w+|W+", data)
# ['this', ' ', 'is', ' ', 'my', ' ', 'a', ',', 'b', ',', 'c', ',', 'and', ' ', 'd', '.']

最新更新