我有一个文本假设'this is my a,b,c,and d.'
我想要一个与文本对应的列表
['this',' ','is',' ',my,' ','a',',','b',',','c',' ','and',' ','d','.']
。
当前的split()方法消除了用于拆分的元素,并且不支持多个拆分参数。
我想要一个列表,从一个字符串拼接关于特殊字符,包括在列表中的特殊字符。最简单的方法是什么?
可以找到所有连续的单词字符和非单词字符。结果如下:
data = 'this is my a,b,c,and d.'
import re
print re.findall(r"w+|W+", data)
# ['this', ' ', 'is', ' ', 'my', ' ', 'a', ',', 'b', ',', 'c', ',', 'and', ' ', 'd', '.']