我有这样的文本:
text = ["A/abc","B/abd","C/abc","D/xyz"]
我想要的输出是
mylist1 = ["A","C"]
mylist2 = ["B"]
mylist3 = ["D"]
我正在寻找的唯一标签是"/abc"和"/abd"
现在我拥有的是:
def searchWord(segment):
word_tag = segment.split('/')
if re.finditer('ab',word_tag[1]):
if re.finditer('abc',word_tag[1]):
letter = word_tag[0]
mylist1 = letter
else:
letter = word_tag[0]
mylist2 = letter
else:
letter = word_tag[0]
mylist3 = letter
return mylist1
return mylist2
return mylist3
mylist1,mylist2,mylist3 = [searchWord(segment) for segment in text]
它似乎工作正常,但抛出异常:
ValueError: too many values to unpack.
我的"文本"列表相当大,这可能是问题所在吗?在为此过程构建函数之前,我没有遇到此问题。
谢谢!
将列表作为元组返回:
return mylist1, mylist2, mylist3
Python 不会执行所有三个return
语句,只执行第一个语句。
如果您尝试将项目分类到不同的类别中,通常使用字典:
buckets = {'abc': [], 'abd': [], 'xyz': []}
for segment in text:
item, tag = segment.split('/', 1)
buckets[tag].append(item)
然后,您仍然可以将这三个列表提取为 3 个变量,但您也可以直接引用存储桶。例如,您可以引用buckets['abc']
,而不是mylist1
。
你的问题
您确实应该包含完整的堆栈跟踪,但在这种情况下,很容易推断出mylist1,mylist2,mylist3 = [searchWord(segment) for segment in text]
是有问题的行,因为列表推导返回超过 3 个值,因此您不能将它们仅分配给 3 个变量。但是代码中的问题是您尝试多次return
。
return mylist1
return mylist2
return mylist3
一个函数只能有 1 个返回值,所以你应该把它改成这样:
return (mylist1, mylist2, mylist3)
一个解决方案
在查看您的代码并看到您的愿望之后。我为您修复了它:
def catagorize(data):
container = [[],[],[]]
for segment in data:
searchWord(segment, container)
return container
def searchWord(segment, container):
letter, tag = segment.split('/')
if tag == 'abc':
container[0].append(letter)
elif tag == 'abd':
container[1].append(letter)
elif tag == 'xyz':
container[2].append(letter)
else:
raise ValueError('unknown tag')
运行代码:
>>> text = ["A/abc","B/abd","C/abc","D/xyz"]
>>> mylist1, mylist2, mylist3 = catagorize(text)
>>> print mylist1, mylist2, mylist3
['A', 'C'] ['B'] ['D']
另一种解决方案
更强大的解决方案:
from collections import defaultdict
def catagorize(data):
container = defaultdict(list)
for letter, tag in (segment.split('/') for segment in data):
container[tag].append(letter)
return container
在行动中:
>>> catagorize(["A/abc","B/abd","C/abc","D/xyz"])
defaultdict(<type 'list'>, {'xyz': ['D'], 'abc': ['A', 'C'], 'abd': ['B']})
仅执行第一个return
。 return
返回答案,并将控件返回给调用方。之后的任何返回都不会运行。
因此,您不会按预期返回三个项目,而只返回 mylist 的内容(这显然不是三个项目列表)。
你想要什么:
return (mylist1, mylist2, mylist3)