太多的值,无法使用 python 中的函数解压缩



我有这样的文本:

text = ["A/abc","B/abd","C/abc","D/xyz"]

我想要的输出是

 mylist1 = ["A","C"]
 mylist2 = ["B"]
 mylist3 = ["D"]

我正在寻找的唯一标签是"/abc"和"/abd"

现在我拥有的是:

def searchWord(segment):
    word_tag = segment.split('/')
    if re.finditer('ab',word_tag[1]):
        if re.finditer('abc',word_tag[1]):
            letter = word_tag[0]
            mylist1 = letter
        else:
            letter = word_tag[0]
            mylist2 = letter
    else:
        letter = word_tag[0]
        mylist3 = letter
    return mylist1
    return mylist2
    return mylist3
mylist1,mylist2,mylist3 = [searchWord(segment) for segment in text]

它似乎工作正常,但抛出异常:

 ValueError: too many values to unpack.

我的"文本"列表相当大,这可能是问题所在吗?在为此过程构建函数之前,我没有遇到此问题。

谢谢!

将列表作为元组返回:

return mylist1, mylist2, mylist3

Python 不会执行所有三个return语句,只执行第一个语句。

如果您尝试将项目分类到不同的类别中,通常使用字典:

buckets = {'abc': [], 'abd': [], 'xyz': []}
for segment in text:
    item, tag = segment.split('/', 1)
    buckets[tag].append(item)

然后,您仍然可以将这三个列表提取为 3 个变量,但您也可以直接引用存储桶。例如,您可以引用buckets['abc'],而不是mylist1

你的问题

您确实应该包含完整的堆栈跟踪,但在这种情况下,很容易推断出mylist1,mylist2,mylist3 = [searchWord(segment) for segment in text]是有问题的行,因为列表推导返回超过 3 个值,因此您不能将它们仅分配给 3 个变量。但是代码中的问题是您尝试多次return

return mylist1
return mylist2
return mylist3

一个函数只能有 1 个返回值,所以你应该把它改成这样:

return (mylist1, mylist2, mylist3)

一个解决方案

在查看您的代码并看到您的愿望之后。我为您修复了它:

def catagorize(data):
    container = [[],[],[]]
    for segment in data:
        searchWord(segment, container)
    return container
def searchWord(segment, container):
    letter, tag = segment.split('/')
    if tag == 'abc':
        container[0].append(letter)
    elif tag == 'abd':
        container[1].append(letter)
    elif tag == 'xyz':
        container[2].append(letter)
    else:
        raise ValueError('unknown tag')

运行代码:

>>> text = ["A/abc","B/abd","C/abc","D/xyz"]
>>> mylist1, mylist2, mylist3 = catagorize(text)
>>> print mylist1, mylist2, mylist3 
['A', 'C'] ['B'] ['D']

另一种解决方案

更强大的解决方案:

from collections import defaultdict
def catagorize(data):
    container = defaultdict(list)
    for letter, tag in (segment.split('/') for segment in data):
        container[tag].append(letter)
    return container

在行动中:

>>> catagorize(["A/abc","B/abd","C/abc","D/xyz"])
defaultdict(<type 'list'>, {'xyz': ['D'], 'abc': ['A', 'C'], 'abd': ['B']})

仅执行第一个returnreturn返回答案,并将控件返回给调用方。之后的任何返回都不会运行。

因此,您不会按预期返回三个项目,而只返回 mylist 的内容(这显然不是三个项目列表)。

你想要什么:

return (mylist1, mylist2, mylist3)

最新更新