小贝子编程

遍历 Torchtext.data.BucketIterator 对象会抛出 AttributeError 'Field'对象没有属性'vocab'

本文关键字：对象 Field vocab 属性 AttributeError data Torchtext BucketIterator 遍历 python iterator pytorch torchtext
更新时间 : 2023-09-15
英文 : Iterating over Torchtext.data.BucketIterator object throws AttributeError 'Field' object has no attribute 'vocab'

当我尝试查看批处理时，通过打印BucketIterator对象的下一个迭代，抛出AttributeError。

tv_datafields=[("Tweet",TEXT), ("Anger",LABEL), ("Fear",LABEL), ("Joy",LABEL), ("Sadness",LABEL)]
train, vld = data.TabularDataset.splits(path="./data/", train="train.csv",validation="test.csv",format="csv", fields=tv_datafields)
train_iter, val_iter = BucketIterator.splits(
(train, vld),
batch_sizes=(64, 64),
device=-1,
sort_key=lambda x: len(x.Tweet),
sort_within_batch=False,
repeat=False
)
print(next(iter(train_dl)))

我不确定您遇到的特定错误，但在这种情况下，您可以使用以下代码迭代批处理：

for i in train_iter:
print i.Tweet
print i.Anger
print i.Fear
print i.Joy
print i.Sadness

i.Tweet(也是其他)是形状(input_data_length, batch_size)的张量。

因此，要查看单个批处理数据(假设批处理 0)，您可以执行print i.Tweet[:,0]。

val_iter也是如此(如果需要，test_iter)。

遍历 Torchtext.data.BucketIterator 对象会抛出 AttributeError 'Field'对象没有属性'vocab'

相关内容

最新更新

热门标签：