有人能解释一下torch中的build_vocab是什么吗?从在线文档中还不清楚?为什么我们需要它,以及它与预训练嵌入的关系?
我认为您在这里混淆了pytorch
和torchtext
。在torchtext
(一个为自然语言提供处理实用程序和流行数据集的包(中,您可以运行Field
的build_vocab
来迭代数据集,以建立词汇表。
也可以看看这里:
https://torchtext.readthedocs.io/en/latest/data.html#torchtext.data.Field.build_vocab