小贝子编程

火炬文本将令牌按相同的顺序保存

本文关键字：顺序保存文本令牌 python deep-learning dataset recurrent-neural-network torchtext
更新时间 : 2023-09-17
英文 : Torchtext keep tokens in the same order

我有一个seq2seq神经网络，用于翻译文本。我需要句子在批处理过程中保持不变，更准确地说，句子应该像一个不可分割的标记块。但是，看起来Torchtext提供的迭代器(BucketIterator和Iterator(不保留令牌的初始顺序。除了编写我自己的填充和批处理函数之外，有没有解决方案？

Iterator和BucketIterator都应该保持标记的顺序，只打乱数据集中的句子。

您的输入张量很可能形状不正确。火炬文本中的默认形状为：length×batch_size×features。如果你先有批次，第二个序列长度，你的句子就会被打乱。

最新更新

云构建触发器不应该基于git提交消息创建docker映像
r语言 - 根据标准删除列表组件
无法从用户获取数字并将其作为javascript切片方法的参数传递
在JavaScript中对JSON进行排序
React Axios Delete不每次渲染
Spring boot, Spring Security, React -自定义过滤器认证不起作用
SSIS通过TDS端点连接到Dynamics CRM Online
音频不能通过javaScript播放
MPI_Gather不收集所有块到recv缓冲区?
react hook是如何工作的?为什么useState跟踪的值在重新呈现时没有重置?
如何在颤振中自动点击按钮
如何将具有公共文件夹的react vite应用程序部署到我的域上的子文件夹?
S3FS连接器Pyspark 3.2, Hadoop 3.3.1挂在spark.read.load()
Flutter在不更改上下文区域设置的情况下在小部件内获取语言字符串
fluentd: ignore_repeated_log_interval and ignore_same_log_in
Psycopg2 无法适应间歇性发生的类型"元组"问题
从terraform创建发布模式定义时出错
Pine脚本代码为策略给出错误.入口函数
如何从javascript中的API调用返回值给React组件
Oracle检查巨大的插入进度
输入2位数时程序不能正常工作
Python解析嵌套的JSON文件并取出所需的属性
MongooseError:Model.create()不再接受回调如何使用异步等待
如何将bot/命令限制到某个通道?
SwiftUi调用中的额外参数当调用主视图中@EnvironmentObject的两个视图时
无法从反应-选择下拉Robotframework中选择选项
Intel Intrinsic: Load interleaved float32
使用base64.解码或base64.RawStdEncoding解码base64字符串在Go &g
如何使用Angular加载HTML附加div中的动态数据
RTL文本在react-native项目中没有正确对齐

火炬文本将令牌按相同的顺序保存

相关内容

最新更新

热门标签：