在pad序列中为max_len设置什么值



深度学习pad序列中max_len的值是否取决于用例?假设它是一个与Twitter相关的分类,该值是否应该设置为280(280是Twitter中字符的最大长度(?

绝对不是,在您通过推文列表中的标记化器将文本转换为序列后,您可以迭代这些序列来导出sequnces的长度。

padsxuenses函数中的maxlen参数指的是序列的最大长度,因此它不是指基于字符的推文的长度,而是指序列的长度。

之后,您不需要将其设置为tweets序列的最大长度,甚至可以将其设置得更低。但请注意,通过这种方法,在将标记化器放入推文列表之前,最好删除停止语并过滤字符。

相关内容

最新更新