我正在考虑使用Keras来实现文档分类任务,但是LSTM层的输入让我感到困惑。
我知道我必须生成用于训练的向量,我有一个语料库,在这个语料库中每行一个文档,如果我想将语料库馈送到LSTM层,我是否需要首先从语料库中生成用于训练的文档向量?或者不使用单词级向量,或者字符级向量?
在文档分类任务中,如果使用LSTM,输出通常是词级向量,可以预训练或随机初始化。您可以将单词级向量与字符级向量结合使用,例如https://arxiv.org/abs/1606.03475