NLP翻译给我的是句子翻译,而不是单词翻译



我使用来自http://www.manythings.org/anki/.这是一个并行化的句子数据集。

训练结束后,我试着翻译";doente";应该翻译成";生病的";但我却得到了";我觉得不舒服";。

有什么想法吗?我该怎么说"恶心"这个词?

我是否使用错误的数据集训练我的模型?基于句子而不是基于单词?

tks提前

机器翻译通常适用于句子,因为单词使用的上下文会改变其含义。逐字翻译毫无意义。

因此,你的单词"doente"通常出现在英文翻译为"我感到恶心"的句子中;这是最小的上下文。由于这些都只是机器的字符,因此从人类的角度来看,没有"理解"只有sick部分对应于doente

如果你想翻译单词,就用一本双语词典;我怀疑是否有基于单词的模型,因为几十年来对机器翻译的研究表明,你需要更多的语言来进行翻译,而不仅仅是单词。

最新更新