神经网络 - 为什么我们需要更大的向量空间来显示词嵌入模型中的关系 - neural network - Why we need bigger vector space for displaying relations in word embedding models? 小贝子编程网

我正在研究词嵌入，对词向量的维度数量有点困惑。我的意思是，以word2vec为例，我的问题是为什么我们应该使用100个隐藏神经元作为我们的隐藏层？这个数字背后有什么意义或逻辑吗？或者如果它是任意的，为什么不是300？还是10？为什么不多或少？众所周知，显示向量的最简单方法是在二维空间（只有 X 和 Y）上，为什么更多维度？我阅读了一些有关它的资源，在一个示例中，他们选择了 100 个维度，在另一个示例中，他们选择了其他数字，如 150、200、80 等。

我知道数字越大，显示单词之间关系的空间就越大，但我们不能在二维向量空间（只有 X 和 Y）上显示关系？！为什么我们需要更大的空间？每个单词都由一个向量显示那么，当我们可以在 2 维或 3 维空间上显示向量时，为什么我们必须使用高维空间呢？然后使用余弦等相似性技术来查找2 或 3 维的相似性而不是 100 维（从计算时间的角度来看），对吧？

嗯..如果只显示矢量是您的最终游戏，您可以使用 2 维或 3 维矢量，它会效果最好。

通常在NLP中，我们有明确定义的任务，如标记，解析，理解含义等。对于所有这些目的，高维向量总是比 2-d、3-d 向量表现更好。因为它有更多的自由度来捕捉你所追求的关系。您可以通过它们包含更丰富的信息。

使用余弦等相似性技术来查找 2 维或 3 维的相似性比 100 维（从计算时间的角度来看）更简单，对吧？

不。这是说添加 2 个数字比添加 100 个数字更简单。方法（正弦距离）完全相同。

神经网络 - 为什么我们需要更大的向量空间来显示词嵌入模型中的关系

相关内容

最新更新

热门标签：