情感分析谷歌预测API

我正在阅读有关Google预测API的信息，但无法找出文档的一部分。

从用例来看，我在这一部分有点卡住了：

每行只能分配一个标签，但您可以应用多个标签通过重复一个示例并应用不同的标签来标记一个示例标签到每一个。例如："兴奋"，"天哪！刚刚有一个很棒的日！"烦人"，"天哪！刚刚度过了美好的一天！如果您发送推文对于此模型，您可能会得到如下所示的分类： "兴奋"：0.6，"烦人"：0.2。

为什么它会把"兴奋"：

0.6，"烦人"：0.2，而兴奋上没有更多的功能。为什么首选兴奋？

这并不是说标签"兴奋"是首选的，而是消息实际上应该被归类为"兴奋"而不是"烦恼"的可能性。

假设我有 2 种情绪分类："看涨"和"看跌"。然后，我在预测 API 中使用偶数量的"看涨"和"看跌"训练数据训练模型。当我向预测 API 提交消息以获取情绪时，它会读取文本并根据消息中的单词分配"看涨"和"看跌"概率。概率的总和将加起来为 1。

所以再说一次，并不是一个标签比另一个标签更受欢迎，而是消息被"兴奋"的概率是"烦恼"的3倍。

如果您只用这两个示例来训练模型，句子"OMG！刚刚度过了美好的一天！"，这是查询像这样的推文分类时唯一合理的结果"天哪！刚刚度过了美好的一天！"应该是"兴奋"：0.5，"烦人"：0.5。

因此，Google文档中可能没有完美地解释这种情况。我想他们更专注于解释可以将 2 个不同的标签与完全相同的句子相关联。

相关内容