我正在阅读有关Google预测API的信息,但无法找出文档的一部分。
从用例来看,我在这一部分有点卡住了:
为什么它会把"兴奋":每行只能分配一个标签,但您可以应用多个标签 通过重复一个示例并应用不同的标签来标记一个示例 标签到每一个。例如:"兴奋","天哪!刚刚有一个很棒的 日!"烦人","天哪!刚刚度过了美好的一天!如果您发送推文 对于此模型,您可能会得到如下所示的分类: "兴奋":0.6,"烦人":0.2。
0.6,"烦人":0.2,而兴奋上没有更多的功能。为什么首选兴奋?
这并不是说标签"兴奋"是首选的,而是消息实际上应该被归类为"兴奋"而不是"烦恼"的可能性。
假设我有 2 种情绪分类:"看涨"和"看跌"。然后,我在预测 API 中使用偶数量的"看涨"和"看跌"训练数据训练模型。当我向预测 API 提交消息以获取情绪时,它会读取文本并根据消息中的单词分配"看涨"和"看跌"概率。概率的总和将加起来为 1。
所以再说一次,并不是一个标签比另一个标签更受欢迎,而是消息被"兴奋"的概率是"烦恼"的3倍。
如果您只用这两个示例来训练模型,句子"OMG!刚刚度过了美好的一天!",这是查询像这样的推文分类时唯一合理的结果"天哪!刚刚度过了美好的一天!"应该是"兴奋":0.5,"烦人":0.5。
因此,Google文档中可能没有完美地解释这种情况。我想他们更专注于解释可以将 2 个不同的标签与完全相同的句子相关联。