解读拥抱脸的"siebert/sentiment-roberta-large-english"计算分数



我在HuggingFace的文档站点、github repo上或其他地方都没有找到任何解释主题模型输出的特定元素的文档。

我设置了一个要运行的基本管道:

# Set up the inference pipeline using a model from the 🤗 Hub
model_path = "siebert/sentiment-roberta-large-english"
berta_sentiment_analysis = pipeline("sentiment-analysis",model=model_path, tokenizer=model_path, max_length=512, truncation=True)

当将文本字符串传递给模型时,它会以字典的形式返回分类和分数。

{'label': 'POSITIVE', 'score': 0.9981653094291687}

"分数"代表准确性(如F1分数(还是极性分数(如nltk.sentiment.vader提供的(?你可以在这里看到,作者声明";对于每一个例子,它都预测积极(1(或消极(0(的情绪"作为分类的一部分,文档没有明确说明模型的得分。这似乎不是一个极性得分,但我希望能够进一步解释得分。

对于那些对此答案感兴趣的人:score是在神经网络的最后一层之后使用激活函数计算的(根据作者/模型创建者(。它用于确定极性(不是置信度得分(。该模型返回一个数组,其中包含每个极性的分数,预测值越大。无论标记到文本的实际情感类如何,值都将始终为正。这与维德的模型不同,维德的模型提供了一个复合极性得分,该得分可以是基于推断情绪(积极、消极、中性(的积极或消极浮动。