逻辑回归和词袋



根据我的理解,X1是一个单词的出现次数,而beta1是该单词的权重。我的问题是重量是如何计算的?基于什么?

这有点困难,因为我不知道你到底想做什么。但通常你有数据提供x。以及结果。结果应该是伯努利分布。这意味着只有两种可能的结果。现在从x中计算概率。例如,你想知道一条短信是否与汤姆·汉克斯有关。x1 = 1,如果单词"tom"在课文中。X也可以用来描述"Tom"出现在文本中。您尝试选择一个beta,以便从beta1*x1得到的sogmoid函数返回文本与"Tom hanks"有关的正确概率。如果"汤姆"这个词;存在于文本中。为了计算beta,通常会使用一些机器学习算法,比如梯度下降。我把它化简了一下。我认为这很好地解释了它。最后,你从你的数据中得到一个模型,该模型可以预测新数据的结果,其中你只知道x。

相关内容

  • 没有找到相关文章

最新更新