推荐实验室包中的Jaccard相似度计算



参数'alpha'在推荐布尔用户偏好矩阵模型中使用的Jaccard方法中的作用是什么?即

method="Jaccard",param=list(...,alpha=0.5)

我看到了IBCF的代码,他们使用了一个不相似函数。但是在官方的CRAN PDF中并没有定义这个函数。有人能帮帮我吗?

是在推荐人实验室中定义的函数。试一试:

library("recommenderlab")
? dissimilarity

来自文档:

"

"jaccard":在两个元素中出现的项目数除以元素中项目的总数(Sneath, 1957)。这种度量通常也被称为:二进制、非对称二进制等。

"

本质上,Jaccard = #(0 | 0) + #(1 | 1) similarity/total

总是#(0 | 0)+ #(1 | 1)+ #(1 | 0)+ #(0 | 1)……即,总行数。这里的#指的是匹配的数量,就像SQL中的COUNT。我的管道|是作为两列之间的分隔符。

我必须先做什么?dissimilarity,由文档的作者Michael Hahsler(大声说出来!)推荐,然后转到dissimilarity {arrules}文档,该文档简要描述了在推荐人实验室中使用的不相似性计算(余弦、pearson和jaccard),以及其他。

Re:α……看起来像是用来帮助调整与热门项目相关的偏差:https://stats.stackexchange.com/questions/104811/what-does-the-parameter-alpha-do-in-the-jaccard-method-for-binaryratingsmatri

最新更新