我如何编写一个查询来获取基于MongoDB中两个依赖的输入变量的值



我有一个mongoDB集合,其中包含以下格式的JSON文档。这只是一个示例,而不是完整的文档。

{
    "_id": ObjectId("555ba8a6ae96b63b98969192"),
    "toptags": {
        "@attr": {
            "artist": "Rihanna"
        },
        "tag": [
            {
                "count": "100",
                "name": "pop",
                "url": "http://www.last.fm/tag/pop"
            },
            {
                "count": "89",
                "name": "rnb",
                "url": "http://www.last.fm/tag/rnb"
            },
            {
                "count": "60",
                "name": "female vocalists",
                "url": "http://www.last.fm/tag/female%20vocalists"
            },
            {
                "count": "55",
                "name": "dance",
                "url": "http://www.last.fm/tag/dance"
            },
            {
                "count": "40",
                "name": "Hip-Hop",
                "url": "http://www.last.fm/tag/hip-hop"
            },
            {
                "count": "21",
                "name": "Rihanna",
                "url": "http://www.last.fm/tag/rihanna"
            },
      ]
      }
}

我收藏了数百个类似的文件。我想编写一个查询,它将返回具有给定标签集的"艺术家"名称,并且这些标签的"count"值大于给定值。

这是我到目前为止尝试过的两个查询

  1. collection_name.find({'$and': [{"toptags.tag.name":tag_array},
                                   {"toptags.tag.count":{'$gte':count_value}}]},
                         {"_id":"1","toptags.@attr.artist":"1"})
    
  2. collection_name.find({"toptags.artist":
                            {$all : [{"$elemMatch" : 
                                        {"name":tag_array, 
                                         "count": {'$gt': count_value}}},]})
    

以上查询都无效。我意识到第一个从根本上是错误的,因为它不接受作为参数传递的标签的"count"值。但我觉得第二个应该可以。但是我认为我的语法是错误的。我哪里出错了?

据我所知:

  • 你有一个标签数组来匹配;
  • 您只考虑超过一定阈值的标签。

正如@yogesh在评论中建议的那样,你应该首先确保你的标签计数是一个数字。不是字符串。完成后,您必须基于标记列表构建查询。像这样的可能是:

> THRESHOLD=50
> TAGS=['dance', 'rnb']
> for (idx in TAGS) {
    QTAGS[idx]={"$elemMatch": {"name":TAGS[idx], "count":{"$gt": THRESHOLD}}}
  }
> QTAGS
[
    {
        "$elemMatch" : {
            "name" : "dance",
            "count" : {
                "$gt" : 50
            }
        }
    },
    {
        "$elemMatch" : {
            "name" : "rnb",
            "count" : {
                "$gt" : 50
            }
        }
    }
]

现在,您可以查询您的数据库:

> db.w.find({"toptags.tag": { "$all": QTAGS}})
{ "_id" : ObjectId("555ba8a6ae96b63b98969192"), "toptags" : { "@attr" : { "artist" : "Rihanna" }, "tag" : [ { "count" : 100, "name" : "pop", "url" : "http://www.last.fm/tag/pop" }, { "count" : 89, "name" : "rnb", "url" : "http://www.last.fm/tag/rnb" }, { "count" : 60, "name" : "female vocalists", "url" : "http://www.last.fm/tag/female%20vocalists" }, { "count" : 55, "name" : "dance", "url" : "http://www.last.fm/tag/dance" }, { "count" : 40, "name" : "Hip-Hop", "url" : "http://www.last.fm/tag/hip-hop" }, { "count" : 21, "name" : "Rihanna", "url" : "http://www.last.fm/tag/rihanna" } ] } }

提高阈值,再做一次,你最终什么都没选择:

> THRESHOLD=100
> for (idx in TAGS) {   QTAGS[idx]={"$elemMatch": {"name":TAGS[idx], "count":{"$gt": THRESHOLD}}} }
> db.w.find({"toptags.tag": { "$all": QTAGS}})
> // nothing

相关内容

  • 没有找到相关文章

最新更新