我有一个mongoDB集合,其中包含以下格式的JSON文档。这只是一个示例,而不是完整的文档。
{
"_id": ObjectId("555ba8a6ae96b63b98969192"),
"toptags": {
"@attr": {
"artist": "Rihanna"
},
"tag": [
{
"count": "100",
"name": "pop",
"url": "http://www.last.fm/tag/pop"
},
{
"count": "89",
"name": "rnb",
"url": "http://www.last.fm/tag/rnb"
},
{
"count": "60",
"name": "female vocalists",
"url": "http://www.last.fm/tag/female%20vocalists"
},
{
"count": "55",
"name": "dance",
"url": "http://www.last.fm/tag/dance"
},
{
"count": "40",
"name": "Hip-Hop",
"url": "http://www.last.fm/tag/hip-hop"
},
{
"count": "21",
"name": "Rihanna",
"url": "http://www.last.fm/tag/rihanna"
},
]
}
}
我收藏了数百个类似的文件。我想编写一个查询,它将返回具有给定标签集的"艺术家"名称,并且这些标签的"count"值大于给定值。
这是我到目前为止尝试过的两个查询
-
collection_name.find({'$and': [{"toptags.tag.name":tag_array}, {"toptags.tag.count":{'$gte':count_value}}]}, {"_id":"1","toptags.@attr.artist":"1"})
-
collection_name.find({"toptags.artist": {$all : [{"$elemMatch" : {"name":tag_array, "count": {'$gt': count_value}}},]})
以上查询都无效。我意识到第一个从根本上是错误的,因为它不接受作为参数传递的标签的"count"值。但我觉得第二个应该可以。但是我认为我的语法是错误的。我哪里出错了?
据我所知:
- 你有一个标签数组来匹配;
- 您只考虑超过一定阈值的标签。
正如@yogesh在评论中建议的那样,你应该首先确保你的标签计数是一个数字。不是字符串。完成后,您必须基于标记列表构建查询。像这样的可能是:
> THRESHOLD=50
> TAGS=['dance', 'rnb']
> for (idx in TAGS) {
QTAGS[idx]={"$elemMatch": {"name":TAGS[idx], "count":{"$gt": THRESHOLD}}}
}
> QTAGS
[
{
"$elemMatch" : {
"name" : "dance",
"count" : {
"$gt" : 50
}
}
},
{
"$elemMatch" : {
"name" : "rnb",
"count" : {
"$gt" : 50
}
}
}
]
现在,您可以查询您的数据库:
> db.w.find({"toptags.tag": { "$all": QTAGS}})
{ "_id" : ObjectId("555ba8a6ae96b63b98969192"), "toptags" : { "@attr" : { "artist" : "Rihanna" }, "tag" : [ { "count" : 100, "name" : "pop", "url" : "http://www.last.fm/tag/pop" }, { "count" : 89, "name" : "rnb", "url" : "http://www.last.fm/tag/rnb" }, { "count" : 60, "name" : "female vocalists", "url" : "http://www.last.fm/tag/female%20vocalists" }, { "count" : 55, "name" : "dance", "url" : "http://www.last.fm/tag/dance" }, { "count" : 40, "name" : "Hip-Hop", "url" : "http://www.last.fm/tag/hip-hop" }, { "count" : 21, "name" : "Rihanna", "url" : "http://www.last.fm/tag/rihanna" } ] } }
提高阈值,再做一次,你最终什么都没选择:
> THRESHOLD=100
> for (idx in TAGS) { QTAGS[idx]={"$elemMatch": {"name":TAGS[idx], "count":{"$gt": THRESHOLD}}} }
> db.w.find({"toptags.tag": { "$all": QTAGS}})
> // nothing