我正在努力加深对MongoDB中map/reduce的理解。
我认为实现这一点的最佳方法是查看emit的实际实现。我在哪里能找到它?
更好的是emit()
的简单实现。在MongoDB文档中,它们展示了一种通过编写自己的emit()
进行故障排除的方法,但它们提供的基本实现实在太基础了。
我想了解分组是如何进行的。
我认为您要查找的定义位于此处:
https://github.com/mongodb/mongo/blob/master/src/mongo/db/commands/mr.cpp#L886
然而,要想完全理解发生了什么,还需要很多背景。我承认,我没有。
1.Mongo所需的JS版本已不在O.Powell的url中,该url已失效。我找不到。
2.下面的代码似乎是最感兴趣的片段。这个cpp函数switchMode计算要使用的发射函数。目前处于;https://github.com/mongodb/mongo/blob/master/src/mongo/db/commands/mr.cpp#L815
3.我试着看看emit是否默认包含_id键,这似乎是通过_mrMap发生的,这里没有显示。在其他地方,它被初始化为空映射{}。
void State::switchMode(bool jsMode) {
_jsMode = jsMode;
if (jsMode) {
// emit function that stays in JS
_scope->setFunction("emit",
"function(key, value) {"
" if (typeof(key) === 'object') {"
" _bailFromJS(key, value);"
" return;"
" }"
" ++_emitCt;"
" var map = _mrMap;"
" var list = map[key];"
" if (!list) {"
" ++_keyCt;"
" list = [];"
" map[key] = list;"
" }"
" else"
" ++_dupCt;"
" list.push(value);"
"}");
_scope->injectNative("_bailFromJS", _bailFromJS, this);
}
else {
// emit now populates C++ map
_scope->injectNative( "emit" , fast_emit, this );
}
}