mapreduce
用于分析不适合内存的数据集的编程技术
语法
描述
例子
输入参数
输出参数
提示
调试
mapreduce
用于检查键-值对如何在不同阶段移动的算法总是有用的。若要检查数据的移动,请在映射和reduce函数中设置断点。的执行将停止mapreduce
,允许您检查相关变量的当前状态,例如KeyValueStore
或ValueIterator
.有关更多信息,请参见MapReduce算法调试.一些优化建议
mapreduce
在任何平台上的性能如下:尽量减少对map函数的调用次数。最简单的方法是增加价值
ReadSize
属性。结果是mapreduce
将更大的数据块传递给map函数,数据存储耗尽,读取更少。减少map和reduce函数之间发送的中间数据量。一种方法是使用
独特的
在map函数中组合相似的键。看到使用MapReduce计算组均值关于这个技巧的例子。
扩展功能
版本历史
在R2014b中引入