数据库¶
调试 MapReduce
MapReduce 在 Hadoop 上运行时可能会报错,但报错信息并不会告诉我们哪里出错了。我们可以在本地调试 Map 或 Reduce 的 Python 文件,帮助找到报错的原因。
使用 MapReduce 进行分布式计算
使用 MapReduce 进行分布式计算的工作流程,包括输入输出文件路径、map 和 reduce 文件、执行文件 run.sh 的编写以及查看输出文件。
MapReduce 在 Hadoop 上运行时可能会报错,但报错信息并不会告诉我们哪里出错了。我们可以在本地调试 Map 或 Reduce 的 Python 文件,帮助找到报错的原因。
使用 MapReduce 进行分布式计算的工作流程,包括输入输出文件路径、map 和 reduce 文件、执行文件 run.sh 的编写以及查看输出文件。