前回は、 結合処理の並列化における基本戦略について説明し、 ソートマージ結合における具体的な並列アルゴリズムを説明しました。今回は、 ImpalaやPrestoに加えて、 Apache SparkやHadoop MapReduceのMap Joinにおいても用いられているハッシュ結合における具体的な ...
メリーランド大学のJimmy Lin准教授がメインで執筆した、 MapReduceに関する英語のテキストがPDFで公開されています。扱っているMapReduceのモデルが、 オープンソースのMapReduce実装であるHadoopが前提になっていることが特徴的で、 Hadoopを実際に触っていれば用語 ...