前回は、 並列システムの性能指標について紹介し、 また、 データ処理におけるアルゴリズムと、 選択処理の並列化方法を紹介しました。今回からは、 結合処理の並列化方法について説明します。まずは、 結合処理における基本的な並列化方法について ...
前回は、 結合処理の並列化における基本戦略について説明し、 ソートマージ結合における具体的な並列アルゴリズムを説明しました。今回は、 ImpalaやPrestoに加えて、 Apache SparkやHadoop MapReduceのMap Joinにおいても用いられているハッシュ結合における具体的な ...
システム開発の現場では、日々大量のデータを効率的に処理する課題に直面します。特にデータの「並べ替え」、すなわちソートは、検索効率の向上や情報整理の基盤となる重要な要素です。しかし、数あるソートアルゴリズムの中から、自身の ...
すでに昇順にソート済みの配列どうしをマージするということ AとBの配列の中身は昇順にソートされている。そのため、最小の値は、A(0番目)またはB(0番目)のどちらかになる。 最終的に、配列Cとなる。 <マージソートの優位性> このアルゴリズムの優位性 ...
大小の関係が決められたデータを小さい順や大きい順に並び替える作業はソートと呼ばれ、コンピュータには欠かせないプログラムです。そのため、ソートをより早く・確実に・効率良く実行できるように、さまざまなアルゴリズムが考案されてきました。
データの並べ替え(ソート)を行うアルゴリズムは複数存在し、その並べ替え方法によって平均的な処理時間等が大きく異なります。こうしたソートアルゴリズムをウェブサイト上でシミュレートできる「Visual Sorting/The Sound Of Sorting」が公開されています。
データの並べ替え (ソート)を行うアルゴリズムは複数存在し、その並べ替え方法によって平均的な処理時間等が大きく異なります。こうしたソートアルゴリズムをウェブサイト上でシミュレートできる「Visual Sorting/The Sound Of Sorting」が公開されています。
Bash・シェルスクリプトで動作する、バブルソート、選択ソート、挿入ソート、マージソート、シェルソート、クイックソートを一気に実行し、速度を体感できる、優れもの。