コインを投げると「表」か「裏」が出ます。 確率を P(表)=0.5,P(裏)=0.5P(表)=0.5,P(裏)=0.5 としましょう。 1回投げて結果を得る → これは「その分布から1回サンプリングした」こと。 100回投げる → 「同じ分布から100個サンプリングした」。 つまり ...
PREVENTアドベントカレンダーの記事です。 今回は、トピックモデリングライブラリ「BERTopic」を使って、日本語のデータセットを解析した体験をご紹介します。公式チュートリアルは英語のデータセットを対象としたものが多いですが、日本語データで利用 ...