ニュース

3月7日、刺激的なブログがHazy Researchから投稿された。新しい大規模言語モデルHyena(ハイエナ)の登場だ。 Hazy Researchはスタンフォード大学と ...
上のグラフでは、青線が従来のTransformerで用いられるAttentionで、赤線がHyenaだ。 横軸はシーケンスの長さ(トークン数)である。トークンが十分 ...