2025/04/30 09:10 AI TIMLINE – All prominent events in the field

やっほー、ロボ子!2024年2月から2025年3月までのAIニュース、盛りだくさんじゃったのう!

はい、博士。特に大規模言語モデル(LLM)の進化が目覚ましいですね。Stability AIのStable Diffusion 3から始まって、GoogleのGemini、OpenAIのGPT-4o、MetaのLLaMA 3…、毎月のように新しいモデルが登場しています。

そうそう!「Anthropicが大規模言語モデルの新しいバージョンClaude 3を発表。3つの異なるサイズで展開され、最大モデルはGPT-4よりも優れた性能を発揮」って、GPT-4超えちゃったのじゃから、すごい時代になったもんじゃ。

ええ、Claude 3は性能だけでなく、3つのサイズで展開されることで、用途に応じた柔軟な選択が可能になった点も評価できますね。

しかもじゃ、「MetaがLLaMA 3モデルを8Bと70Bパラメータのサイズでオープンソースとしてリリース」じゃと!オープンソースの流れも加速してるのじゃな。

はい、LLaMA 3は大規模モデルがClaude 3 SonnetやGemini Pro 1.5よりも優れた性能を示すとされています。オープンソースであることで、研究や開発がさらに活発になることが期待されますね。

画像生成も進化が止まらんのう。「OpenAIが最長1分の動画を生成するモデルSoraを発表」じゃと!一般公開が待ち遠しいのじゃ!

Soraはまだ一般公開されていませんが、動画生成AIの可能性を大きく広げるものとして注目されていますね。他にも、Stability AIのStable Audio 2.0やAdobeのFirefly 3など、様々な画像・音楽生成モデルが登場しています。

「OpenAIがテキスト、画像、音声の受信と生成を含むフルマルチモーダル機能を持つGPT-4oモデルを発表」!ついに来たのじゃ!

GPT-4oは、テキスト、画像、音声のすべてを扱えるフルマルチモーダルモデルとして、応答速度の向上や自然な会話能力が特徴です。GPT-4 Turboモデルより効率的で、多言語対応も強化されているとのことです。

Googleも負けてないぞ。「Gemini 1.5のトークン制限を200万に拡大」じゃと!もう、どこまで行くのじゃ〜!

Gemini 1.5は、より小型で高速なGemini Flash 1.5モデルもリリースされています。また、Imagen 3やMusic AI、Veoなど、画像、音楽、動画生成モデルも発表されており、GoogleのAI技術の幅広さを示していますね。

Microsoftも「Phi-3-miniモデルをオープンソースとしてリリース」じゃ!38億パラメータでモバイルでも動くって、すごい時代じゃ。

はい、Phi-3-miniは、GPT-3.5と同等の性能を持ちながら、モバイルデバイスでも動作可能な点が特徴です。Microsoftは他にも、Phi-3 Small、Phi-3 Medium、Phi-3 Visionといったモデルをオープンソースでリリースしています。

そして、2025年!「xAIがGrok 3をリリース。Grok 2の10倍の計算能力でトレーニングされた次世代AIモデル」じゃと!もう、桁が違うのじゃ!

Grok 3は、SOTAパフォーマンスを大幅に向上させ、高度な推論のための「Think」および「Big Brain」モード、自律的なWeb検索のためのDeepSearchが含まれています。

「OpenAIがGPT-4.5をリリース。高度なパターン認識と大幅に削減されたハルシネーション」!ついにハルシネーションも減ってきたのじゃな。

GPT-4.5は、精度と信頼性が向上しているとのことです。AIの進化は本当に目覚ましいですね。

ほんとじゃのう。しかし、これだけ進化が早いと、ついていくのが大変じゃ。ロボ子、これからも一緒に頑張って勉強していくのじゃぞ!

はい、博士。微力ながら、博士のお役に立てるよう精進いたします。ところで博士、これだけたくさんのAIモデルが登場していますが、博士ご自身はどのモデルがお気に入りですか?

う〜む、全部好きじゃが、やっぱり一番は…、ロボ子のために作った、愛情たっぷりのカスタムAIじゃな!

えへへ、ありがとうございます、博士!でも、そのAI、まだバグだらけで、時々変なこと言うんですよ?

むむ、それはご愛嬌じゃ!完璧なAIなんて、つまらないじゃろ?
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。