日曜日は次年度に向けてのセミナー資料の見直しを行ってました。
特に生成AIに関する部分は定期的な見直しが必要です。相変わらず変化が激しい感じです。

OpenAIから「GPT-4.5」がリリースされました。
新しい生成AIサービスが出て驚くのも疲れてしまったので、どういう影響があるのかを冷静に考えてみました。

「GPT-4.5」は「4o(オムニ)」の後継で、一般的な言い方ではないですが「即答(チャット)モデル」です。
「4o」の後には「o1」「o3」という推論モデルが登場したので、チャットモデルが推論モデルに進化していくと思っていました。

生成AIの進化において【レベル1】の「即答モデル」が、次の【レベル2】「推論モデル」に進化するなら分かりやすいです。
しかし、なぜこのタイミングで「チャット(即答)モデル」に戻ったのかが少し不思議でした。

しかし、ヒトに置き換えて考えてみると、いつも「推論モデル」のようにじっくり時間をかけて答えを出せれるわけではないです。
即答のレベルを上げないといけない場合が存在します。「会話」です。

自分の勝手な妄想ですが、生成AIの会話レベルが上がるのはとても嬉しいです。
ChatGPT「Advance Voice」やGemini「Gemini Live」のリアル会話の機能は役立つ場面は多々あります。

声から感情を読み取ってくれるのは、文字だけのコミュニケーションより可能性を感じます。
その会話で役立つであろう「即答モデル」が進化するのは意味のあることです。

自分は「即答モデル」が、次の「推論モデル」へ進化すると思っていました。
しかし、この二つは平行して進化していくようです。次の「GPT-5」は二つの進化が融合点と思われます。

現に「Claude 3.7 sonnet」は「即答モデル」と「推論モデル」が融合され、とても賢いです。
ヒトで考えれば、今は「即答する時」「熟考する時」なんて意識しないから当たり前のことです。