午前中に事務処理を終わらせて、午後からは週末恒例の生成AI検証・資料作成のお楽しみタイムです。
最近のセミナーでよく話しているのですが、その資料がなかった「AIエージェント」の資料作り始めました。
自分が生成AIに絡む相談を受けていると感じる傾向が5つあります。
「テキスト・画像などの多様化」「目的・業種の目的細分化」「生成品質を高めるプロンプト」「データ管理と保護」「生成AIによる自動化」です。
この5つの中で重要テーマになるのは少し先かなって思っていたのが「生成AIによる自動化」です。
いくつかの生成AIのタスクをシナリオとして繋ぎ、特定業務を自動化するという意味合いでのトレンドでした。
OpenAIは生成AIの進化を5つのステップで定義してます。
レベル1「チャットボット」、レベル2「推論者」、レベル3「エージェント」、レベル4「革新者」、レベル5「組織マネージメント」…です。
会話型のインターフェース(チャットボット)でAIが回答をしてくれる今のChatGPT(GPT-4o)はまだレベル1です。
そこにレベル2の「OpenAI o1」や「Gemini2.0Thinking」が類論モデルとして登場してきています。
その次のレベル3が「AIエージェント」で、自律的に行動を起こすことができるAIシステムです。
与えられたゴールに向かって自ら判断し、自動的にタスクを遂行していきます。
自分の考えていたAIによる自動化は、人がタスクをシナリオとしてつなぐイメージでしたが、そのつなぐこともAIが行います。
例えば、調査に限っていますが調査方法を考えて動いてくれるGemini「Deep Research」やGenspark「Autopilot Agent」はAIエージェントです。
検索系AIがAIエージェントの機能をいち早く取り入れたのは、比較的作業のシナリオが単純だからだと思います。
これまで人が「問い掛け」という形でAIの回答をひとつひとつ使って仕事を行っていましたが、「ゴール」を示せばAIが自律的に動いてくれます。
これにタスクをスケジューリングできる「ChatGPTタスク」を組合せると、決まった時間に決まった仕事をしてくれるので、さらに大きな可能性を感じます。
そんな可能性を妄想しながら、ワクワクして資料を作成していました。