AIエージェント、仕事ができる「デジタル相棒」にまで進化
AIエージェントが中国の2025年度の科学普及トレンドワードトップ10にランク入りした。娯楽や教育、医療など、至る所でAIエージェントが存在感を放つようになっている。そこで、「AIエージェントと人工知能(AI)にはどんな違いがあるのか?」や「どんな特質を備えていればAIエージェントと呼ばれるのか?」などについて、業界の専門家に聞いた。科技日報が伝えた。
生活におけるパートナー:SF映画の世界が現実に
上海霊宇宙科技発展有限公司の創業者・顧嘉唯氏は取材に対して、「2013年のSF恋愛映画『her/世界でひとつの彼女』に出てきた人格を持つ最新の人工知能型OSサマンサが、理想のAIエージェント像。『サマンサ』は、胸の前に固定され、カメラのレンズを通して、外部環境を認識し、ユーザーにいろんなアドバイスをくれる」とした。
そして、「パネルディスカッションに参加している時に、AIエージェントがその時の話題に基づいて、イヤホンを通して、能動的、かつ継続的にインターネット上の最新情報、最も網羅的なデータを提供してくるところを想像してみてほしい。AIエージェントは、『軍師』のような能力を備え、シームレスのサポートを提供できなければならない」と説明する。
調査会社のインターナショナル・データ・コーポレーション(IDC)中国の研究総監・盧言霞氏は、「現時点で、AIエージェントには多様な定義があるものの、理解や記憶、計画、自ら状況を判断するといった幾つかの能力は不可欠」とする。
それらの能力を実現するために、AIエージェントの開発者はたくさんの新たなアプローチを模索している。顧氏は、「『her/世界でひとつの彼女』から啓発を受けたほか、人間の情報の80%以上は視覚を通して得ることを考慮し、当社が研究開発したAI学習パートナー『小方機』には、外部環境を認識するカメラを搭載。アルゴリズムを通して、現実の世界を立体的に認識することができるようにした。人間が今いる場所の環境を高精度に認識することができるため、AIエージェントの判断力が大幅に高まっている」と話す。
発話理解という面を見ると、人間の意図を深く理解し、最後までタスクを実行するというのはAIエージェントの使命だ。
顧氏は、「AIが正確に反応するためには、『プロンプト』を正確に理解しなければならない。そのために、当社はローカルモデルを開発し、生成的基礎大規模モデルのコールをする前に、迅速なプリコンディショニングを行っている。人間が二言三言話すと、ローカルモデルが、意図を推論し、コールルートを判断する。このような階層化構造設計により、迅速な反応と正確な応答の両立を実現している」と説明する。
ディープシンク、推論・応用といったシーンにおいて、消費級AIエージェントは優れたパフォーマンスを見せる。盧氏は、「相対的に見て、現時点で、企業級AIエージェントはスマートカスタマーサービスやオフィスアシスタントといった役割に導入されている。ただ、マルチモーダルコンテンツをベースに、核心業務にサービスを提供する業界の垂直AIエージェントを構築するとなると、ある程度難しくなる」とする。
職場デビュー:受け身の対応から主体的な予測・判断へ
北京雲迹科技股份有限公司(以下「雲迹科技」)研究開発センターの責任者・龔漢越氏は、「多くの人は、仕事において、能力の高い『パートナー』が協力してくれることを望む。その点、AIエージェントは、仕事の内容に基づいて、主体的に目標を段階分けし、徐々に達成していくことができる。機械的な受け身の対応から、主体的な対応へのステップアップが、特定のシーンに特化したAIエージェントの進化の方向性だ」と説明する。
現時点で、AIエージェントは、ホテルや工場、病院といった多数のシーンで徐々に導入されており、同じことを繰り返す仕事やマニュアル化された仕事、人間とコンピューターが連携する必要がある仕事をこなすのをサポートするようになっている。龔氏は、「生活におけるパートナーと比べると、特定のシーンに特化したAIエージェントはクローズド・ループの部分に対応することが多く、プロセスも長い。感知、認知、行動決定、実行から、フィードバックに至るまでのポイント・ツー・ポイントサービスを実現するべく、当社の『サービスに特化したAIエージェント』は『エンボディド・インテリジェンス』と『ディセンボディード・インテリジェンス』を組み合わせたスタイルを採用している。『エンボディド・インテリジェンス』のUPロボットは、実際の物理的なタスク実行を担う。一方、『ディセンボディード・インテリジェンス』のHDOS(雲迹科技が独自に研究開発したAIデジタル化システム)は、スマートスピーカー『小度』を含むさまざまなエントランスと連携させる役割を担い、リアルタイムでユーザーのニーズに対応し、社会常識に基づいて、意図を認識・予測し、意思決定、実行、フィードバックして、トータルクローズド・ループサービスを実現する」としている。
盧氏は、「人間の代わりに仕事をして、人間は監督、校正をするだけでよいというのが、理想の成熟したAIエージェント」とする。
どのようにしてAIエージェントを、正確にタスクを認識し、実行するパートナーから、深いやり取りをして、自ら進化し、安全で、信頼できるスマートパートナーへと成長させることができるのだろうか?
盧氏は、「そのステップアップ実現のためには、業界と企業のデータと知識の蓄積が不十分で、基盤モデルの処理能力と正確率も低いという課題を克服しなければならない」と指摘する。
そして、「例えば、テスラは膨大な量の電気自動車のデータを収集することで、リアルなシーンのクローズド・ループを構築した上で、自動運転タクシー・ロボタクシーを作った。各職場でしっかりと応用できるAIエージェントを実現するためには、垂直分野の膨大な経験の蓄積が必要だ。テスラのほかにも、たくさんの企業が、自分たちが必要とする設備設置を通して、将来の成熟AIエージェントのために、リアルなシーン対応能力、はっきりとしない情報の処理能力を高めている」と説明する。
龔氏は、「AIエージェントの深い推論能力を高め、『なにか』を認識するだけでなく、『なぜか』を理解できるようにするためには、AIアライメントを踏み込んで促進し、AIエージェントのために複雑なシーンにおける明確な動的行為の境界を定め、その物理的環境や社会交流における行為の安全性を確保しなければならない」と指摘した。(編集KN)
「人民網日本語版」2025年12月4日
注目フォトニュース
関連記事
掲載された記事、写真の無断転載を禁じます。
Tel:日本(03)3449-8257 Mail:japan@people.cn








