論文

2026: デスクトップエージェントがおもちゃでなくなる年

著者：アン・リー • カリフォルニア州パロアルト • 2026年1月26日

2025年はエージェントについて話す年のように感じました。

マヌスの台頭とそれに続くエージェンティック・ツールの洪水は、高揚感を覚えました。そして、見ていて少し不思議な感じがしました。私が2019年にAIエージェントに取り組んでいたとき、気にかけている人はほとんどいませんでした。そして、人々は私に「副操縦士」を調べるように言われました。当時は猛烈なトレンドでした。しかし、私はいつももっと何かを目指していました。それは、画面を見たり、キーボードやマウスを使用したり、あらゆるコンピューターインターフェースで確実に動作したりできるコンピューターを使用するエージェントで、人間が過剰なデスクトップ作業からようやく解放されることです。

その未来は去年抽象的に感じられなくなり、今はずっと近づいています。LLMは大きく進歩しましたが、業界がAIの信頼性について考える方法でもあります。来年に見込まれるトレンドを3つご紹介します。

エージェントの信頼性は適切な評価を受ける

ベンチマークは常に技術進歩のテンポを定義してきました。長い間、エージェントは一度成功できるかどうかで評価されていました。古い pass @k ベンチマークは 1 回のトライアルの成功率を測定するもので、1 回のトライアルの中から 1 人の勝者を選びます。しかし、信頼性や答えは捉えられません。このような状況になるたびにこれを当てにしていいのでしょうか？

業界は、より優れたフレームワーク、つまり最初の pass^k に集約しつつあります導入された 2024年のLLMベースのエージェントのベンチマークの一部として。Pass^k はエージェントが成功する確率を示します。毎回 k件の試験にわたってk が増加すると、pass^k は下がります。たとえば、1回の試行あたりの成功率が 75% のエージェント (pass @k) が、3 回連続で成功する可能性は 42% にすぎません。つまり、その合格率はわずか (0.75) ³ ≈42% です。

多くの顧客対応エージェントにとって、再現性は非常に重要です。人間は、現実のタスクでの「大半の作業」を容認しません。エージェントが成功した行動を確実に再現できない場合、つまりベビーシッターが必要な場合、顧客にとっての価値は急速に低下します。

デスクトップエージェントが使用可能になりつつある

今日の SaaS ユーザー・インターフェースの多くは、仕事ではなく摩擦に関するものです。過剰なクリックや脆弱な抽象化により、ユーザーが現在行おうとしていることとは一致しません。だからこそ、エージェント企業はデスクトップワークフローの自動化を急いでいます。しかし、2025年の経験では、数回クリックする方が、LLMに冗長なコマンドを入力したり話しかけたりして、応答を待ってから反復するよりも速く、明確でした。AI ツールが実際にどのように作業者の作業速度を低下させたかを宣言する見出しを見ても驚くことではありませんでした。

しかし、状況は急速に変化しています。昨年のコンピューター使用エージェントが幼児だったとしたら、いくつかのステップを踏むことはできても、常に何かを壊すリスクがありました。今年は、5歳児のように感じられます。エージェントはまだ限られており、非常にクリエイティブな作業や曖昧な作業には対応できません。しかし、彼らは安定して歩くことができます。彼らは指示に従うことができます。そして重要なのは、子供が親のあとで言葉を繰り返すような、重い理屈を必要としないタスクを繰り返すことができるということです。

pass^kが改善され続けるにつれて、絶え間ない人間の介入なしにエンドツーエンドのタスクを完了する、実行可能なクロスOSデスクトップエージェントが登場するでしょう。信頼性が閾値を超えると、能力の拡大は加速します。最終的には、インターフェイスを見て操作できるコンピューターを使用するエージェントが SaaS の上位に位置するようになります。SaaS は基本的に、最新の UI を備えた自動化された人間が定義したワークフローです。

人間が操作しなくなると、ハードウェアは簡素化されます

3つ目のトレンドは、当社のビジョンである自律型コンピュータ企業と直接結びついています。

最新のハードウェアのほとんどは、人間工学に基づいて設計されています。Appleがトラックパッドを完成させたのは、人間がそれを必要としていたからです。しかし、AI が主な操作者になれば、移動、クリック、入力はなくなります。コンピューター・オペレーティング・エージェントがより強力になるにつれて、それをホストするハードウェアはそれほど複雑ではなくなるでしょう。エージェントは、人間とコンピューターの不要な相互作用を排除します。人間が意図を発する。AIが仕事をします。

これが、初日からのエンドゲームがソフトウェアに限定されない理由です。時間が経つにつれて、最終的にどのような形であれ、コンピュータはまずエージェント向けに設計されるようになるでしょう。私たちは、AI ハードウェアがただ話すだけではない (Alexa など) 段階に入りつつあります。また、そうなるでしょう。行う。

________

汎用人工知能と社会的混乱には当然のことながら不安があります。しばらくの間、エージェントは人々が現在行っていることの多くを行います。これらの懸念には真剣に取り組むべきです。

しかし、テクノロジーの変化は破壊的ではあるものの、常に新しいタイプの仕事を生み出してきたことは、歴史が示唆しています。組立ラインは製造業の雇用を終わらせたわけではなく、まったく新しい産業を生み出しました。エージェントの信頼性が真に高まると、課題は、依然として人間の判断と創造性を必要とする新たな問題に対する人的労働力の供給不足へと移る可能性があります。

2026年の違いは、私たちが限界を超えているということです。デスクトップエージェントはリサーチラボからプロダクションツールへと移行しつつあります。エージェントの信頼性は高まりつつあり、企業もそれに頼るようになってきています。問題はもはや、エージェントが人間と同じことができるかどうかではなく、この移行を円滑にする人間と人工知能のコラボレーションパターンをどのように設計するかです。

2026年は、デスクトップエージェントがおもちゃではなくなり、実際の人間の仕事を始める年になるでしょう。そして、これは始まりに過ぎません。

自律型コンピュータを構築しても、人間が置き換えられるわけではありません。それは協力を意味する。

コンピューターから手を離してください。Simular を今すぐ無料でダウンロードしてください。

Simularを試してみる