objeto

2026: o ano em que os agentes de desktop deixam de ser um brinquedo

de Ang Li • Palo Alto, Califórnia • 26 de janeiro de 2026

2025 pareceu um ano falando sobre agentes.

A ascensão de Manus e a enxurrada de ferramentas agentes que se seguiram pareceram eufóricas — e um pouco estranhas de assistir. Quando eu estava trabalhando com agentes de IA em 2019, poucos se importaram, e as pessoas me disseram que deveria pesquisar “copilotos”, então a tendência em alta. Mas eu sempre buscava algo mais: agentes que usassem computadores que pudessem ver telas, usar teclados e mouses e operar de forma confiável em qualquer interface de computador para que os humanos pudessem finalmente se livrar do trabalho excessivo no desktop.

Esse futuro deixou de parecer abstrato no ano passado e está muito mais próximo agora. Os LLMs avançaram muito, mas também é assim que o setor pensa sobre a confiabilidade da IA. Aqui estão três tendências que espero ver no próximo ano.

A confiabilidade agente obtém a avaliação correta

Os benchmarks sempre definiram o ritmo do avanço tecnológico. Por muito tempo, os agentes foram avaliados para saber se conseguiriam ter sucesso uma vez. O antigo benchmark pass @k, que mede o sucesso em uma única tentativa, escolhe aquele vencedor de um jogo. Mas isso não captura confiabilidade nem responde: posso confiar nisso toda vez que essa situação surgir?

O setor está convergindo para uma estrutura melhor: pass^k, que foi a primeira introduzido como parte do benchmark τ para agentes baseados em LLM em 2024. Pass^k se refere à probabilidade de um agente ter sucesso toda vez em k ensaios. À medida que k aumenta, pass^k diminui. Por exemplo, um agente com uma taxa de sucesso de 75% por tentativa (pass @k) tem apenas ~ 42% de chance de sucesso três vezes seguidas. Ou seja, seu pass^k é apenas (0,75) ³ ≈ 42%.

Para muitos agentes voltados para o cliente, a repetibilidade é fundamental. Os humanos não toleram “trabalhos principalmente” em tarefas da vida real. Se um agente não consegue reproduzir de forma confiável um comportamento bem-sucedido — se ainda precisa de babá — seu valor para o cliente diminui rapidamente.

Os agentes de desktop estão se tornando utilizáveis

Atualmente, uma grande quantidade de interfaces de usuário SaaS não se trata de trabalho, mas de atrito: cliques excessivos e abstrações frágeis que não correspondem ao que o usuário está tentando fazer no momento. É por isso que as empresas de agências se apressam em automatizar os fluxos de trabalho de desktop. Mas em 2025, sua experiência pode ser a seguinte: clicar algumas vezes ainda era mais rápido e claro do que digitar ou falar um comando detalhado para um LLM, esperar por uma resposta e depois iterar. Não foi surpreendente ver manchetes declarando como as ferramentas de IA realmente atrasaram os trabalhadores.

Mas as coisas estão mudando rapidamente. Se os agentes que usaram computadores no ano passado eram crianças pequenas — capazes de dar alguns passos, mas constantemente correndo o risco de quebrar alguma coisa — este ano eles se sentem mais como crianças de cinco anos. Eles ainda são limitados e não conseguem lidar com trabalhos profundamente criativos ou ambíguos. Mas eles podem andar com firmeza. Eles podem seguir as instruções. E, o mais importante, eles podem repetir tarefas que não exijam raciocínio pesado, como uma criança repetindo palavras depois dos pais, alcançando novos marcos no pass^k.

À medida que o pass^k continuar melhorando, veremos o agente de desktop viável e multisistema operacional que conclui tarefas de ponta a ponta sem intervenção humana constante. O crescimento da capacidade aumenta quando a confiabilidade ultrapassa um limite. Eventualmente, agentes que usam computadores que podem ver e operar uma interface ficarão no topo do SaaS, que é essencialmente um fluxo de trabalho automatizado definido por humanos com uma interface de usuário moderna.

O hardware será simplificado quando os humanos não operarem mais

A terceira tendência está diretamente ligada à visão da nossa empresa: a empresa de computadores autônomos.

A maioria dos hardwares modernos é projetada com base na ergonomia humana. A Apple aperfeiçoou o trackpad porque os humanos precisavam dele. Mas se a IA se tornar o operador principal, mover, clicar e digitar desaparecerão. À medida que os agentes operacionais do computador se tornam mais poderosos, o hardware que os hospeda se torna menos complicado. Os agentes eliminam a interação desnecessária entre humanos e computadores. Humanos emitem intenções. A IA faz o trabalho.

É por isso que nosso jogo final desde o primeiro dia não se restringe ao software. Com o tempo, os computadores serão projetados primeiro para os agentes — seja qual for a forma que ela assuma. Estamos entrando em uma fase em que o hardware de IA não fala apenas (pense na Alexa). Também será fazer.

________

Há uma ansiedade compreensível em relação à AGI e à disrupção social. Por um período, os agentes farão muito do que as pessoas fazem hoje. Essas preocupações merecem atenção séria.

Mas a história sugere que as mudanças tecnológicas, embora disruptivas, sempre criaram novos tipos de trabalho. A linha de montagem não acabou com os trabalhos na manufatura — ela criou indústrias totalmente novas. Quando os agentes se tornam realmente confiáveis, o desafio pode se transformar em uma oferta insuficiente de mão de obra humana para os novos problemas que ainda exigem julgamento e criatividade humanos.

O que torna 2026 diferente é que estamos cruzando um limiar. Os agentes de desktop estão migrando dos laboratórios de pesquisa para as ferramentas de produção. Eles estão se tornando confiáveis o suficiente para que as empresas comecem a depender deles. A questão não é mais se os agentes podem fazer o que os humanos fazem; é como projetamos padrões de colaboração entre humanos e inteligência artificial que facilitam essa transição.

2026 será o ano em que os agentes de desktop deixarão de ser um brinquedo e começarão a fazer um trabalho humano real. E isso é só o começo.

Construir computadores autônomos não significa substituir humanos. Isso significa cooperação.

Liberte suas mãos do computador. Baixe o Simular hoje gratuitamente.

Experimente o Simular