Todo o setor de IA está a falar sobre o Manus e nós pusemo-lo à prova
Inteligência Artificial

Todo o setor de IA está a falar sobre o Manus e nós pusemo-lo à prova

O novo agente geral de Inteligência Artificial da China apresentou algumas falhas no sistema e sobrecarga no servidor — mas é altamente intuitivo e mostra um grande potencial para o futuro dos assistentes de IA.

Desde que o agente geral de IA Manus foi lançado no início de março, ele propagou-se pela internet como fogo. E não apenas na China, onde foi desenvolvido pela startup Butterfly Effect, sediada em Wuhan. Ele entrou no panorama global das IAs, com vozes influentes da tecnologia, incluindo o cofundador do Twitter Jack Dorsey e o líder de produto da Hugging Face, Victor Mustar, a fazer elogios ao seu desempenho. Alguns chegaram a chamá-lo de “o segundo DeepSeek”, comparando-o ao modelo de IA anterior que surpreendeu a indústria tanto pelas suas capacidades inesperadas quanto pela sua origem.

O Manus afirma ser o primeiro agente geral de IA do mundo, que utiliza múltiplos modelos de IA (como o Claude 3.5 Sonnet da Anthropic e versões ajustadas do Qwen de código aberto da Alibaba) e vários agentes que operam de forma independente para agir autonomamente numa ampla variedade de tarefas. (Isso torna-o diferente de chatbots de IA, como o DeepSeek, que só se baseiam numa única família de modelos de linguagem e são projetados principalmente para interações conversacionais.)

Apesar de toda a empolgação, poucas pessoas tiveram a chance de usá-lo. Atualmente, menos de 1% dos usuários na lista de espera receberam um código de convite. (Não está claro quantas pessoas estão nessa lista, mas, para se ter uma ideia do interesse, o canal do Manus no Discord tem mais de 186.000 membros.)

A MIT Technology Review conseguiu acesso ao Manus e, ao testá-lo, senti que usá-lo era como colaborar com um estagiário altamente inteligente e eficiente: embora ocasionalmente não entenda o que está a ser solicitado, faça suposições incorretas ou tome atalhos para agilizar tarefas, ele explica claramente o seu raciocínio, é notavelmente adaptável e pode melhorar substancialmente quando recebe instruções ou feedback detalhados. Em resumo, é promissor, mas não perfeito.

Assim como o produto anterior da empresa-mãe — um assistente de IA chamado Monica lançado em 2023 — o Manus é voltado para um público global. O inglês é definido como idioma padrão, e o seu design é limpo e minimalista.

Para entrar, o usuário precisa inserir um código de convite válido. Em seguida, o sistema direciona os usuários para uma página inicial muito semelhante às do ChatGPT ou DeepSeek, com sessões anteriores exibidas em uma coluna à esquerda e uma caixa de entrada de chat no centro. A página inicial também apresenta tarefas de exemplo organizadas pela empresa — que vão desde desenvolvimento de estratégias de negócios até aprendizagem interativa e sessões de meditação personalizadas em áudio.

Como outras ferramentas de IA agentivas, baseadas em raciocínio, como o ChatGPT DeepResearch, o Manus é capaz de dividir tarefas em etapas e navegar autonomamente pela web para obter as informações necessárias para completá-las. O que o diferencia é a janela chamada “Computador do Manus”, que permite aos usuários não apenas observar o que o agente está a fazer, mas também intervir a qualquer momento.

Para testá-lo, dei ao Manus três tarefas: (1) compilar uma lista de jornalistas relevantes que cobrem tecnologia na China, (2) buscar imóveis de dois quartos em Nova York, e (3) indicar possíveis candidatos para o prêmio Innovators Under 35, da MIT Technology Review.

Veja como ele se saiu:

Tarefa 1: A primeira lista de jornalistas entregue pelo Manus continha apenas cinco nomes, com cinco “menções honrosas” abaixo deles. Notei que ele listava trabalhos notáveis de alguns jornalistas, mas não de outros. Perguntei ao Manus o motivo. A resposta foi hilariante de tão simples: ele ficou com preguiça. Foi “em parte devido a restrições de tempo enquanto eu tentava acelerar o processo de pesquisa”, disse o agente. Quando exigi consistência e profundidade, o Manus respondeu com uma lista abrangente de 30 jornalistas, informando o veículo atual e mencionando trabalhos relevantes. (Fiquei feliz em ver meu nome incluído, junto com muitos colegas estimados.)

Fiquei impressionado com o fato de poder sugerir mudanças de alto nível, como se estivesse lidando com um estagiário ou assistente real, e ele responder de forma apropriada. E embora inicialmente tenha deixado passar alterações no veículo de alguns jornalistas, ao pedir uma revisão dos resultados, ele corrigiu rapidamente. Outro recurso útil: o resultado pôde ser baixado em formato Word ou Excel, facilitando a edição ou o compartilhamento com outras pessoas.

O Manus, no entanto, teve dificuldades ao acessar artigos jornalísticos protegidos por paywalls; frequentemente era barrado em captchas. Como pude acompanhar cada passo, consegui intervir para resolver essas barreiras, embora muitos sites ainda tenham bloqueado a ferramenta, alegando atividade suspeita. Vejo um grande potencial de melhoria nesse ponto — e seria útil se uma futura versão do Manus pudesse pedir ajuda proativamente ao encontrar esse tipo de restrição.

Tarefa 2: Para a busca por apartamentos, forneci ao Manus um conjunto complexo de critérios, incluindo orçamento e várias exigências: uma cozinha espaçosa, área externa, acesso a Manhattan e uma estação de metro principal a até sete minutos a pé. O Manus interpretou inicialmente exigências vagas, como “algum tipo de área externa”, de forma muito literal, excluindo completamente propriedades sem terraço privado ou acesso à varanda. No entanto, após mais orientações e esclarecimentos, conseguiu compilar uma lista mais ampla e útil, com recomendações em categorias e marcadores organizados.

O resultado final parecia algo tirado do Wirecutter, com subtítulos como “melhor opção geral”, “melhor custo-benefício” e “opção de luxo”. Esta tarefa (incluindo os ajustes) levou menos de meia hora — bem menos tempo que a tarefa dos jornalistas (que levou pouco mais de uma hora), provavelmente porque os anúncios de imóveis são mais acessíveis e bem estruturados na internet.

Tarefa 3: Esta foi a mais abrangente: pedi ao Manus que indicasse 50 pessoas para a lista anual Innovators Under 35. Produzir essa lista é uma tarefa enorme, e normalmente recebemos centenas de indicações por ano. Estava curioso para ver como o Manus se sairia. Ele dividiu a tarefa em etapas, incluindo a análise de listas anteriores para entender os critérios de seleção, a criação duma estratégia de busca para identificar candidatos, a compilação de nomes e a garantia duma seleção diversa de candidatos de todo o mundo.

Desenvolver uma estratégia de busca foi a parte mais demorada para o Manus. Embora ele não tenha detalhado explicitamente a sua abordagem, a janela “Computador do Manus” revelou o agente a navegar rapidamente por sites de universidades de pesquisa prestigiadas, anúncios de prêmios tecnológicos e artigos de notícias. Mais uma vez, ele encontrou obstáculos ao tentar acessar artigos acadêmicos e conteúdo protegido por paywalls.

Após três horas vasculhando a internet — durante as quais o Manus (com razão) perguntou-me várias vezes se eu poderia restringir a busca — ele conseguiu apresentar apenas três candidatos com perfis completos. Quando insisti novamente para que fornecesse uma lista completa com 50 nomes, ele acabou por gerar uma, mas certas instituições acadêmicas e áreas estavam excessivamente representadas, refletindo um processo de pesquisa incompleto. Depois que apontei o problema e pedi que encontrasse cinco candidatos da China, ele conseguiu compilar uma lista sólida com cinco nomes, embora os resultados estivessem inclinados para figuras populares da mídia chinesa. No fim, tive que desistir depois que o sistema alertou que o desempenho do Manus poderia piorar caso eu continuasse a inserir muito texto.

A minha avaliação: de modo geral, achei o Manus uma ferramenta altamente intuitiva, adequada para usuários com ou sem experiência em programação. Em duas das três tarefas, ele apresentou resultados melhores do que o ChatGPT DeepResearch, embora tenha demorado significativamente mais para concluí-las. O Manus parece mais adequado para tarefas analíticas que exigem ampla pesquisa na internet aberta, mas com escopo limitado. Em outras palavras, funciona melhor para o tipo de coisa que um estagiário humano poderia fazer ao longo de um dia de trabalho.

Ainda assim, nem tudo é tranquilo. O Manus pode sofrer com bloqueios frequentes e instabilidade no sistema, e pode ter dificuldades em processar grandes volumes de texto. A mensagem “Devido à alta carga de serviço no momento, não é possível criar tarefas. Por favor, tente novamente em alguns minutos” apareceu na minha tela algumas vezes quando tentei iniciar novas solicitações, e ocasionalmente o Computador do Manus travava numa determinada página por um longo tempo.

Ele apresenta uma taxa de falhas mais alta do que o ChatGPT DeepResearch — um problema que a equipa está a tentar resolver, segundo o cientista-chefe do Manus, Peak Ji. Dito isso, o veículo de mídia chinês 36Kr informa que o custo por tarefa do Manus é de cerca de US$ 2, o que representa apenas um décimo do custo do DeepResearch. Se a equipa do Manus reforçar a sua infraestrutura de servidores, consigo ver a ferramenta a tornar-se a escolha preferida para usuários individuais, especialmente profissionais de colarinho branco, desenvolvedores independentes e pequenas equipes.

Por fim, considero valioso o facto do processo de trabalho do Manus parece relativamente transparente e colaborativo. Ele faz perguntas ao longo do caminho e retém instruções-chave como “conhecimento” na sua memória para uso futuro, permitindo uma experiência agentiva facilmente personalizável. Também é muito positivo que cada sessão possa ser reproduzida e compartilhada.

Espero continuar a usar o Manus para os mais diversos tipos de tarefas, tanto na vida pessoal quanto profissional. Embora eu não tenha certeza se as comparações com o DeepSeek sejam totalmente justas, ele serve como mais uma evidência de que as empresas chinesas de IA não estão apenas a seguir os passos das suas contrapartes ocidentais. Em vez de apenas inovar sobre modelos base, elas estão a moldar ativamente a adopção de agentes autônomos de IA à sua maneira.

Nossos tópicos