Gemini no Android: Google prepara automação de tela para executar tarefas em aplicativos

O Google Gemini está prestes a ganhar um recurso de automação de tela no Android, permitindo reservar viagens, pedir comida e controlar aplicativos diretamente, com foco em privacidade e controle do usuário.

TECNOLOGIANOTICIAS

Thiago Regis

2/4/20264 min read

Gemini no Android: Google prepara automação de tela para executar tarefas em aplicativos
Gemini no Android: Google prepara automação de tela para executar tarefas em aplicativos

Google avança com o Gemini rumo à automação total

O Google vem ampliando rapidamente as capacidades do Gemini, seu assistente de inteligência artificial, para além de respostas e sugestões. A empresa trabalha para transformar o sistema em um agente capaz de executar ações diretamente em nome do usuário, inaugurando uma nova fase da automação digital.

Recentemente, o Google lançou no Chrome um recurso de Navegação Automática com IA, disponível para assinantes dos planos AI Pro e AI Ultra. Agora, as atenções se voltam para o próximo grande passo: levar essa automação também para o Android, permitindo que o Gemini controle aplicativos no celular.

O recurso “Realize tarefas com o Gemini” já aparece em versão beta

De acordo com um relatório do site 9to5Google, uma análise da versão beta mais recente do aplicativo do Google (v17.4) revelou detalhes importantes sobre uma funcionalidade chamada “Realize tarefas com o Gemini”.

Internamente, o recurso recebeu o codinome bonobo e deve ser lançado inicialmente como parte do Google Labs, área de testes experimentais da empresa.

O objetivo é simples, mas ambicioso: permitir que o Gemini realize tarefas práticas dentro de aplicativos compatíveis, por meio de uma tecnologia descrita como automação de tela.

Como a automação de tela pode funcionar na prática

A proposta é transformar o Gemini em um verdadeiro assistente agente, capaz de interagir com aplicativos de forma semelhante a um humano, seguindo etapas na interface.

Na prática, isso permitiria comandos como:

  • pedir ao Gemini para reservar um Uber até o trabalho

  • solicitar comida via Uber Eats sem abrir o aplicativo

  • preencher formulários automaticamente

  • selecionar opções e confirmar ações dentro de apps

Ou seja, o usuário não precisaria navegar manualmente pelos menus. O Gemini faria isso diretamente na tela.

Compatibilidade limitada a “certos aplicativos” no início

Segundo os códigos encontrados na versão beta, os recursos de automação do Gemini funcionarão inicialmente apenas em certos aplicativos.

Isso faz sentido porque:

  • interfaces de aplicativos mudam frequentemente

  • automação exige estabilidade e previsibilidade

  • o Google precisa evitar falhas e riscos em apps sensíveis

Os primeiros suportados devem incluir:

  • apps de transporte

  • aplicativos de delivery

  • ferramentas do próprio Google

Com o tempo, o suporte pode ser expandido para outros serviços.

Requisito técnico: Android 16 QPR3

Outro ponto importante revelado é que a automação de tela exigirá pelo menos o Android 16 QPR3.

Essa versão do sistema parece preparar o terreno para que o Gemini possa:

  • capturar contexto da tela

  • interpretar elementos visuais

  • executar comandos com segurança

Isso mostra que o recurso está sendo construído como parte profunda da evolução do Android.

Usuário mantém controle total sobre as ações

Apesar da automação avançada, o Google destaca que o usuário continuará no comando.

Os avisos encontrados no código afirmam que:

  • o Gemini pode cometer erros

  • o usuário é responsável pelas ações realizadas

  • é possível interromper ou assumir manualmente a tarefa a qualquer momento

Isso é essencial para evitar que o assistente execute ações indesejadas, principalmente em aplicativos que envolvem compras ou reservas.

Privacidade: capturas de tela podem ser analisadas

Um dos pontos mais sensíveis do novo recurso envolve privacidade e segurança.

O Google explica que, quando o Gemini interage com um aplicativo, capturas de tela dessas interações podem ser analisadas por revisores treinados, caso o usuário tenha a opção Manter atividade ativada.

Segundo a empresa, isso é usado para:

  • melhorar os serviços

  • treinar sistemas de automação

  • aprimorar a experiência do Gemini

Ao mesmo tempo, o Google recomenda:

  • não compartilhar senhas no chat

  • evitar inserir dados bancários

  • não usar automação em tarefas emergenciais ou confidenciais

Esse alerta reforça que a tecnologia ainda está em desenvolvimento e requer cautela.

Outro codinome na beta: “wasabi” e avatares 3D

Além do bonobo, a versão beta também menciona outro recurso interno chamado wasabi, ligado a algo chamado “Semelhança”.

Esse recurso parece relacionado a:

  • avatares 3D

  • identidade visual do usuário

  • integração com chamadas no Google Meet e no Android XR

O Gemini poderia permitir que o usuário gerencie sua imagem ou avatar usando comandos por texto, com restrição de uso apenas pelo próprio dono.

Gemini como agente digital: uma mudança no uso do Android

Se lançado oficialmente, o recurso de automação de tela do Gemini pode mudar profundamente a maneira como as pessoas usam smartphones.

Em vez de apenas responder perguntas, o Gemini passaria a:

  • executar tarefas completas

  • interagir com apps como um “assistente humano”

  • automatizar ações repetitivas do cotidiano

Essa tendência segue o movimento global das big techs rumo aos chamados assistentes agentes, capazes de agir, decidir e executar.

Conclusão: automação no Gemini está perto, mas ainda em testes

O Google está cada vez mais próximo de dar ao Gemini no Android a capacidade de realizar tarefas diretamente em aplicativos, como pedir comida ou reservar viagens.

Apesar de promissor, o recurso ainda está em fase beta, com limitações iniciais, requisitos técnicos e preocupações importantes sobre privacidade e responsabilidade.

Por enquanto, o projeto segue em desenvolvimento dentro do Google Labs, mas já aponta para um futuro em que a inteligência artificial deixará de ser apenas uma ferramenta de consulta e passará a ser um agente ativo no dia a dia digital.

Privacidade: capturas de tela podem ser analisadas
Privacidade: capturas de tela podem ser analisadas
Gemini como agente digital: uma mudança no uso do Android
Gemini como agente digital: uma mudança no uso do Android