Créditos: Divulgação/Google

    Em um anúncio que promete redefinir o futuro da inteligência artificial (IA), o Google revelou o Project Astra, um ambicioso projeto de assistente virtual multimodal em tempo real. A gigante da tecnologia busca criar um companheiro digital que não apenas compreenda o mundo ao seu redor, mas também o ajude a realizar praticamente qualquer tarefa.

    Demis Hassabis, líder da equipe de IA do Google, revelou durante a conferência anual de desenvolvedores Google I/O a primeira versão do que ele espera que se torne um assistente universal.

    Publicidade.

    O Project Astra, nomeado em homenagem à deusa grega da luz e do conhecimento, impressionou o público com uma demonstração em vídeo, na qual um usuário interagia com o sistema em tempo real, pedindo-lhe para identificar objetos, localizar itens perdidos, revisar códigos e muito mais.

    A visão de Hassabis para o Project Astra é clara: criar um assistente multimodal, sempre presente e útil em todos os momentos. Ele compara sua visão a dispositivos icônicos da cultura pop, como o comunicador de Star Trek e a voz do filme “Her”.

    O Project Astra é apenas um dos muitos anúncios relacionados ao Gemini, a nova geração de modelos de linguagem de grande escala do Google. O Gemini 1.5 Flash, por exemplo, foi projetado para ser mais rápido em tarefas comuns, como resumir e legendar. Outro modelo, chamado Veo, pode gerar vídeos a partir de prompts de texto.

    Google mira cineastas com Veo, seu novo modelo de vídeo com IA

    Segundo Hassabis, o futuro da IA está nos agentes, bots que não apenas conversam com os usuários, mas também realizam tarefas em seu nome. Ele prevê uma variedade de agentes, desde ferramentas simples até colaboradores e companheiros, moldados de acordo com as preferências e o contexto de cada usuário.

    O desenvolvimento do Project Astra se apoia na tecnologia do Gemini 1.5 Pro, o modelo de linguagem de grande escala mais recente do Google. A equipe do DeepMind dedicou seis meses para aprimorar a velocidade e a latência do sistema, elementos cruciais para garantir uma experiência de usuário fluida e intuitiva.

    O Google também apresentou outras novidades que aproveitam o poder do Gemini. O Gemini Live, por exemplo, é um assistente de voz que permite conversas naturais com o modelo. Um novo recurso no Google Lens permite pesquisar na web gravando e narrando um vídeo.

    O Project Astra ainda está em fase inicial de desenvolvimento, mas representa um passo significativo em direção ao futuro da IA. A equipe do DeepMind continua pesquisando como combinar modelos multimodais e equilibrar modelos gerais de grande escala com modelos menores e mais focados.

    Fonte: Google

    Share.