A Google revelou nesta semana o Gemini 2.0, sua mais recente e poderosa geração de inteligência artificial. A novidade desta atualização da LLM chega para elevar o nível das soluções multimodais da empresa, trazendo suporte nativo para geração de imagens e áudio, além de avanços significativos em desempenho e eficiência.
A estratégia de lançamento começou com a versão experimental Gemini 2.0 Flash, projetada para ser mais acessível e eficiente. A ideia da Google é demonstrar o potencial do modelo sem comprometer custos e desempenho.
Em benchmarks como o HiddenMath, usado para testar problemas matemáticos complexos, o modelo obteve 63%, superando com folga o Gemini 1.5 Flash (47,2%).
Através da evolução para o Gemini 2.0, a Google quer atuar em mais frentes, deixando a tecnologia mais versátil para os usuários. Recursos como geração de áudio, melhor compreensão de contextos longos e até integração com ferramentas como Google Lens e Maps estão no centro dessa evolução.
Entre os projetos de destaque está o Project Astra, que, com o suporte do Gemini 2.0, expande sua capacidade de navegação, identificação de objetos e assistência no cotidiano.
Desde sua apresentação no Google I/O, o Projeto Astra tem sido uma vitrine para as capacidades do Gemini 2.0. Combinando diálogo, memória, ferramentas e baixa latência, o Astra é um dos assistentes mais completos da atualidade.
- Diálogos melhorados: a nova versão do Astra é capaz de alternar entre idiomas em uma única interação, com compreensão aprimorada de sotaques e termos menos comuns. Essa fluidez linguística reforça sua aplicabilidade em cenários globais.
- Integração de ferramentas: o Gemini 2.0 expandiu o arsenal do Astra, permitindo acesso direto ao Google Lens, Google Maps e Google Pesquisa, tornando-o um aliado ainda mais prático no cotidiano.
- Memória aprimorada: com retenção de informações estendida para 10 minutos em sessões ativas, o Astra oferece uma experiência personalizada ao lembrar de interações passadas, otimizando a continuidade do suporte.
- Latência reduzida: graças às melhorias no processamento de linguagem natural e streaming, as respostas do Astra ocorrem em velocidade quase humana, aprimorando a interação em tempo real.
A Google também introduziu novas soluções para desenvolvedores, como o Jules, que auxilia na identificação e correção de bugs em códigos. Outro exemplo é o Project Mariner, uma extensão experimental para o Chrome que usa IA para automatizar tarefas no navegador.
Portanto, todos estes avanços colocam o foco da empresa em tornar a IA mais poderosa e útil em diversos tipos de cenário.
O lançamento ocorre em um mês agitado para o mercado de IA. Ainda na mesma semana, a OpenAI anunciou melhorias no ChatGPT, como o novo modelo Pro e a chegada do ChatGPT ao iOS, enquanto sua ferramenta de criação de vídeos por IA, Sora, foi aberta ao público. Além disso, o modelo Grok do X de Elon Musk foi disponibilizado gratuitamente em algumas regiões, como o Brasil.
Para os usuários de iPhone, o Gemini também chegou recentemente ao iOS, trazendo sua tecnologia para novos dispositivos. Tal cenário competitivo ilustra a intensa competição entre gigantes tecnológicas, todas em busca de consolidar sua posição no mercado de IA.
A Google acredita que 2025 será o verdadeiro início da “era dos agentes inteligentes”. Soluções como o Gemini 2.0 Flash pavimentam o caminho para um futuro onde IA multimodal será a base de assistentes universais e ferramentas de automação.
A promessa dos agentes baseados no Gemini 2.0 ultrapassará a interação tradicional. Com capacidades aprimoradas de processamento e análise em tempo real, eles podem agir de forma autônoma para auxiliar em tarefas como navegação, assistência em jogos e até automação de atividades no ambiente físico.
Os agentes desenvolvidos para jogos, como demonstrado no Gemini 2.0, podem analisar o jogo em andamento, oferecer sugestões estratégicas e até mesmo interagir diretamente com o ambiente virtual.
O formato de aplicação já foi testado com sucesso em colaborações com empresas como a Supercell, destacando o potencial de agentes para diferentes tipos de jogos.
Além dos cenários virtuais, a Google está explorando a aplicação de agentes em ambientes físicos. Utilizando as capacidades de raciocínio espacial do Gemini 2.0, esses agentes têm potencial para transformar a robótica e automação doméstica, sendo úteis em tarefas cotidianas.
Hoje, o Gemini 2.0 final já está disponível para desenvolvedores e parceiros de confiança. A partir de agora, o modelo experimental Gemini 2.0 Flash está acessível a todos os usuários do Gemini.
Além disso, uma nova funcionalidade chamada Deep Research foi lançada. Ela utiliza raciocínio avançado e contexto expandido para atuar como um assistente de pesquisa, capaz de explorar temas complexos e criar relatórios detalhados. A ferramenta já está disponível para o Gemini Advanced.
Por fim, com melhorias em segurança e eficiência, a Google está determinada a liderar essa transformação. Será que ela vai conseguir competir pela liderança?
Fonte: Google