Créditos: Divulgação/Google

    O Google anunciou avanços significativos em sua família de modelos de inteligência artificial generativa, o Gemini. A nova versão, Gemini 1.5 Pro, agora é capaz de analisar até 2 milhões de tokens, o dobro da versão anterior e a maior capacidade de entrada entre os modelos comercialmente disponíveis.

    Essa expansão permite ao Gemini processar cerca de 1,4 milhão de palavras, o equivalente a duas horas de vídeo ou 22 horas de áudio, abrindo novas possibilidades para análise de grandes volumes de dados e geração de conteúdo rico e contextualizado.

    Publicidade.

    Além da capacidade de analisar arquivos extensos, o Gemini 1.5 Pro aprimora a compreensão do fluxo de dados e a geração de respostas contextualmente relevantes. Ao contrário de modelos com capacidade de entrada limitada, o Gemini não “esquece” conversas recentes e mantém a coerência em diálogos longos.

    Desenvolvedores interessados podem se inscrever na lista de espera para experimentar o Gemini 1.5 Pro no Google AI Studio. A versão com 1 milhão de tokens será disponibilizada para todos os desenvolvedores nos próximos meses.

    Gemini x ChatGPT: Entenda as diferenças e como funcionam os chatbots baseados em IA

    Para tarefas menos exigentes, o Google lançou o Gemini 1.5 Flash, uma versão otimizada e eficiente do Gemini 1.5 Pro. O Flash, com capacidade de até 2 milhões de tokens, é multimodal e ideal para tarefas como sumarização, chatbots, legendagem e extração de dados.

    Josh Woodward, vice-presidente do Google Labs, destaca que o Flash é ideal para desenvolvedores que priorizam a velocidade de saída do modelo.

    O Google também anunciou que todos os modelos Gemini em breve poderão usar o recurso de cache de contexto, permitindo armazenar grandes volumes de informações para acesso rápido e econômico. A Batch API, disponível no Vertex AI, oferece uma maneira mais eficiente de lidar com cargas de trabalho como classificação, extração de dados e geração de descrições.

    Carteira do Google deixará de funcionar em Android antigo

    Outro recurso em desenvolvimento, a geração controlada, permitirá aos usuários definir saídas do modelo de acordo com formatos específicos, como JSON ou XML, otimizando custos e tornando o contexto longo mais útil e acessível.

    Fonte: Google

    Share.