Nesta quarta-feira (06), o Google anunciou seu mais novo modelo de linguagem de Inteligência Artificial que promete integrar os maiores comandos de um chatbot em apenas um.
Depois de passar por uma sessão longa de testes, o Gemini conta com as maiores funções relacionadas a geração de texto, imagem, vídeo, áudio e até programação, dispensando a criação de modelos separados que dividem os chatbots dos geradores de imagens.
O anúncio veio através de Demis Hassabis, CEO da DeepMind, em um vídeo de mais de quatro minutos, onde ele apresentou tudo que poderá ser feito com a mais nova IA integrada do Google.
O Google Bard já era uma das ferramentas convencionais que estrearam no começo do ano como o Chat GPT e o Bing Chat da Microsoft. Embora tenha sido criada com uma limitação, a versão turbinada chega neste mês com uma versão mais turbinada e eficiente do modelo de linguagem.
Porém, para poder bater de frente com o GPT, ainda falta muito e a própria Google sabe disso. Nessa nova versão testada, foram vários testes de desempenho que chegaram a apontar o Gemini como a primeira IA MMLU (Compreensão Massiva de Linguagem Multitarefal).
No momento, são três modelos com tamanhos distintos otimizados para as diferentes plataformas, como smartphones e notebooks:
- Gemini Ultra: versão mais poderosa para tarefas complexas
- Gemini Pro: versão intermediária para tarefas diversificadas
- Gemini Nano: versão mais eficiente para processamento local em dispositivos de consumo, como celulares, tablets e notebooks
Os conhecimentos do Gemini abordam temas como matemática, física, história, direito, medicina e ética, além de habilidades de resolução de problemas. A pontuação do Gemini Ultra foi de 90,0%, enquanto da maioria da população humana atinge 89,7%.
A título de comparação, o Chat GPT atinge a mesma comparação de 86,4%.
O Gemini também permite entradas diferentes e distintas do modelo de linguagem além dos já tradicionais textos e imagens também será possível gravar um vídeo, enviar para o Gemini e pedir comandos com base nessa tecnologia.
Nos ensaios de processamento de imagem, o Gemini Ultra se destacou superando todos os concorrentes de última geração em inteligência artificial, mesmo sem depender de sistemas de reconhecimento de caracteres. Esses sistemas costumam extrair textos de imagens para facilitar a identificação do conteúdo. Em todos os benchmarks realizados, o desempenho do Gemini Ultra superou o do GPT-4V.
Tanta eficiência em “ultrapassar as barreiras da Inteligência Artificial” pode resultar em uma grande demanda, o que por sua vez pode ocasionar uma quebra de funcionamento, Segundo Hassabis, o Google também desenvolveu uma análise de riscos em cada estágio de desenvolvimento:
Conduzimos novas pesquisas em áreas de risco potencial, como ofensa cibernética, persuasão e autonomia, e aplicamos as melhores técnicas de teste para ajudar a identificar problemas críticos de segurança antes da implantação do Gemini.
O Google Gemini chegará para os celulares, notebooks da Google, incluindo os celulares Pixel 8 Pro.