Fim do ChatGPT? Google lança Gemini, que promete revolucionar IAs

Gemini, o novo modelo multimodal da Google, promete superar as capacidades do ChatGPT, destacando-se em texto, áudio, imagem e programação.

A Google anunciou na quarta-feira (6/12) seu mais recente avanço em inteligência artificial (IA): Gemini.

Este novo grande modelo de linguagem (LLM) multimodal promete superar o GPT-4, utilizado no popular chatbot ChatGPT, e marca um marco significativo no desenvolvimento de IAs.

Diferentemente de seus predecessores, o Gemini destaca-se por sua capacidade única de “compreender, operar e combinar diferentes tipos de informação”, abrangendo texto, áudio, imagem, vídeo e linguagens de programação.

Demis Hassabis, CEO e cofundador da Google DeepMind, enfatiza que a criação do Gemini busca torná-lo menos parecido com um “software inteligente” e mais intuitivo e prático.

Mais sobre Gemini, nova IA da Google

A flexibilidade é outra característica notável do Gemini, sendo o modelo mais versátil já criado pela Google.

Disponível em três tamanhos distintos — Ultra, Pro e Nano —, ele pode ser implementado em data centers ou dispositivos móveis, proporcionando assim uma variedade de usos.

Imagem: Shutterstock/LookerStudio

Atualmente, o Gemini 1.0 já está disponível no Google Bard em 170 países, incluindo o Brasil, embora restrito ao idioma inglês.

A expectativa é que, até 2024, o modelo mais potente seja integrado ao chatbot, expandindo também para outros idiomas.

O Google Pixel 8 Pro já incorpora o Gemini, e, futuramente, ele estará acessível diretamente na busca do Google, no Chrome e em outros serviços e produtos da empresa.

No âmbito mobile, o Gemini Nano demonstra sua eficiência ao realizar tarefas no aplicativo de gravação de áudio e na função Smart Reply do Gboard no WhatsApp.

Entretanto, a versão mais robusta, Gemini Ultra, programada para lançamento no próximo ano, passará inicialmente por uma fase restrita a alguns clientes, desenvolvedores, parceiros e especialistas em segurança e responsabilidade, visando coletar feedbacks e aprimorar o produto.

Em relação às capacidades do Gemini, destaca-se sua habilidade de extrair insights de documentos extensos e a capacidade de compreender simultaneamente texto, imagens, áudios e mais.

Essa abordagem multimodal permite respostas mais contextuais, especialmente diante de perguntas complexas.

O Google afirma que o Gemini obteve sucesso em 30 dos 32 benchmarks acadêmicos, superando especialistas humanos em diversas áreas, como matemática, física, história, direito, medicina e ética.

Em comparação com o GPT-4, o Gemini Ultra demonstrou superioridade em texto, raciocínio, matemática e programação, além de se destacar em testes multimodais que envolvem imagens, vídeos e áudios.

Em resumo, o Gemini surge como uma promissora inovação em IA, desafiando as capacidades do ChatGPT e prometendo uma abordagem mais cuidadosa e precisa ao responder perguntas desafiadoras.

você pode gostar também