O Google lançou nesta quarta-feira (6) o Gemini, modelo de inteligência artificial (IA) que é tratado pela empresa como o mais poderoso já criado por sua equipe. Ele já pode ser testado no Bard (concorrente do ChatGPT), mas, por enquanto, apenas em inglês.
Em uma demonstração, o Gemini conseguiu analisar a foto de um exercício de física e identificar um erro no cálculo. A IA foi capaz de apresentar a solução correta e criar problemas semelhantes para o usuário tentar resolver.
Segundo o Google, ajudar estudantes com a lição de casa é apenas uma das áreas em que o modelo poderá ajudar. Ele também deverá ser útil para realizar outras tarefas que exigem uma capacidade maior de raciocínio lógico, como programar em diversas linguagens.
O Gemini superou a capacidade humana em um teste de conhecimento e solução de problemas que combina 57 temas, incluindo matemática, física e história, segundo o Google. A empresa também diz que ele se saiu melhor que o GPT-4, modelo da OpenAI.
Como o Gemini funciona?
O Gemini é o modelo de IA mais flexível já desenvolvido pelo Google. A ideia é que ele consiga rodar tanto em infraestruturas grandes, como as de data centers, quanto em dispositivos mais limitados, como celulares.
Para atender a esse objetivo, a nova inteligência artificial terá três versões:
- ⚡ Gemini Ultra: maior e mais poderoso, voltado para tarefas altamente complexas – será liberado apenas em 2024;
- Gemini Pro: voltado rodar uma ampla gama de tarefas e atender a desenvolvedores e usuários – começa a ser liberado nesta quarta;
- Gemini Nano: criado para dispositivos móveis, vai rodar diretamente no dispositivo, o que lhe permite funcionar mesmo quando não há internet – disponível no Pixel 8 Pro, o celular do Google, para criar resumos de áudios e sugerir respostas inteligentes no WhatsApp.
Quando ele estará disponível?
O primeiro contato de muitos usuários com o Gemini deverá ser com a versão Pro, que vai melhorar raciocínio, planejamento e compreensão do Bard. A partir desta quarta, o robô do Google já vai usar a nova IA em respostas em inglês (outros idiomas receberão a atualização em breve).
No início de 2024, o Google vai lançar o Bard Advanced, que fará o Gemini Ultra estar disponível no Bard. E, ainda segundo a empresa, produtos como Busca e Chrome se integrarão ao Gemini nos próximos meses.
A partir de 13 de dezembro, desenvolvedores e empresas poderão usar o Gemini Pro por meio das plataformas de inteligência artificial Google AI Studio e Google Cloud Vertex AI. E o Gemini Ultra vai passar por mais verificações de segurança antes de ser liberado para todos em 2024.
O que faz o Gemini ser mais poderoso?
O Google diz que a abordagem para desenvolver o Gemini foi um pouco diferente da adotada em outros modelos de inteligência artificial multimodais, isto é, que conseguem entender ao mesmo tempo diferentes formatos, como textos, imagens, áudios e códigos.
Segundo a empresa, a criação de modelos de IA costuma envolver “treinamentos” separados, com foco em cada formato. Em uma segunda etapa, o aprendizado de texto é reunido com o de imagem, por exemplo, e tudo é “empacotado” em apenas um produto.
Na avaliação do Google, esse método permite realizar algumas tarefas, como descrever imagens, mas tem limitações nos casos que exigem mais raciocínio.
“Projetamos o Gemini para ser nativamente multimodal, pré-treinado desde o início em diferentes modalidades. Em seguida, aperfeiçoamos com dados multimodais adicionais para refinar ainda mais sua eficácia”, disse Demis Hassabis, diretor-executivo da DeepMind, subsidiária de IA do Google.
O Gemini é confiável?
O Google admite que, como toda inteligência artificial, o Gemini também está sujeito ao problema de alucinação, um erro que faz a resposta de um robô incluir informações incorretas, tendenciosas ou sem sentido.
Mas a empresa diz que o Gemini é capaz de fazer as melhores avaliações de segurança de uma IA já criada por sua equipe. O objetivo é que ela seja capaz de evitar conteúdo violento ou estereotipado, por exemplo.
A criação do Gemini envolveu ainda o treinamento sobre o que não deve ser exibido aos usuários a partir de um conjunto de 100 mil frases consideradas tóxicas retiradas da internet. Um grupo de especialistas independentes também trabalha para testar os limites da nova IA.
“Estamos abordando esse trabalho com ousadia e responsabilidade”, disse Sundar Pichai, diretor-executivo da Alphabet, controladora do Google.
“Isso significa ser ambiciosos em nossa pesquisa e buscar capacidades que trarão benefícios enormes para as pessoas e a sociedade, ao mesmo tempo em que construímos salvaguardas e trabalhamos em colaboração com governos e especialistas para enfrentar os riscos à medida que a IA se torna mais capaz”, afirmou.
Fonte: G1RN