Tudo sobre Google

Tudo sobre Inteligência artificial
O Google Deepmind lançou o Genie 3 na terça -feira (05). É a nova versão de seu modelo de inteligência artificial (AI) capaz de criar mundos 3D interativos reais para usuários e agentes de IA.
Entre os aprimoramentos prometidos para o modelo, estão mais tempo para interações e a capacidade de lembrar a posição dos objetos, mesmo quando o usuário desvia a aparência.
No entanto, este provavelmente não será um modelo que você pode testar por conta própria. Ele chega como uma “prévia limitada para pesquisa”, acessível apenas a “um pequeno grupo de acadêmicos e criadores”.
Por que? De acordo com o Google, para que os desenvolvedores possam entender melhor os riscos e como mitigá -los corretamente.
Genie 3: O que é e como o novo modelo de IA do Google DeepMind funciona
Modelos como a Genie são sistemas de IA projetados para simular ambientes com vários propósitos – por exemplo: educação, entretenimento e treinamento de robôs.

Eles trabalham a partir de comandos fornecidos pelos usuários, gerando espaços navegáveis como videogames. A diferença é que estes são totalmente criados pela IA.
Comparado ao Genie 2, lançado em dezembro de 2024, o Genie 3 representa um avanço importante. Isso ocorre porque combina recursos de antecessor com os do VEO 3, o Google AI Model gera vídeos e entende melhor as leis da física.
Na prática, isso permite experiências mais realistas e duradouras nos “mundos” criados através do Genie 3, de acordo com Postagem no blog do Google.
“Genie 3 é o primeiro modelo mundial interativo de tempo real e geral”, disse Shlomi Fruchter, diretor de pesquisa de DeepMind, durante uma conferência de imprensa (via TechCrunch).
“Isso vai além dos modelos mundiais restritos que existiram até agora. Não é específico para nenhum ambiente em particular”, disse Fruchter. “Pode gerar mundos fotorrealistas e imaginários – e tudo entre esses dois extremos”.
Agora, os usuários agora poderão interagir com os mundos por alguns minutos, o que excede a limitação de 20 segundos do modelo anterior.
Outra melhoria importante está na memória visual. A Genie 3 mantém a posição dos objetos por até um minuto. Assim, os ambientes são mais consistentes.
Além disso, os “mundos” serão renderizados em resolução de 720p e com uma taxa de quadros de 24 por segundo (FPS).
O DeepMind também relatou que está incorporando eventos ativáveis por comando. Isso permite que o usuário, por exemplo, altere o clima de um “mundo” ou adicione caracteres por meio de prompts.
No entanto, existem várias restrições – por exemplo: as maneiras limitadas pelas quais os usuários podem interagir com os mundos gerados. E o fato de que os textos legíveis são gerados apenas quando fornecidos na descrição do usuário inserido.
Leia mais:
Eu passo para Agi?
A Genie 3, de acordo com Fruchter, possui aplicações promissoras em áreas como educação, jogos e prototipagem criativa. Mas seu verdadeiro valor é no treinamento de agentes de IA para tarefas gerais de uso, algo crucial para o avanço em relação à Inteligência Artificial Geral (AGI).

“Acreditamos que os modelos mundiais são fundamentais no caminho para Agra, especialmente para agentes incorporados, nos quais os cenários do mundo real são particularmente desafiadores”, disse Jack Parker-Holder, pesquisador de mindos durante a conferência de imprensa.
Ao contrário dos mecanismos de física tradicionais, a Genie 3 aprende sozinha como o mundo funciona. Inspirado pelo Veo, ele observa como os objetos se movem e interagem, “raciocínio” com base no que já foi gerado. Isso permite que o sistema crie simulações mais realistas e adaptativas.
“O modelo é auto -restrito, o que significa que gera uma foto de cada vez”, disse Fruchter em entrevista a TechCrunch. “Ele precisa analisar o que foi gerado anteriormente para decidir o que acontecerá a seguir. Esta é uma parte fundamental da arquitetura”.
Essa memória e consistência visual permitem que o Genie 3 desenvolva uma noção de física semelhante à dos seres humanos. Deepmind ressalta que isso cria oportunidades para os agentes da IA aprenderem através da experiência prática, assim como os humanos aprendem no mundo real.