Novidades da StabilityAI, Kling, Mistral e Mais!

Novidades da StabilityAI, Kling, Mistral e Mais!

Novidades da StabilityAI, Kling, Mistral e Mais!

Nikolas Weber

Jul 25, 2024

Jul 25, 2024

Summary

Summary

📹 Stability AI Lança o Stable Video 4D

🎥 Kling AI: Geração de Vídeos Agora Global

⚔️ Mistral Large 2 Enfrenta os Gigantes da IA

A Stability AI acaba de lançar o Stable Video 4D, um modelo inovador que transforma um único vídeo em múltiplos vídeos de novas perspectivas, com oito ângulos diferentes.

Detalhes:

  • Geração Multi-Ângulo: Stable Video 4D transforma um único vídeo de objeto em oito novos ângulos em cerca de 40 segundos.

  • Personalização: Usuários podem especificar os ângulos da câmera, adaptando a saída para atender a necessidades criativas específicas.

  • Fase de Pesquisa: O modelo, disponível no Hugging Face, tem aplicações futuras em desenvolvimento de jogos, edição de vídeos e realidade virtual.

  • Otimização 4D: Geração de vídeos de 5 quadros em 8 vistas leva aproximadamente 20 a 25 minutos para otimização completa.

Radar Insights:

O Stable Video 4D representa um avanço significativo, passando da geração de vídeos baseados em imagens para a síntese dinâmica completa de vídeos 3D. Essa capacidade garante uma consistência maior na aparência do objeto em múltiplas vistas e momentos, além de proporcionar uma estrutura de otimização 4D mais leve.

A Kling AI, desenvolvida pelo gigante tecnológico chinês Kuaishou Technology, lançou globalmente seu impressionante modelo de vídeo de IA, oferecendo gerações de alta qualidade que rivalizam com o Sora da OpenAI (ainda não lançado).

Detalhes:

  • Duração dos Vídeos: Kling pode gerar vídeos de até dois minutos, superando o limite de um minuto do Sora da OpenAI. No entanto, a versão global está limitada a gerações de cinco segundos.

  • Créditos Diários: A versão global oferece 66 créditos gratuitos diariamente, com cada geração custando 10 créditos.

  • Tecnologia Avançada: Segundo a Kuaishou, o Kling utiliza tecnologia avançada de reconstrução 3D para movimentos mais naturais.

  • Descrição Detalhada: A plataforma aceita prompts de até 2.000 caracteres, permitindo descrições detalhadas de vídeo.

Radar Insights:

Quando o KLING foi lançado há pouco mais de um mês, era acessível apenas com um número de telefone chinês. Embora os usuários globais ainda estejam limitados a gerações de cinco segundos, agora qualquer pessoa pode criar seus próprios vídeos de alta qualidade — aumentando ainda mais a pressão sobre a OpenAI para lançar seu aguardado Sora.

A Mistral acaba de lançar o Large 2, um novo modelo de IA que promete igualar ou superar o desempenho das ofertas recentes da OpenAI e Meta, apesar de ter significativamente menos parâmetros.

Detalhes:

  • Parâmetros: Large 2 possui 123 bilhões de parâmetros, menos de um terço dos 405 bilhões do Llama 3.1 da Meta, mas supera-o na geração de código e matemática.

  • Contexto e Suporte Multilíngue: O modelo apresenta uma janela de contexto de 128.000 tokens e suporte multilíngue aprimorado para 12 idiomas e 80 linguagens de programação.

  • Precisão e Concisão: A Mistral afirma que o Large 2 minimiza alucinações e produz respostas mais concisas do que os modelos líderes de IA.

  • Disponibilidade: O modelo está disponível para teste no Le Chat e pode ser utilizado em grandes plataformas de nuvem, mas requer uma licença paga para uso comercial.

Radar Insights:

Com apenas um terço do tamanho do Llama 3.1 405B e benchmarks comparáveis ao GPT-4, o Mistral Large 2 é impressionante. E com dois modelos open-source de nível GPT-4 lançados em apenas dois dias, a pressão aumentou para líderes de IA fechados como OpenAI, Anthropic e Google.

A Udio lançou a versão 1.5 de seu gerador de música AI, apresentando qualidade de áudio aprimorada, novos controles e recursos de remixagem de áudio para áudio.

A Udio lançou a versão 1.5 de seu gerador de música AI, apresentando qualidade de áudio aprimorada, novos controles e recursos de remixagem de áudio para áudio.

Discover More Tools There

Discover More Tools There

Discover More Tools There

Cover Prompt

Cover Prompt

Cover Prompt

A close-up, centered, and symmetrical image of a person with their head open and brain exposed, showing an explosion of ideas. The person has an expression of shock and amazement, looking directly at the camera. The background features vibrant, dynamic elements like neon lights and technological patterns, emphasizing the mind-blowing advancements and creativity in AI.

Dall-e 3 ✧ SPARK

Thank you for reading!