🎥 China Lança Competidor do Sora

🎥 China Lança Competidor do Sora

🎥 China Lança Competidor do Sora

Nikolas Weber

Apr 29, 2024

Apr 29, 2024

Summary

Summary

📱 Apple Negocia Integração com OpenAI para o iOS 18

🎥 China Lança Competidor do Sora

👀 Sora: A Verdade por Trás do Modelo da OpenAI

A Apple está em negociações avançadas com a OpenAI para integrar as capacidades de inteligência artificial da empresa no próximo update do iOS 18, conforme relata a Bloomberg. Com o evento WWDC de junho se aproximando, espera-se que grandes anúncios sobre IA sejam feitos, marcando uma nova era para os dispositivos da Apple.

Detalhes da Parceria:

  • Integração de IA no iOS: A possível parceria entre Apple e OpenAI poderia resultar na incorporação de características avançadas de IA, como o modelo GPT, diretamente no sistema operacional iOS 18.

  • Negociações com Google: Paralelamente, a Apple também estaria explorando um acordo com o Google para licenciar o modelo Gemini, indicando uma estratégia de colaboração com múltiplos gigantes da tecnologia em IA.

Implicações para o Mercado:

A integração de IA robusta nos sistemas da Apple não só pode transformar a experiência do usuário com iPhones, como também estabelecer um novo padrão para a adoção de IA em dispositivos móveis. Com mais de 1,4 bilhão de usuários de iPhone globalmente, a Apple tem o potencial de desencadear um novo 'momento ChatGPT' para a adoção em massa de IA, posicionando-se como um catalisador crucial no avanço da tecnologia de inteligência artificial no cotidiano.

A empresa chinesa de IA, ShengShu, acaba de lançar o Vidu, um modelo de IA para geração de vídeos a partir de textos que promete rivalizar com o ainda não lançado Sora da OpenAI, tanto em capacidade quanto em desempenho.

Detalhes Técnicos:

  • Geração de Vídeos: O Vidu é capaz de gerar vídeos de alta qualidade, com duração de 16 segundos e resolução de 1080p a partir de prompts de texto.

  • Desenvolvimento Inovador: O desenvolvimento do Vidu começou em 2022, baseado em uma arquitetura proprietária que antecede o fluxo de trabalho DiT do Sora.

  • Demonstração ao Vivo: Uma apresentação ao vivo em Pequim destacou a habilidade do modelo em simular detalhes do mundo real, como iluminação precisa, sombras, expressões faciais e mais.

Impacto no Mercado:

Embora possa parecer prematuro chamar o Vidu de verdadeiro ‘rival’ do Sora (gerações de 16 segundos contra 60 segundos representam uma grande diferença), os modelos de IA da China continuam avançando em relação aos líderes dos EUA. Com o Sora ainda não disponível ao público, sua promessa permanece em grande parte não realizada, abrindo portas para a concorrência.

Em uma revelação detalhada de Mike Seymour sobre o uso do Sora da OpenAI, percebe-se que nem tudo é tão simples quanto parece na geração de vídeos com inteligência artificial. O Sora, descrito inicialmente como o "DALL·E dos vídeos", apresenta desafios significativos que refletem o estágio precoce de seu desenvolvimento, ainda antes do beta.

Desafios Técnicos e Controle Criativo

  • Interface e Controle: A falta de multimodalidade e controle fino sobre a consistência dos resultados mostra que Sora ainda tem um caminho a percorrer para se integrar de forma eficaz aos fluxos de trabalho criativos.

  • Consistência Visual: As tentativas de manter a consistência visual entre cenas foram um desafio, com variações na aparência dos objetos de cena, como balões, que mudavam de cor e forma de um take para outro.

Pós-Produção Intensiva

  • Resolução e Estabilização: Os vídeos gerados pelo Sora necessitaram de um tratamento significativo na pós-produção, incluindo melhorias de resolução e estabilização para alcançar a qualidade desejada.

  • Edição e Composição: A necessidade de editar intensamente e compor vários takes revela que, embora o Sora possa gerar material bruto fascinante, ainda requer uma mão humana experiente para moldar o produto final.

Impressões Finais de Patrick Cederberg

Patrick Cederberg, responsável pela pós-produção no projeto "Air Head", compartilhou insights valiosos sobre a realidade de trabalhar com Sora:

  • Potencial e Limitações: Apesar de reconhecer o potencial da ferramenta, Patrick enfatizou as limitações atuais em termos de controle e precisão, comparando a experiência a "uma máquina caça-níqueis", onde os resultados podem ser imprevisíveis.

  • Esperança para o Futuro: Há uma expectativa de que com o tempo e o desenvolvimento contínuo, Sora possa se tornar uma ferramenta mais robusta e confiável para criativos.

Conclusão

A jornada de Sora até agora destaca tanto o potencial revolucionário quanto os desafios práticos da IA em produções criativas. As experiências de Seymour e a equipe de Shy Kids refletem um cenário em que a tecnologia, embora promissora, ainda não alcançou a perfeição, necessitando de significativa intervenção humana para realizar visões artísticas complexas. A evolução contínua do Sora será crucial para determinar seu lugar no futuro da produção de conteúdo audiovisual.

A OpenAI começou a lançar seu recurso de memória ChatGPT para um grupo maior de usuários Free e Plus, dando ao ChatGPT uma nova capacidade de transferir aprendizados entre conversas.

A OpenAI começou a lançar seu recurso de memória ChatGPT para um grupo maior de usuários Free e Plus, dando ao ChatGPT uma nova capacidade de transferir aprendizados entre conversas.

Discover More Tools There

Discover More Tools There

Discover More Tools There

Cover Prompt

Cover Prompt

Cover Prompt

Create a hyperrealistic horizontal image of an exaggerated and mischievous expression on a Chinese man excitedly looking at a computer screen, celebrating the launch of a competitive AI technology. The setting should be modern and minimalistic, focusing on his facial expressions and the glow from the screen reflecting his excitement. The image should be centered and symmetrical, capturing a moment of triumph in technology competition.

Create a hyperrealistic horizontal image of an exaggerated and mischievous expression on a Chinese man excitedly looking at a computer screen, celebrating the launch of a competitive AI technology. The setting should be modern and minimalistic, focusing on his facial expressions and the glow from the screen reflecting his excitement. The image should be centered and symmetrical, capturing a moment of triumph in technology competition.

Create a hyperrealistic horizontal image of an exaggerated and mischievous expression on a Chinese man excitedly looking at a computer screen, celebrating the launch of a competitive AI technology. The setting should be modern and minimalistic, focusing on his facial expressions and the glow from the screen reflecting his excitement. The image should be centered and symmetrical, capturing a moment of triumph in technology competition.

Dall-e 3 ✧ SPARK

Thank you for reading!