🍓 Sam Altman Sugere 'Project Strawberry'

🍓 Sam Altman Sugere 'Project Strawberry'

🍓 Sam Altman Sugere 'Project Strawberry'

Nikolas Weber

Aug 8, 2024

Aug 8, 2024

Summary

Summary

🦄 Criadora do TikTok Desafia OpenAI Sora

🗣️ Nova IA Pode Ouvir Enquanto Fala

🍓 Sam Altman Sugere 'Project Strawberry'

A ByteDance, empresa-mãe do TikTok, acaba de lançar o Jimeng AI para usuários chineses, um aplicativo de IA de texto para vídeo que compete diretamente com o modelo de vídeo Sora da OpenAI (ainda não lançado).

Detalhes do Lançamento:

  • Disponibilidade: Jimeng AI está disponível na Apple App Store e Android para usuários chineses.

  • Entrada no Mercado: A entrada da ByteDance no mercado de geração de vídeo por IA segue lançamentos similares de outras empresas de tecnologia chinesas, incluindo o Kling AI da Kuaishou.

  • Preços e Assinatura: A assinatura, com preço de 79 yuan (US$ 11) mensais ou 659 yuan (US$ 92) anuais, permite a criação de aproximadamente 2.050 imagens ou 168 vídeos por IA por mês.

  • Acesso Antecipado: Ao contrário do Sora da OpenAI, que ainda não está disponível publicamente, os modelos do Jimeng AI já estão acessíveis para os usuários (na China).

Radar Insights:

A corrida pela geração de vídeos por IA na China está acelerando, com o lançamento público do Kling AI há poucas semanas e agora o lançamento do Jimeng AI pela ByteDance, enquanto o mundo aguarda ansiosamente o lançamento público do Sora. Com o apoio do TikTok, o Jimeng AI terá acesso a uma vasta quantidade de dados de treinamento e recursos financeiros para competir contra outros gigantes da IA. Esta rápida evolução no setor de IA vídeo-texto na China pode moldar significativamente o futuro da criação de conteúdo digital.

Pesquisadores de IA desenvolveram um novo modelo de linguagem que consegue ouvir e falar simultaneamente, avançando nas conversas interativas de IA baseadas em fala em tempo real.

Detalhes do Modelo:

  • Listening-while-Speaking Language Model (LSLM): O novo modelo permite a modelagem full-duplex em modelos de linguagem de fala interativa.

  • Tecnologia Utilizada: LSLM usa um decodificador TTS baseado em tokens para geração de fala e um codificador de aprendizado autossupervisionado em streaming para entrada de áudio em tempo real.

  • Detecção de Turnos: O sistema pode detectar a alternância de turnos em tempo real e responder a interrupções, uma característica essencial das conversas naturais.

  • Desempenho em Experimentos: O modelo demonstrou robustez ao ruído e sensibilidade a diversas instruções nos experimentos.

Radar Insights:

Enquanto o recente modo avançado de voz do ChatGPT da OpenAI nos aproxima de conversas realistas com IA, o LSLM dá um salto ainda maior ao permitir que a IA processe a fala recebida enquanto fala. Isso pode revolucionar as interações entre humanos e IA, fazendo com que as conversas com máquinas pareçam verdadeiramente naturais e responsivas. Essa inovação promete transformar a forma como interagimos com assistentes virtuais e outros sistemas de IA, tornando a comunicação mais fluida e eficiente.

Um novo modelo de IA desconhecido apareceu na LMSYS Chatbot Arena, alimentando rumores de que pode ser o tão aguardado avanço Q* da OpenAI ou sua evolução — codinome 'Strawberry'.

Detalhes do Projeto:

  • Aparição Misteriosa: Um novo "anonymous-chatbot" surgiu na LMSYS Chatbot Arena — uma plataforma open-source onde startups de IA frequentemente testam lançamentos futuros.

  • Histórico de Testes: Anteriormente, a OpenAI testou o GPT-4o com o gpt2-chatbot duas semanas antes de lançá-lo ao público, o que colocou a arena em alerta máximo para novos modelos de IA.

  • Relatos de Testadores: Os testadores do “anonymous-chatbot” relatam que ele demonstra um raciocínio mais avançado que o GPT-4o e qualquer outro modelo de ponta.

  • Tease de Altman: Sam Altman postou uma foto de um morango no X, que é o codinome do suposto modelo secreto da OpenAI.

Radar Insights:

Enquanto concorrentes como Anthropic e Meta começam a alcançar o GPT-4o, a internet está ansiosamente aguardando o próximo movimento da OpenAI. Se este modelo misterioso for realmente o Q*/Strawberry, podemos estar à beira de uma nova mudança sísmica nas capacidades da IA. A curiosidade e antecipação em torno deste projeto destacam a corrida incessante por inovações revolucionárias no campo da inteligência artificial.

Gerador de vídeo de IA de código aberto para criar vídeos semelhantes aos do Sora.

Gerador de vídeo de IA de código aberto para criar vídeos semelhantes aos do Sora.

Discover More Tools There

Discover More Tools There

Discover More Tools There

Cover Prompt

Cover Prompt

Cover Prompt

A single red futuristic strawberry on a black background. The strawberry should have minimalist elements like subtle circuit patterns and a metallic sheen, blending natural and technological aspects in a simple, elegant design.

Dall-e 3 ✧ SPARK

Thank you for reading!