Nikolas Weber
🦄 Criadora do TikTok Desafia OpenAI Sora
🗣️ Nova IA Pode Ouvir Enquanto Fala
🍓 Sam Altman Sugere 'Project Strawberry'
A ByteDance, empresa-mãe do TikTok, acaba de lançar o Jimeng AI para usuários chineses, um aplicativo de IA de texto para vídeo que compete diretamente com o modelo de vídeo Sora da OpenAI (ainda não lançado).
Detalhes do Lançamento:
Disponibilidade: Jimeng AI está disponível na Apple App Store e Android para usuários chineses.
Entrada no Mercado: A entrada da ByteDance no mercado de geração de vídeo por IA segue lançamentos similares de outras empresas de tecnologia chinesas, incluindo o Kling AI da Kuaishou.
Preços e Assinatura: A assinatura, com preço de 79 yuan (US$ 11) mensais ou 659 yuan (US$ 92) anuais, permite a criação de aproximadamente 2.050 imagens ou 168 vídeos por IA por mês.
Acesso Antecipado: Ao contrário do Sora da OpenAI, que ainda não está disponível publicamente, os modelos do Jimeng AI já estão acessíveis para os usuários (na China).
Radar Insights:
A corrida pela geração de vídeos por IA na China está acelerando, com o lançamento público do Kling AI há poucas semanas e agora o lançamento do Jimeng AI pela ByteDance, enquanto o mundo aguarda ansiosamente o lançamento público do Sora. Com o apoio do TikTok, o Jimeng AI terá acesso a uma vasta quantidade de dados de treinamento e recursos financeiros para competir contra outros gigantes da IA. Esta rápida evolução no setor de IA vídeo-texto na China pode moldar significativamente o futuro da criação de conteúdo digital.
Pesquisadores de IA desenvolveram um novo modelo de linguagem que consegue ouvir e falar simultaneamente, avançando nas conversas interativas de IA baseadas em fala em tempo real.
Detalhes do Modelo:
Listening-while-Speaking Language Model (LSLM): O novo modelo permite a modelagem full-duplex em modelos de linguagem de fala interativa.
Tecnologia Utilizada: LSLM usa um decodificador TTS baseado em tokens para geração de fala e um codificador de aprendizado autossupervisionado em streaming para entrada de áudio em tempo real.
Detecção de Turnos: O sistema pode detectar a alternância de turnos em tempo real e responder a interrupções, uma característica essencial das conversas naturais.
Desempenho em Experimentos: O modelo demonstrou robustez ao ruído e sensibilidade a diversas instruções nos experimentos.
Radar Insights:
Enquanto o recente modo avançado de voz do ChatGPT da OpenAI nos aproxima de conversas realistas com IA, o LSLM dá um salto ainda maior ao permitir que a IA processe a fala recebida enquanto fala. Isso pode revolucionar as interações entre humanos e IA, fazendo com que as conversas com máquinas pareçam verdadeiramente naturais e responsivas. Essa inovação promete transformar a forma como interagimos com assistentes virtuais e outros sistemas de IA, tornando a comunicação mais fluida e eficiente.
Um novo modelo de IA desconhecido apareceu na LMSYS Chatbot Arena, alimentando rumores de que pode ser o tão aguardado avanço Q* da OpenAI ou sua evolução — codinome 'Strawberry'.
Detalhes do Projeto:
Aparição Misteriosa: Um novo "anonymous-chatbot" surgiu na LMSYS Chatbot Arena — uma plataforma open-source onde startups de IA frequentemente testam lançamentos futuros.
Histórico de Testes: Anteriormente, a OpenAI testou o GPT-4o com o gpt2-chatbot duas semanas antes de lançá-lo ao público, o que colocou a arena em alerta máximo para novos modelos de IA.
Relatos de Testadores: Os testadores do “anonymous-chatbot” relatam que ele demonstra um raciocínio mais avançado que o GPT-4o e qualquer outro modelo de ponta.
Tease de Altman: Sam Altman postou uma foto de um morango no X, que é o codinome do suposto modelo secreto da OpenAI.
Radar Insights:
Enquanto concorrentes como Anthropic e Meta começam a alcançar o GPT-4o, a internet está ansiosamente aguardando o próximo movimento da OpenAI. Se este modelo misterioso for realmente o Q*/Strawberry, podemos estar à beira de uma nova mudança sísmica nas capacidades da IA. A curiosidade e antecipação em torno deste projeto destacam a corrida incessante por inovações revolucionárias no campo da inteligência artificial.
A single red futuristic strawberry on a black background. The strawberry should have minimalist elements like subtle circuit patterns and a metallic sheen, blending natural and technological aspects in a simple, elegant design.
Dall-e 3 ✧ SPARK