🎤 Novo Modo de Voz do ChatGPT na Prática

🎤 Novo Modo de Voz do ChatGPT na Prática

🎤 Novo Modo de Voz do ChatGPT na Prática

Nikolas Weber

Aug 1, 2024

Aug 1, 2024

Summary

Summary

✨ Gemma2 2B da Google Supera o GPT-3.5

🎤 Novo Modo de Voz do ChatGPT na Prática

🤖 O Futuro da Meta é IA, IA e mais IA

A Google acaba de revelar o Gemma 2 2B, um modelo de IA leve com apenas 2 bilhões de parâmetros que supera modelos muito maiores como GPT-3.5 e Mixtral 8x7B em benchmarks importantes.

Detalhes:

  • Parâmetros e Treinamento: Gemma 2 2B possui apenas 2,6 bilhões de parâmetros, mas foi treinado em um enorme conjunto de dados de 2 trilhões de tokens.

  • Desempenho: O modelo alcança 1130 no LMSYS Chatbot Arena, igualando o GPT-3.5-Turbo-0613 (1117) e o Mixtral-8x7b (1114) — modelos 10 vezes maiores.

  • Outros Benchmarks: Pontuações notáveis incluem 56.1 no MMLU e 36.6 no MBPP, superando seu antecessor em mais de 10%.

  • Open Source: O modelo é open-source e os desenvolvedores podem baixar os pesos do modelo na página de anúncio da Google.

Radar Insights:

À medida que entramos em uma nova era de IA local e em dispositivos, modelos leves e eficientes são cruciais para rodar IA diretamente em nossos telefones e laptops. Com o Gemma 2 superando o GPT-3.5 Turbo com apenas 1/10 do tamanho, a Google não está apenas mostrando o que é possível — está consolidando sua posição como líder no espaço de modelos pequenos.

Recentemente, a OpenAI lançou um modo de voz avançado para o ChatGPT, e os primeiros feedbacks dos assinantes do ChatGPT Plus são altamente positivos. Vídeos online mostram a nova funcionalidade cantando, imitando acentos, corrigindo pronúncia de idiomas e narrando histórias de forma envolvente.

Detalhes do Novo Modo de Voz:

  • Narrativas e Interpretações: Em um vídeo, o usuário do X @nickfloats pede ao ChatGPT para "contar uma história como se fosse um piloto de avião". O bot responde com uma voz que parece vir de um intercomunicador, embora tenha dificuldades com sons de motores. A voz é clara e emotiva.

  • Capacidade Multilíngue: O ChatGPT lida com "dezenas de idiomas", adaptando-se a dialetos e variações regionais. Em um clipe, corrige a pronúncia de palavras em francês e fala turco, reagindo emocionalmente conforme a história.

  • Acentos Regionais e Cantoria: O bot imita acentos regionais dos EUA, como Nova York, Boston e Wisconsin. Vídeos mostram o ChatGPT cantando em estilos variados, como uma versão blues de "Happy Birthday" e imitando animais como sapos e gatos cantando.

  • Variedade de Vozes: Demonstrações incluem várias vozes masculinas e femininas. A voz "Sky", semelhante à de Scarlett Johansson e retirada em maio, não está presente.

Exemplo Interessante:

Em uma demonstração, o ChatGPT conta até 10 e depois até 50 o mais rápido que pode. Durante a contagem, ele faz pausas para respirar, como um ser humano faria. A transcrição não mostra interrupções ou anotações – o modelo de voz simplesmente aprendeu padrões naturais de fala, incluindo pausas para respirar. É surpreendente e natural.

Radar Insights:

Para quem não teve acesso às demonstrações, o modo de voz avançado estará disponível para todos os assinantes do ChatGPT Plus (US$ 20 por mês) na primavera. Essa novidade promete revolucionar a interação com assistentes virtuais, tornando-a mais natural e envolvente.

Os ganhos do segundo trimestre da Meta continuam a mesma história do trimestre anterior: a IA generativa está aqui, mas vai demorar para começar a gerar receita significativa. A boa notícia é que a Meta já faz muito dinheiro, diferente de muitas startups de IA. No último trimestre, a empresa arrecadou mais de $39 bilhões em receita, um aumento de 22% em relação ao ano anterior, e cerca de $13,5 bilhões em lucro, um aumento de 73%. Com 3,27 bilhões de pessoas usando pelo menos um dos aplicativos da Meta todos os dias, a empresa tem capacidade para fazer grandes apostas.

Principais Pontos da Chamada de Resultados:

  • Investimentos em IA: A CFO Susan Li afirmou que os retornos financeiros dos investimentos recentes em IA virão “ao longo de um período mais longo”. Mark Zuckerberg explicou que a Meta está investindo bilhões em hardware Nvidia e infraestrutura para garantir capacidade antes de ser necessária.

  • Assistente de IA da Meta: Zuckerberg prevê que o assistente de IA da Meta será o mais usado do mundo até o final do ano. Ele destacou que as funcionalidades de IA generativa aumentarão o engajamento nos produtos da Meta, mas a verdadeira receita virá de casos de uso empresariais, como a criação de anúncios e agentes de IA para atendimento ao cliente no WhatsApp.

  • Treinamento do Llama 4: A Meta está se preparando para treinar o Llama 4, que Zuckerberg quer que seja o modelo mais avançado da indústria, necessitando quase 10 vezes mais capacidade de computação do que o Llama 3.1.

  • Óculos Inteligentes: Zuck expressou entusiasmo em construir “futuras gerações de óculos de IA”, após o sucesso inicial com os mais recentes Ray-Bans da Meta.

Radar Insights:

A Meta está em uma posição única para investir pesado em IA e infraestrutura, preparando-se para um futuro onde essas tecnologias serão cruciais. Com as grandes apostas de Zuckerberg e os avanços contínuos, a Meta está se posicionando para liderar não só no uso de IA generativa, mas também na criação de novos produtos e serviços que moldarão a próxima era da tecnologia.

Sincronize perfeitamente os lábios de um personagem de IA com expressões naturais de um vídeo

Sincronize perfeitamente os lábios de um personagem de IA com expressões naturais de um vídeo

Discover More Tools There

Discover More Tools There

Discover More Tools There

Cover Prompt

Cover Prompt

Cover Prompt

A highly expressive robot singing, with vibrant facial expressions and dynamic gestures. The robot is sleek and modern, with a glossy metallic finish and LED lights. It is performing on a stage with a microphone, under colorful spotlights. The background features a cheering audience, adding to the energetic atmosphere. The scene captures the excitement and futuristic vibe of the performance., best quality, extreme detail, high resolution, hyperrealistic, masterpiece, rich textures, vivid detail

Midjourney

Thank you for reading!