🗣️ OpenAI Lança o Modo de Voz Avançado

🗣️ OpenAI Lança o Modo de Voz Avançado

🗣️ OpenAI Lança o Modo de Voz Avançado

Nikolas Weber

Sep 25, 2024

Sep 25, 2024

Summary

Summary

🎥 James Cameron Entra para o Conselho da Stability AI

✨ Google Lança Novos Modelos Prontos para Produção

🗣️ OpenAI lança o Modo de Voz Avançado

James Cameron, renomado diretor de Titanic, Avatar e O Exterminador do Futuro, acaba de se juntar ao conselho de diretores da Stability AI, empresa responsável pelo popular modelo de IA Stable Diffusion, que transforma texto em imagens.

Detalhes:

  • Visão Futurista: Cameron, conhecido por expandir os limites da tecnologia no cinema, vê a convergência entre IA generativa e CGI como “a próxima onda” na criação de mídia visual.

  • Experiência na Equipe: O CEO da Stability AI, Prem Akkaraju, foi líder na empresa de efeitos visuais WETA Digital, destacando o foco criativo da Stability AI em soluções de IA para o cinema.

  • Impacto em Hollywood: A entrada de Cameron acontece em meio à discussão sobre o papel da IA em Hollywood, com estúdios divididos entre adotar a tecnologia e as preocupações com os direitos sobre o conteúdo.

Radar Insights:

A decisão de James Cameron de se envolver com IA ocorre logo após a Lionsgate se unir à startup de IA Runway para criar um modelo personalizado de geração de vídeos. Isso pode ser um forte indicativo de como grandes cineastas estão começando a ver a IA como uma ferramenta essencial na evolução da indústria cinematográfica.

O Google acaba de anunciar grandes atualizações para seus modelos de IA Gemini, incluindo melhorias de desempenho, redução de custos e maior acessibilidade para desenvolvedores.

Detalhes:

  • Novos Modelos: Dois novos modelos prontos para produção foram lançados: Gemini-1.5-Pro-002 e Gemini-1.5-Flash-002, oferecendo uma melhoria de 20% em benchmarks relacionados à matemática.

  • Redução de Custos: O preço do Gemini 1.5 Pro foi reduzido em mais de 50% para prompts com menos de 128K tokens, além de um aumento significativo nos limites de uso.

  • Desempenho: Os novos modelos entregam saídas 2x mais rápidas e com 3x menos latência, além de melhorias no entendimento de contextos longos e capacidades visuais.

  • Controle para Desenvolvedores: O Google atualizou as configurações de filtros padrão, oferecendo mais controle aos desenvolvedores para configurar o modelo de acordo com suas necessidades.

Radar Insights:

O Google continua avançando rapidamente, tornando suas soluções de IA mais acessíveis e eficientes para desenvolvedores. Embora ainda não seja o Gemini 2, essa atualização é um grande passo à frente, permitindo a criação de aplicações mais rápidas, inteligentes e baratas.

A OpenAI finalmente está lançando o Modo de Voz Avançado (AVM) para todos os assinantes do ChatGPT Plus e Teams nesta semana, com novos recursos e vozes que tornam as interações com IA mais naturais e personalizadas.

Detalhes:

  • Atualizações Importantes: O AVM agora integra Instruções Personalizadas e Memória, oferecendo interações mais direcionadas e que "lembram" do histórico de conversas.

  • Vozes Melhoradas: Cinco novas vozes inspiradas na natureza foram adicionadas, enquanto a voz “Sky”, que se assemelhava à de Scarlett Johansson, foi removida.

  • Reconhecimento de Acentos: A OpenAI também aprimorou a compreensão de diferentes sotaques, garantindo conversas mais suaves e rápidas.

  • Disponibilidade: O AVM ainda não está disponível em regiões como a UE, Reino Unido, Suíça e alguns países nórdicos.

Radar Insights:

Com a crescente discussão sobre agentes de IA e superinteligência, o Modo de Voz Avançado chega em um momento crucial. Tornar as interações com IA mais humanas pode ser o próximo passo para a integração diária dessas tecnologias em nossas vidas.

Caso ainda não tenha acesso ao AVM, desinstale e reinstale o aplicativo do ChatGPT!

A melhor aplicação para vídeos Deepfake agora em sua versão 3.0. Recomendo a instalação local através do Pinokio.

A melhor aplicação para vídeos Deepfake agora em sua versão 3.0. Recomendo a instalação local através do Pinokio.

Discover More Tools There

Discover More Tools There

Discover More Tools There

Cover Prompt

Cover Prompt

Cover Prompt

A hyperrealistic image featuring a futuristic microphone at the center, emitting sound waves. Behind the microphone is the silhouette of a robot, blending into a sleek, dark black background. The microphone is illuminated with soft futuristic lighting, and the sound waves are visualized as glowing, radiating lines. The overall atmosphere is modern, sleek, and conveys advanced AI voice technology.

FLUX

Thank you for reading!