Nikolas Weber
🎙️ OpenAI Apresenta Ferramenta de Clonagem de Voz com IA
💫 Microsoft e OpenAI Preparam Supercomputador de US$ 100 Bilhões
🚨 Inpainting Chegando ao DALL-E 3 no Chat GPT
OpenAI acaba de divulgar o Voice Engine, um modelo capaz de clonar vozes humanas a partir de uma amostra de áudio de apenas 15 segundos, gerando uma fala natural e convincente. Esse avanço notável preserva o sotaque e as emoções do falante original na fala gerada.
Detalhes do Lançamento:
Preservação de Características: O modelo consegue manter o sotaque e as emoções da voz original.
Parceiros Confiáveis: Atualmente em teste com um grupo seleto de parceiros de confiança, incluindo a startup de IA HeyGen.
Medidas de Segurança: OpenAI introduziu medidas como marca d'água e monitoramento proativo para evitar usos indevidos.
Desenvolvimento e Uso Interno: Revelado que a tecnologia foi desenvolvida no final de 2022 e já está sendo utilizada para alimentar vozes na API de texto para fala e no ChatGPT.
Radar Insights:
Com o Voice Engine, a OpenAI demonstra estar à frente no setor, tendo implementado a tecnologia internamente desde 2022. No entanto, a ausência de um lançamento público sugere uma cautela compreensível da empresa diante dos riscos associados, como golpes de deepfake em um ano eleitoral.
Microsoft e OpenAI estão orquestrando um projeto ambicioso para a construção de um data center, apelidado de "Stargate". Este projeto visa hospedar um supercomputador equipado com milhões de chips de IA, destinado a alimentar os modelos de próxima geração da OpenAI.
Detalhes do Projeto:
Investimento Monumental: O custo do projeto Stargate pode ultrapassar os US$ 100 bilhões, valorizando-o em 100 vezes mais do que os maiores data centers atuais.
Financiamento da Microsoft: A gigante da tecnologia deve financiar o projeto, com planos de lançamento previstos para 2028.
Diversificação de Chips de IA: O supercomputador planejado suportará chips de IA de vários fabricantes, diminuindo a dependência de GPUs da Nvidia.
Radar Insights:
Construir um data center que seja 100 vezes maior que os padrões atuais requer investimentos significativos, além de enormes quantidades de energia e tempo. O projeto Stargate evidencia a disposição da OpenAI e da Microsoft em não medir esforços na busca pela Inteligência Artificial Geral (AGI).
Um artigo da OpenAI acabou de ser atualizado, revelando a interface de edição do DALL-E. Essa nova funcionalidade permite editar imagens selecionando uma área específica e descrevendo as alterações desejadas em uma conversa!
Sobre a Interface do Editor DALL-E 3:
Edição Intuitiva: A interface do DALL•E editor permite que você edite imagens selecionando a área específica a ser modificada e descrevendo suas mudanças no chat. Você também pode fornecer um comando diretamente no painel de conversa, sem precisar usar a ferramenta de seleção.
Acesso Fácil: Para acessar a interface de edição do DALL•E, basta clicar em uma imagem gerada pelo DALL•E.
Adição, Remoção e Atualização: A interface permite adicionar, remover ou atualizar partes da imagem.
Atualização de Características: Características específicas de objetos podem ser atualizadas, como mudar a expressão de um gato para feliz.
Edição por Comandos no Painel de Conversa: Oferece a opção de fornecer um comando para a edição desejada diretamente no painel de conversa, sem a necessidade de usar a ferramenta de seleção.
RADAR EXPRESS
Andrew Ng, fundador da DeepLearning AI, falou no encontro AI Ascent da Sequoia Capital, revelando que o GPT 3.5 supera o GPT-4 por meio de um fluxo de trabalho de agência.
A xAI acaba de anunciar o Grok-1.5, a mais recente iteração de seu modelo de linguagem grande de código aberto, apresentando recursos de raciocínio aprimorados e um enorme comprimento de contexto de 128.000 tokens.
Google.org (o braço sem fins lucrativos do Google) acaba de lançar um programa de financiamento de US$ 20 milhões para organizações sem fins lucrativos que desenvolvem tecnologias generativas de IA.
A Amazon planeja gastar quase US$ 150 bilhões nos próximos 15 anos em data centers para lidar com a esperada explosão na demanda por aplicativos de IA.
Todas as agências federais dos EUA são agora obrigadas a ter um Diretor de IA e conselhos de governação de IA para supervisionar os sistemas de IA e garantir a utilização responsável como parte das novas orientações do Gabinete de Gestão e Orçamento.
Create a wide, highly detailed image of a futuristic robot with its mouth wide open in an exaggerated expression, close to the camera, almost giving a 3D effect coming out of the screen. The robot is emitting futuristic sound waves from its mouth in a satirical manner, in a style reminiscent of Pixar animations. The image should convey the concept of advanced voice cloning technology in a humorous and visually engaging way, with a focus on the robot's detailed design and expressive features.
Dall-e 3 ✧ SPARK