Nikolas Weber
🎥 Kling: O Concorrente do Sora Chegou!
🔍 OpenAI Investiga o Funcionamento do GPT
🎨 Cara: A Nova Rede Social para Artistas
A empresa chinesa Kuaishou acaba de revelar o KLING, um novo modelo de IA de texto-para-vídeo capaz de gerar vídeos de alta qualidade com até 2 minutos de duração, rivalizando com o ainda não lançado Sora da OpenAI.
Detalhes do KLING:
Alta Resolução e Duração: KLING produz vídeos em resolução 1080p com até 2 minutos de duração, superando os vídeos de 1 minuto do Sora da OpenAI.
Demonstrações Realistas e Surreais: As demos incluem desde cenas realistas, como um homem comendo macarrão, até clipes surreais de animais vestindo roupas.
Tecnologia Avançada: Utiliza um sistema de atenção espaço-tempo em 3D para simular movimentos complexos e interações físicas, aproximando-se mais do mundo real.
Disponibilidade: Atualmente, o modelo está disponível para usuários na China como uma demo pública no aplicativo KWAI para iOS.
Por Que Importa:
As gerações do KLING são impressionantes, especialmente considerando que há apenas um ano, a internet estava rindo do vídeo desastroso do Will Smith comendo espaguete. Com a espera ansiosa pelo lançamento público do Sora, outros concorrentes estão entrando no jogo, prometendo aquecer ainda mais o cenário de vídeos gerados por IA.
A OpenAI acaba de publicar um novo artigo detalhando um método para entender melhor os conceitos aprendidos pelos modelos de IA e explorar os mecanismos internos do ChatGPT.
Detalhes:
Equipe de Superalinhamento: O artigo foi escrito por membros da recentemente dissolvida equipe de superalinhamento, incluindo Ilya Sutskever e Jan Leike.
Técnica de Autoencoders Escassos: O artigo intitulado ‘Scaling and Evaluating Sparse Autoencoders’ descreve uma técnica para identificar padrões que representam conceitos específicos dentro do GPT-4.
Modelo Adicional: Usando um modelo adicional para sondar o modelo maior, os pesquisadores encontraram uma maneira de extrair milhões de padrões de atividade para exploração adicional.
Código e Ferramenta de Visualização: A OpenAI disponibilizou o código open-source e uma ferramenta de visualização, permitindo que outros explorem como diferentes palavras e frases ativam conceitos dentro dos modelos.
Por Que Importa:
Assim como a recente pesquisa “Golden Gate Claude” da Anthropic, as empresas de IA ainda estão trabalhando para entender o que realmente acontece dentro dos modelos de IA. Decifrar a “caixa preta” da IA seria um grande passo para melhorar a segurança, ajuste e controle dos modelos que avançam rapidamente.
A plataforma social para criativos, Cara, cresceu de 40 mil para 650 mil usuários em apenas uma semana, à medida que artistas se cansam das políticas de IA da Meta. A artista e fundadora Jingna Zhang está liderando um movimento que promete transformar a interação dos artistas com a tecnologia.
Detalhes:
Plataforma Focada em Artistas: Cara combina recursos do Instagram e X, oferecendo um espaço onde artistas podem exibir portfólios e postar atualizações sem medo de verem suas obras usadas para treinar IA sem consentimento.
Posicionamento Contra IA: A fundadora Jingna Zhang é uma defensora dos direitos dos artistas, lutando contra o uso não autorizado de obras para treinar modelos de IA. Recentemente, venceu um processo judicial em Luxemburgo e está envolvida em várias ações legais contra grandes empresas de tecnologia.
Crescimento Rápido e Desafios de Infraestrutura: Com um aumento de 1525% nos usuários, Cara enfrenta desafios significativos de infraestrutura. Recentemente, a fundadora se deparou com uma cobrança inesperada de $96,280 por serviços de hospedagem, destacando as dificuldades de escalar uma startup.
Por Que Importa:
Os artistas estão cada vez mais frustrados com o uso de suas obras para treinar sistemas de IA sem consentimento, o que está alimentando o êxodo para plataformas alternativas como Cara. O sucesso de Cara demonstra uma demanda crescente por espaços online que respeitem os direitos dos criativos, oferecendo um refúgio e uma comunidade para artistas que buscam um ambiente mais justo e respeitoso para compartilhar seu trabalho.
A horizontal hyperrealistic image showing a human with mouth open and eyes wide in a 'mindblown' reaction, looking at a smartphone screen eating noodles The background can be simple to keep the focus on the human and the smartphone --ar 16:9 --style raw
Midjourney