Nikolas Weber
🦙 Meta Lança o Poderoso Llama 3
🗣️ VASA-1 da Microsoft Anima Fotos com Realismo Impressionante
🌟 Adobe Express Lança App Móvel com AI Firefly
A Meta acaba de introduzir o Llama 3, a nova geração do seu modelo de linguagem de grande porte (LLM) de código aberto — com versões de 8B e 70B parâmetros que superam concorrentes de modelo aberto em uma variedade de benchmarks de avaliação.
Detalhes:
Desempenho Superior: Testes da Meta mostram que o Llama 3 8B e 70B superam modelos de tamanho semelhante como o Gemma da Google, Mistral 7B e Claude 3 Sonnet da Anthropic.
Treinamento Extensivo: Os modelos foram treinados em um conjunto de dados 7 vezes maior que o Llama 2, contendo 15 trilhões de tokens e 4 vezes mais código.
Versão Gigante a Caminho: A versão de parâmetros 400B+ está prevista para ser lançada nos “próximos meses“ e espera-se que seja competitiva com o GPT-4.
Integração Plataforma Ampla: O Llama 3 está integrado em plataformas através do assistente de IA da Meta, disponível no Facebook, Instagram, WhatsApp, Messenger e um novo site meta.ai.
Por Que Isso Importa:
Com benchmarks impressionantes e um modelo gigantesco prestes a ser lançado, o plano mestre de Zuckerberg está ganhando forma. Com o ser humano médio ainda tendo uma exposição limitada à IA, as amplas integrações da Meta acabam de fornecer gratuitamente um modelo de IA de primeira linha para mais de 3 bilhões de pessoas através de seus produtos.
A Microsoft acaba de revelar o VASA-1, um novo modelo de IA capaz de gerar vídeos de cabeças falantes incrivelmente realistas a partir de uma única imagem estática e um clipe de áudio.
Detalhes:
Tecnologia de Animação: O VASA-1 necessita apenas de uma foto e de um arquivo de áudio de fala para criar um vídeo falado realista do sujeito, com movimentos de boca sincronizados e animações expressivas.
Expressões e Movimentos Naturais: O modelo pode gerar expressões matizadas, movimentos de cabeça naturais e até performances de canto realistas, indo além da simples sincronização labial.
Controle de Usuário: Os usuários podem utilizar sliders de entrada para controlar aspectos do vídeo gerado, como direção do olhar, distância da cabeça e tom emocional.
Por Que Isso Importa:
O VASA-1 representa um grande salto tecnológico, com potenciais aplicações em áreas como avatares virtuais, jogos e animação por computador. Embora seja apenas uma demonstração de pesquisa, a capacidade de gerar deepfakes incrivelmente realistas está claramente presente — com implicações significativas, dadas as eleições futuras e a adoção mais ampla por atores mal-intencionados.
Adobe acaba de introduzir uma nova versão do app Adobe Express para dispositivos móveis, embalando as mesmas funcionalidades de criação, edição e IA generativa da versão desktop em um aplicativo para iOS e Android.
Detalhes:
Acesso Gratuito com Premium: O uso do app é gratuito, mas para acessar o Firefly e a gama completa de ferramentas de edição é necessário uma assinatura Premium de $10 por mês.
Criação de Conteúdo em Movimento: Disponível para download agora no iOS e Android, o app Adobe Express móvel possibilita a criação de designs impactantes, vídeos envolventes, imagens e conteúdo animado para todos os seus canais e plataformas favoritos.
Funcionalidades de Vídeo na Ponta dos Dedos: Com o Adobe Express, é fácil criar conteúdo destacado para TikTok, YouTube, Instagram Reels ou Stories diretamente do seu dispositivo móvel.
Por Que Isso Importa:
O novo app móvel da Adobe Express permite reinventar como a criatividade é trazida à vida, oferecendo capacidades poderosas de criação de vídeo e edição ao alcance dos dedos. A integração de IA generativa traz possibilidades ilimitadas para transformar prompts de texto em imagens extraordinárias, efeitos de texto, templates e muito mais, tudo com apenas alguns toques na tela do celular.
Create a horizontal image of a happy llama walking in AI land. The scene should be depicted in a Pixar 3D style, suitable for a commercial. The llama is joyfully strolling through a vibrant landscape filled with symbols of AI, like binary code pathways, cloud computing formations in the sky, and algorithmic rivers. The atmosphere should be whimsical and technologically themed, with a warm and inviting color palette. The image should be full of life, energy, and the excitement of exploration, portraying the llama as curious and delighted by its surroundings. It should evoke a sense of wonder and the boundless possibilities within AI land.
Dall-e 3 ✧ SPARK