Nikolas Weber

8 de fev. de 2024

📺 YouTube Aposta Alto em IA para 2024

🍎 Apple Apresenta Ferramenta de IA para Edição de Imagens

A Microsoft comemora o primeiro aniversário do Copilot com atualizações significativas, incluindo uma nova interface, edição de imagens em linha, integração com 'Designer GPT' e mais — juntamente com o lançamento do anúncio da empresa para o Super Bowl.


  • A interface principal do Copilot foi reformulada, apresentando um design mais elegante e uma carrossel renovada de prompts sugeridos.

  • Os usuários agora podem editar imagens diretamente durante as conversas, como alterar cores ou desfocar fundos.

  • Assinantes do Copilot Pro ganham a capacidade de redimensionar e regenerar imagens, com uma nova integração direta 'Designer GPT' prevista para breve.

  • A Microsoft retorna ao Super Bowl com seu primeiro anúncio em quatro anos, destacando o Copilot (sem mencionar o Bing uma única vez).

Pode ser hora de dar adeus ao Bing Chat, enquanto a Microsoft se volta completamente para a marca Copilot. O anúncio no Super Bowl também indica uma mudança de marketing, posicionando o Copilot mais como um assistente de IA e menos como uma ferramenta de busca para o grande público.

O CEO do YouTube, Neal Mohan, destacou a IA generativa como a principal "grande aposta" da plataforma para 2024, em uma nova postagem de blog que delineia sua visão para empoderar criadores e democratizar o acesso à tecnologia.


  • Mohan enfatizou que o objetivo é usar a IA para ajudar "todos a criar", e não substituir os criadores.

  • Com mais de 70 bilhões de visualizações diárias, os Shorts do YouTube serão um alvo chave para testar novas capacidades de vídeo com IA.

  • O blog também destacou novos experimentos como o Dream Screen, que permite aos usuários fazer fundos gerados por IA para shorts, e o Dream Track para música gerada por IA.

Embora a IA ainda enfrente reações negativas de muitos criativos, plataformas como o YouTube que trabalham para empoderar os criadores podem ajudar a mudar o sentimento mais amplo. Quanto mais integrada a IA se torna, mais a conversa muda para uma 'ferramenta' criativa em vez de um 'substituto' criativo.

Pesquisadores da Apple e da Universidade da Califórnia em Santa Barbara acabam de lançar o MGIE, um sistema de IA de código aberto para edição de imagens por meio de comandos de linguagem natural.


  • O modelo utiliza modelos de linguagem grandes multimodais (MLLMs) para interpretar instruções e orientar edições, permitindo realizar tarefas como modificar cores ou objetos, otimizar brilho/contraste e aplicar filtros a partir de simples prompts de texto.

  • O modelo é treinado de forma integral, garantindo que as edições estejam alinhadas com as instruções enquanto preserva áreas não relacionadas.

A Apple tem intensificado suas pesquisas em IA recentemente, e este modelo de código aberto é particularmente notável. Enquanto líderes em geração de texto para imagem adicionaram recursos de inpainting e edição de região, a edição por instrução do MGIE pode eventualmente oferecer controle ao estilo Photoshop com simples comandos.


Outtakes AI postou uma demonstração de seu aplicativo rodando localmente no Apple Silicon, mostrando a capacidade de gerar mundos imersivos no Vision Pro.

O CEO da Microsoft, Satya Nadella, anunciou planos para fornecer treinamento em habilidades de IA para 2 milhões de trabalhadores na Índia, enfatizando o papel significativo do país no cenário da IA.

Elon Musk demonstrou seu apoio ao antigo Desafio do Vesúvio para decifrar pergaminhos, dizendo que a Fundação Musk ajudará a financiar a próxima etapa do concurso.

A OpenAI está trabalhando em um tipo de software de agente para automatizar tarefas complexas, assumindo o controle do dispositivo do usuário. O software do agente irá lidar com tarefas baseadas na web, como coletar dados públicos sobre um conjunto de empresas, criar itinerários ou reservar passagens aéreas.

A Nvidia desenvolveu um sistema de IA conhecido como ChipNeMo que visa acelerar a produção de suas GPUs.

Deforum, um modelo de IA para geração de vídeos, lançou um webapp para gerar vídeos no navegador.

Prompt da Capa

Visualize a dynamic, wide horizontal scene for a commercial billboard featuring a Super Bowl game between robots. In the center of the image, a robot with a sleek, athletic build holds a football, ready to make a pivotal play. This robot is designed with futuristic elements, showcasing advanced technology and strength. The stadium around it is packed with thousands of robot fans, creating an electrifying atmosphere. Giant screens display close-ups of the action, while bright lights illuminate the scene. The image captures the intensity and excitement of the moment, with the central robot standing out as the star of the game. The background is a vibrant depiction of a modern, high-tech stadium filled to capacity, reflecting the grandeur and spectacle of the Super Bowl. The composition is designed to attract attention, perfect for an outdoor commercial billboard, highlighting the fusion of sports and advanced robotics in a future where technology reigns supreme.

