A Microsoft quer trazer a IA generativa para a vanguarda do Windows – e dos PCs que o executam.
Em duas palestras durante sua conferência anual de desenvolvedores Build esta semana, a empresa revelou uma nova linha de máquinas Windows que está chamando de PCs Copilot +, além de recursos generativos alimentados por IA, como Recall, que ajuda os usuários a encontrar aplicativos, arquivos e outros conteúdos que eles têm. visto no passado. Copilot, a marca de IA generativa da Microsoft, em breve estará muito mais profundamente integrada à experiência do Windows 11. E novos dispositivos Microsoft Surface estão a caminho.
Reunimos todos os principais anúncios de segunda e terça aqui.
Aplicativos volumétricos
A Microsoft está trazendo aplicativos volumétricos do Windows – basicamente aplicativos de VR interativos e com reconhecimento espacial – para os fones de ouvido Meta Quest. Por meio de uma parceria com a Meta, a Microsoft afirma que fornecerá Windows 365 e conectividade local de PC para headsets Quest, permitindo que os desenvolvedores estendam seus aplicativos para o espaço 3D.
Créditos da imagem: Microsoft
Durante a palestra de terça-feira, a Microsoft exibiu uma visão digital explodida em 3D de um controlador do Xbox da perspectiva de um fone de ouvido Meta Quest 3 – um objeto digital que o usuário pode manipular com as mãos. “Estamos aprofundando nossa parceria com a Meta para tornar o Windows uma experiência de primeira classe em dispositivos Quest”, disse Pavan Davuluri, CVP de Windows e dispositivos da Microsoft, durante a demonstração.
Os desenvolvedores podem se inscrever para uma visualização para receber acesso à nova API volumétrica da Microsoft.
Copiloto+ PCs
Créditos da imagem: Microsoft
Os PCs Copilot+ são a visão da Microsoft de hardware Windows carro-chefe e pioneiro em IA. Todos incluem chips dedicados chamados NPUs para potencializar experiências de IA como Recall. E eles vêm com no mínimo 16 GB de RAM, combinados com armazenamento SSD.
Os primeiros PCs Copilot + incluirão os chips Snapdragon X Elite e Plus da Qualcomm, que a Microsoft afirma oferecer até 15 horas de navegação na web e 20 horas de bateria de vídeo. Os fabricantes de chips Intel e AMD também estão comprometidos em construir processadores para dispositivos Copilot+ em parceria com diversos fabricantes, incluindo Acer, Asus, Dell, HP, Lenovo e Samsung.
Os PCs Copilot+ custam a partir de US$ 999 e alguns estão disponíveis para encomenda hoje.
Surface Pro e Surface Laptop
Os dispositivos Surface recentemente revelados pela Microsoft, o Surface Laptop e o Surface Pro, concentram-se no desempenho e na bateria.
Créditos da imagem: Microsoft
O mais recente Surface Laptop – disponível com tela de 13,8 ou 15 polegadas – foi redesenhado com “linhas modernas” e engastes de tela mais finos. Ele dura até 22 horas com carga e é até 86% mais rápido que o Surface Laptop 5, afirma a empresa. Ele também suporta Wi-Fi 7 e possui um touchpad de feedback tátil.
Créditos da imagem: Microsoft
Quanto ao novo Surface Pro, a Microsoft diz que é até 90% mais rápido que o Surface Pro da geração anterior (o Surface Pro 9) e possui um novo OLED com tela HDR, Wi-Fi 7 (e 5G opcional) e um câmera frontal ultralarga atualizada. Além disso, seu teclado removível – que foi reforçado com fibra de carbono adicional – agora possui feedback tátil.
Lembrar
O próximo recurso Recall do Windows 11 pode “lembrar” aplicativos e conteúdo que um usuário acessou em seu PC semanas ou até meses atrás, por exemplo, ajudando-os a encontrar um bate-papo do Discord onde estavam discutindo roupas que estavam pensando em comprar. Os usuários podem usar a linha do tempo do Recall para “rolar para trás” para ver no que estavam trabalhando no passado recente e detalhar arquivos como apresentações em PowerPoint para revelar informações potencialmente relevantes para suas pesquisas.
A Microsoft diz que o Recall pode criar associações entre cores, imagens e muito mais para permitir que os usuários pesquisem praticamente qualquer coisa em seus PCs em linguagem natural (não muito diferente da tecnologia da startup Rewind); os desenvolvedores poderão melhorar o Recall adicionando informações contextuais aos seus aplicativos. E a Microsoft afirma que todos os dados do usuário associados ao Recall são mantidos privados e no dispositivo – e não são usados para treinar modelos de IA, o que é importante.
Aqui está mais da Microsoft: “Seus instantâneos são seus; eles ficam localmente no seu PC. Você pode excluir instantâneos individuais, ajustar e excluir intervalos de tempo em Configurações ou pausar a qualquer momento diretamente no ícone na bandeja do sistema na barra de tarefas. Você também pode filtrar aplicativos e sites para que não sejam salvos.
Edição de imagens e traduções ao vivo
Agora há mais IA no Windows do que nunca e parte dela exclusivamente nos novos PCs Copilot+.
Um novo recurso chamado Super Resolução pode restaurar fotos antigas aumentando-as automaticamente. E o Copilot agora pode analisar imagens para dar aos usuários ideias para composições criativas. Por meio de um recurso chamado Cocreator, os usuários podem gerar imagens e também pedir ao modelo de IA que siga o que estão desenhando para alterar ou reestilizar a imagem.
Créditos da imagem: Microsoft
Em outros lugares, as legendas ao vivo com traduções ao vivo traduzem qualquer áudio que passa por um PC – seja do YouTube ou de um arquivo local – para o idioma de escolha do usuário. As traduções ao vivo suportarão inicialmente cerca de 40 idiomas, incluindo inglês, espanhol, mandarim e russo.
Um novo recurso separado, mas relacionado, do Microsoft Edge oferece tradução de vídeo em tempo real em sites como LinkedIn, YouTube, Coursera, Reuters, CNBC, Bloomberg e muito mais. Previsto para estar disponível em um futuro próximo, o recurso – que suporta a tradução de espanhol para inglês e de inglês para alemão, hindi, italiano, russo e espanhol – traduz conteúdo falado por meio de dublagem e legendas ao vivo.
Copiloto de equipe e extensões
Team Copilot é a mais recente expansão do crescente conjunto Copilot de tecnologia generativa de IA da Microsoft. Ele se integra ao Teams, o aplicativo de videoconferência da empresa, para ajudar a gerenciar agendas de reuniões e fazer anotações que qualquer pessoa em uma reunião pode ser coautora. E se estende ao Loop and Planner, as plataformas de colaboração e planejamento da Microsoft, para criar e atribuir tarefas, acompanhar prazos e notificar os membros da equipe quando sua contribuição for necessária.
Créditos da imagem: Github/Microsoft
Em notícias um tanto relacionadas ao Copilot, a Microsoft lançou (em visualização privada) Copilot Extensions, que permitem aos desenvolvedores estender a ferramenta de geração de código do GitHub, GitHub Copilot, com aplicativos e habilidades de terceiros. Os parceiros de lançamento incluem DataStax, Docker e LambdaTest; as extensões ficarão no GitHub Marketplace, mas os desenvolvedores também poderão criar suas próprias extensões privadas para integração com seus sistemas internos e APIs.
Tempo de execução do Windows Copilot
Créditos da imagem: Microsoft
Potenciando recursos como Recall e Super Resolução está o Windows Copilot Runtime, uma coleção de cerca de 40 modelos generativos de IA que compõem o que a Microsoft descreve como “uma nova camada” do Windows. Em conjunto com o índice semântico, um sistema baseado em vetor local para um PC Copilot+ individual, o Windows Copilot Runtime permite que aplicativos generativos alimentados por IA – incluindo aplicativos de terceiros – sejam executados sem necessariamente precisar de uma conexão com a Internet.
“[The runtime] consiste em APIs de IA prontas para usar, como efeitos de estúdio, traduções de legendas ao vivo, OCR, recuperação com atividade do usuário e [more]que estará disponível para desenvolvedores em junho”, disse Davuluri na terça-feira.
A Microsoft diz que CapCut, o popular editor de vídeo do proprietário do TikTok, ByteDance, usará o Windows Copilot Runtime e a nova Windows Copilot Library, um conjunto de APIs e ferramentas de desenvolvimento de IA, para acelerar seus recursos de IA. E o Meta adicionará os efeitos de estúdio mencionados acima ao WhatsApp para fornecer recursos como desfoque de fundo e contato visual durante chamadas de vídeo.
Construtores de bots atualizados
Azure AI Studio, o conjunto de ferramentas do Azure OpenAI Service da Microsoft que permite aos clientes combinar um modelo de IA e construir um aplicativo que “raciocina” esses dados, em breve permitirá que os desenvolvedores criem aplicativos usando APIs de inferência pré-pagas – as APIs através do qual os desenvolvedores podem acessar e ajustar modelos generativos de IA hospedados na infraestrutura do Azure. A Microsoft chama isso de “modelo como serviço” e está lançando modelos da Nixtla e Core42 para começar.
No conjunto de produtos Copilot Studio adjacente, a Microsoft está lançando agentes Copilot, que a empresa descreve como bots de IA que podem “orquestrar de forma independente tarefas adaptadas a funções e funções específicas”. (O Copilot Studio fornece ferramentas para conectar o Copilot for Microsoft 365, o “copilot” alimentado por IA em aplicativos como Excel e Word, a dados de terceiros.) Aproveitando a memória e o conhecimento do contexto, os agentes do Copilot podem navegar em vários tipos de fluxos de trabalho de negócios, aprendendo com o feedback dos usuários e pedindo ajuda quando se deparam com situações com as quais não sabem como lidar.
Kit de desenvolvimento Snapdragon
Créditos da imagem: Microsoft
Há um novo kit de desenvolvimento da Qualcomm voltado para desenvolvedores que criam aplicativos para PCs Copilot + com chip Arm
O Snapdragon Dev Kit de US$ 899,99 para Windows – que mede aproximadamente a mesma largura, altura e comprimento do Mac Mini da Apple, aliás – abriga o chip Snapdragon X Elite da Qualcomm emparelhado com 32 GB de RAM, 512 GB de armazenamento e muita E/S. O Dev Kit suporta Wi-Fi 7 e Bluetooth 5.4 e, por meio de suas várias portas USB-C e HDMI, pode controlar até três monitores 4K ao mesmo tempo.
Fi-3
A Microsoft anunciou uma adição à sua família de modelos generativos de IA Phi, Phi-3-vision, que pode realizar análises visuais gerais e tarefas de raciocínio, como responder perguntas sobre gráficos e imagens. O modelo pode ler texto e imagens e é eficiente o suficiente para ser executado em um dispositivo móvel.
Phi-3-vision está disponível em versão prévia, enquanto as contrapartes somente texto do modelo anunciadas anteriormente – Phi-3-mini, Phi-3-small e Phi-3-medium – estão agora disponíveis para o público geral.
Parceria com a Khan Academy
A Microsoft está se unindo à Khan Academy para doar acesso à infraestrutura de computação em nuvem, permitindo que a Khan Academy ofereça aos educadores nos EUA acesso gratuito às ferramentas baseadas em IA da Khan Academy. As duas empresas também colaborarão para explorar oportunidades para melhorar os aplicativos de IA para aulas de matemática por meio de IA generativa, disse a Microsoft na terça-feira.
Estamos lançando um boletim informativo sobre IA! Inscreva-se aqui para começar a recebê-lo em suas caixas de entrada no dia 5 de junho.
source – techcrunch.com