A Meta delineou seus últimos avanços na identificação automatizada de objetos em imagens, com sua atualização sistema SEER agora, segundo a Meta, o maior e mais avançado modelo de visão computacional disponível.
SEER – que é um derivado de ‘auto-supervisionado’ – é capaz de aprender com qualquer grupo aleatório de imagens na internet, sem a necessidade de curadoria e rotulagem manual, o que acelera sua capacidade de identificar uma ampla gama de objetos diferentes dentro de um frame, e agora é capaz de superar os principais sistemas de visão computacional padrão da indústria em termos de precisão.
E só está melhorando. A versão original de VIDENTE, que foi anunciado inicialmente pela Meta no ano passado, foi construído em um modelo de mais de 1 bilhão de imagens. Esta nova versão agora é 10x o escopo.
Conforme explicado por Meta:
“Quando anunciamos pela primeira vez SEER na primavera passada, superou os sistemas de última geração, demonstrando que o aprendizado autossupervisionado pode se destacar em tarefas de visão computacional em configurações do mundo real. Agora, escalamos o SEER de 1 bilhão para 10 bilhões de parâmetros densos, tornando-o, até onde sabemos, o maior modelo denso de visão computacional de seu tipo.”
Destaca-se a capacidade do sistema de identificar diferentes imagens de diferentes pessoas e culturas, ao mesmo tempo em que é capaz de atribuir significado e interpretação a objetos de diversas regiões globais.
“Os sistemas tradicionais de visão computacional são treinados principalmente em exemplos dos EUA e de países ricos da Europa, de modo que geralmente não funcionam bem para imagens de outros lugares com características socioeconômicas diferentes. Mas o SEER oferece bons resultados para imagens de todo o mundo – incluindo regiões fora dos EUA e fora da Europa com uma ampla gama de níveis de renda.”
Isso é significativo, porque expandirá a compreensão do sistema de diferentes objetos e usos, o que pode ajudar a melhorar a precisão e fornecer melhores descrições automatizadas do que está em um quadro. Isso pode fornecer mais contexto para usuários com deficiência visual, juntamente com correspondência de identificação de produtos, sinais de sinalização, alertas de marca etc.
Meta também observa que o sistema é um componente-chave de seu próximo turno.
“O avanço da visão computacional é uma parte importante da construção do Metaverso. Por exemplo, para construir óculos AR que possam guiá-lo até suas chaves perdidas ou mostrar como fazer uma receita favorita, precisaremos de máquinas que entendam o mundo visual como as pessoas. Eles precisarão funcionar bem em cozinhas não apenas em Kansas e Kyoto, mas também em Kuala Lumpur, Kinshasa e em inúmeros outros lugares ao redor do mundo. Isso significa reconhecer todas as diferentes variações de objetos do cotidiano, como chaves de casa, fogões ou especiarias. A SEER inova ao alcançar este desempenho robusto.”
A Meta vem trabalhando na melhoria da identificação de objetos há anos e fez avanços significativos em termos de legendas automatizadas, descrições de leitores e muito mais.
Também está trabalhando na identificação de objetos no vídeo, o próximo estágio. E embora essa ainda não seja uma opção viável, ela pode, eventualmente, levar a todos os novos insights de dados, permitindo que você saiba mais sobre o que cada usuário publica e como alcançá-los com suas promoções.
Mesmo agora, isso pode ser valioso. Se você soubesse, por exemplo, que um determinado subconjunto de usuários no Instagram era mais propenso a postar uma foto de sua refeição, com base em padrões de postagem anteriores, isso poderia ajudar no direcionamento do seu anúncio. Extrapole isso para qualquer assunto, com um alto grau de precisão na correspondência de dados, e essa pode ser uma ótima maneira de gerar o máximo valor de sua abordagem de anúncio.
E isso é antes, como observa Meta, considerando os aplicativos avançados em sobreposições de RA ou melhorando seus algoritmos de vídeo para mostrar às pessoas mais do conteúdo com o qual elas têm maior probabilidade de se envolver, com base no que realmente está em cada quadro.
A próxima etapa está chegando, e sistemas como esse sustentarão grandes mudanças na conectividade online.
Você pode ler mais sobre o sistema SEER da Meta aqui.
source – www.socialmediatoday.com