Meta AI cria uma nova plataforma para executar modelos de ponta de IA
MultiRay é a nova plataforma da Meta AI para executar modelos de inteligência artificial em larga escala sem problemas
Uma nova pesquisa da Meta AI desenvolveu o MultiRay, uma nova plataforma para executar modelos de IA de ponta em larga escala para tornar os sistemas de IA mais produtivos. Com a nova plataforma da Meta AI, MultiRay, inúmeros modelos de IA podem compartilhar a mesma entrada.
Apenas uma fração do tempo de processamento e dos recursos é usada para cada modelo, minimizando o custo geral dessas operações baseadas em IA. Ao centralizar os recursos computacionais da empresa em um modelo, os aceleradores de IA podem facilmente implantar e negociar estrategicamente entre recursos de computação e armazenamento de dados. Os modelos universais do MultiRay foram ajustados para se destacar em uma ampla variedade de aplicações. Modelos de aprendizado de máquina para vários usos, como marcação de postagens e detecção de discurso de ódio, podem ser atualizados e refinados por equipes em Meta AI com a ajuda do MultiRay. Esse método economiza tempo e esforço mais do que ter várias equipes construindo enormes modelos de ponta a ponta de forma independente.
O MultiRay garantiu a acessibilidade aos grandes modelos de núcleo da Meta, descarregando cálculos para hardware específico, como unidades de processamento gráfico (GPUs) e reduzindo o tempo e a energia gastos na recomputação, mantendo os dados usados com frequência na memória (cache). A nova plataforma MultiRay da Meta AI atualmente conduz mais de 125 casos de uso em Meta, suportando mais de 20 milhões de consultas por segundo (QPS) e 800 bilhões de consultas diárias.
O MultiRay emprega enormes modelos de IA fundamentais para refletir a entrada de uma maneira mais perfeita que fornece um ponto em um espaço vetorial de alta dimensão. Uma incorporação representa a entrada que é mais receptiva ao aprendizado de máquina. Para simplificar o processamento de modelos específicos de tarefas, o MultiRay fornece uma incorporação dos dados de entrada (como texto e imagens) que podem ser consumidos no lugar da entrada bruta. Os principais modelos do MultiRay são treinados para um bom desempenho em várias tarefas, incluindo similaridade e classificação. Devido à necessidade de transmitir informações adicionais, nossas incorporações são grandes (vários kilobytes de tamanho).
source – www.analyticsinsight.net