Etched está agitando o espaço de hardware de inteligência artificial com seu novo e revolucionário chip acelerador de IA. A startup do Vale do Silício, fundada em 2022 por Gavin Uberti e Chris Zhu, que abandonaram Harvard, desenvolveu um circuito integrado de aplicação específica (ASIC) personalizado chamado Sohu, que foi desenvolvido especificamente para executar modelos de transformadores – a arquitetura por trás dos sistemas de IA mais avançados da atualidade.
Transformador gravado ASICS para LLMs
Etched afirma que seu chip Sohu pode processar cargas de trabalho de IA até 20 vezes mais rápido do que as GPUs topo de linha da Nvidia, usando significativamente menos energia. Com US$ 120 milhões em novos financiamentos e parcerias com grandes provedores de nuvem, a Etched está se posicionando como um formidável desafiante ao domínio da Nvidia em chips de IA.
Primary Venture Partners e Positive Sum Ventures lideraram a rodada de financiamento, que incluiu a participação de investidores de alto perfil como Peter Thiel, o CEO do Github, Thomas Dohmke, e o ex-CTO da Coinbase, Balaji Srinivasan. À medida que os modelos de transformadores continuam a impulsionar avanços na IA generativa, o hardware especializado da Etched poderá remodelar o cenário da computação de IA.
A abordagem do Etched visa as complexidades das GPUs e TPUs, particularmente a necessidade de lidar com código CUDA e PyTorch arbitrário, que exige compiladores sofisticados. Embora outros desenvolvedores de chips de IA, como AMD, Intel e AWS, tenham investido bilhões no desenvolvimento de software com sucesso limitado, a Etched está estreitando seu foco. Ao executar exclusivamente transformadores, o Etched pode agilizar o desenvolvimento de software para esses modelos.
A maioria das empresas de IA usa bibliotecas de inferência específicas de transformadores, como TensorRT-LLM, vLLM ou TGI do HuggingFace. Embora um tanto inflexíveis, essas estruturas são suficientes para a maioria das necessidades porque os modelos de transformadores em diferentes aplicações – texto, imagem ou vídeo – são fundamentalmente semelhantes. Isso permite que os usuários ajustem os hiperparâmetros do modelo sem alterar o código principal do modelo. No entanto, os laboratórios de IA mais proeminentes geralmente exigem soluções personalizadas, empregando engenheiros para otimizar meticulosamente os kernels da GPU.
O Etched visa eliminar a necessidade de engenharia reversa, tornando toda a sua pilha de software de código aberto, desde drivers até kernels. Essa abertura permite que os engenheiros implementem camadas de transformador personalizadas conforme necessário, aumentando a flexibilidade e a inovação.
A abordagem do Etched ao hardware de IA é comparável aos avanços vistos com o LPU Inference Engine da Groq. A LPU da Groq, uma unidade de processamento de linguagem dedicada, estabeleceu novos padrões de eficiência de processamento para grandes modelos de linguagem, superando as GPUs tradicionais em tarefas específicas. De acordo com ArtificialAnalysis.ai, o LPU da Groq alcançou uma taxa de transferência de 241 tokens por segundo com o modelo Llama 2-70b da Meta AI, demonstrando sua capacidade de processar grandes volumes de dados mais diretos com mais eficiência do que outras soluções.
Este nível de desempenho destaca o potencial do hardware especializado de IA para revolucionar o campo, oferecendo capacidades de processamento mais rápidas e eficientes, adaptadas a cargas de trabalho específicas de IA. Etched afirma que seu ASIC atinge até 500.000 tokens por token com seu hardware, diminuindo o desempenho do Groq.
Os ASICs mudaram o jogo para o Bitcoin; eles farão o mesmo com a IA?
A introdução de ASICs para mineração de Bitcoin marcou uma mudança revolucionária no cenário, alterando fundamentalmente a dinâmica da rede. Quando os ASICs foram introduzidos pela primeira vez em 2013, eles representaram um salto quântico na eficiência da mineração em comparação com as CPUs e GPUs que anteriormente dominavam o campo. Esta transição impactou profundamente o ecossistema do Bitcoin, aumentando drasticamente a taxa geral de hash da rede e, consequentemente, a sua segurança.
Os ASICs, desenvolvidos especificamente para a mineração de Bitcoin, ofereceram poder computacional e eficiência energética sem precedentes, tornando rapidamente obsoleta a mineração de CPU e GPU para Bitcoin. Essa mudança levou a uma rápida centralização do poder de mineração, já que somente aqueles com acesso ao hardware ASIC poderiam extrair Bitcoin com lucro. A era ASIC inaugurou operações de mineração em escala industrial, transformando a mineração de Bitcoin de um hobby acessível a entusiastas individuais em uma indústria altamente competitiva e de capital intensivo.
História e desenvolvimento gravados
A visão da Etched começou em 2022, quando tecnologias de IA como ChatGPT ainda não eram predominantes e os modelos de geração de imagens e vídeos dependiam principalmente de U-Nets e CNNs. Desde então, os transformadores tornaram-se a arquitetura dominante em vários domínios de IA, validando o foco estratégico da Etched.
A empresa está avançando rapidamente em direção a um dos lançamentos de chips mais rápidos da história. Ela atraiu os melhores talentos dos principais projetos de chips de IA, fez parceria com a TSMC para seu processo avançado de 4 nm e garantiu recursos essenciais, como HBM e fornecimento de servidores para apoiar a produção inicial. Os primeiros clientes já comprometeram dezenas de milhões de dólares com o hardware da Etched.
Este rápido progresso poderá acelerar dramaticamente as capacidades de IA. Por exemplo, os modelos de IA podem tornar-se 20 vezes mais rápidos e mais baratos da noite para o dia. As limitações atuais poderiam ser drasticamente reduzidas, como os tempos de resposta lentos de modelos como o Gemini ou os altos custos e longos tempos de processamento dos agentes de codificação. Aplicações em tempo real, desde a geração de vídeo até conversas baseadas em IA, poderiam tornar-se viáveis, resolvendo os atuais gargalos enfrentados até mesmo por empresas líderes de IA como a OpenAI durante períodos de pico de utilização.
Os avanços do Etched prometem transformar vídeos, chamadas, agentes e pesquisas em tempo real em realidade, transformando fundamentalmente os recursos de IA e sua integração em aplicativos do dia a dia.
Mencionado neste artigo
source – cryptoslate.com