A AMD e a OpenAI anunciaram uma colaboração para o desenvolvimento do protocolo MRC (Multi-Path Reliable Connection), voltado à comunicação de dados em clusters de inteligência artificial de larga escala. Além das duas empresas, Broadcom, Intel e Microsoft também participam da iniciativa. O anúncio foi publicado pelo site Startupi, em texto escrito por Marystela Barbosa.
Detalhes do protocolo MRC
Segundo a AMD, o MRC foi projetado para melhorar o gerenciamento de congestionamento, acelerar a recuperação de falhas e manter a sincronização entre GPUs em ambientes de computação distribuída. A companhia afirma que o protocolo foi desenvolvido para operar em infraestruturas com interfaces de rede de até 800 Gb/s. A proposta, de acordo com a empresa, é aumentar a eficiência e a resiliência das redes utilizadas no treinamento de modelos de IA.
Disponibilização via OCP
O protocolo foi disponibilizado por meio do Open Compute Project (OCP), organização voltada à padronização de tecnologias para data centers. A AMD destacou que o desenvolvimento do MRC integra a iniciativa da companhia de promover padrões abertos para infraestrutura de inteligência artificial. A fonte não detalhou prazos para adoção do protocolo pela indústria.
Arquitetura Helios e previsões
A arquitetura Helios, citada pela AMD como parte da nova geração de sistemas para IA, combina GPUs da linha Instinct, CPUs EPYC e soluções de rede Pensando Vulcano. A AMD prevê que a plataforma seja utilizada em ambientes de treinamento e inferência de modelos de IA em larga escala a partir de 2026. A empresa não forneceu informações adicionais sobre custos ou disponibilidade comercial.
