Mar 26, 2026

Interconexión óptica para desagregación de centros de datos

Dejar un mensaje

La desagregación del centro de datos separa la computación, la memoria, el almacenamiento y las redes en recursos agrupados e independientes en lugar de encerrarlos dentro de los límites fijos del servidor. Esa separación crea una nueva dependencia arquitectónica: la capa de interconexión entre esos grupos debe ofrecer suficiente ancho de banda, latencia lo suficientemente baja y alcance suficiente para que todo el sistema se comporte como un tejido coordinado. La interconexión óptica es la tecnología de transporte que cumple cada vez más esa función - particularmente cuando los enlaces de cobre alcanzan límites físicos de distancia, potencia e integridad de la señal.

Este artículo explica cómo la interconexión óptica admite arquitecturas desagregadas, dónde supera al cobre, cómo se relaciona con CXL y la óptica co-empaquetada, y cuándo tiene sentido práctico adoptarla.

Disaggregated data center linked by optical fabric

¿Qué es la desagregación del centro de datos?

En un modelo tradicional centrado en el servidor-, la CPU, la memoria, el almacenamiento y las redes están agrupados dentro de un único chasis. Compra un servidor y obtiene una proporción fija de los cuatro - ya sea que su carga de trabajo necesite esa proporción o no. La desagregación del centro de datos rompe ese paquete. Cada tipo de recurso está organizado en su propio grupo y las cargas de trabajo extraen solo lo que necesitan de cada grupo a través de un tejido compartido.

Esto es importante porque las cargas de trabajo modernas rara vez están equilibradas. Un trabajo de entrenamiento de modelos de lenguaje de gran tamaño puede saturar la memoria de la GPU y el ancho de banda este-oeste sin tocar apenas el almacenamiento local. Un proceso de análisis en tiempo real-puede necesitar una capacidad de memoria enorme, pero solo una computación moderada. En un diseño-céntrico en el servidor, esa falta de coincidencia conduce a la pérdida de recursos: ciclos de CPU inactivos junto con memoria agotada o capacidad de almacenamiento que ninguna carga de trabajo está utilizando.

ElProyecto de Computación Abierta (OCP)ha estado impulsando diseños de racks desagregados desde mediados de la década de 2010, y los hiperescaladores como Meta y Microsoft han implementado almacenamiento y redes desagregados a escala. El surgimiento deEnlace exprés de cálculo (CXL)ha extendido esa visión a la desagregación de la memoria, haciendo que la arquitectura sea cada vez más práctica para una gama más amplia de entornos.

Por qué los diseños tradicionales-centrados en servidores chocan contra un muro

Dos fuerzas están empujando a los equipos de infraestructura hacia la desagregación: la presión de utilización y la presión del ancho de banda.

En cuanto a la utilización, los paquetes de servidores fijos generan desperdicio a escala. Las investigaciones de la industria sugieren que aproximadamente el 25% de la capacidad de DRAM en los servidores convencionales no se utiliza en promedio, aun cuando la memoria representa casi la mitad del costo total del servidor. Multiplicada en miles de nodos, esa capacidad bloqueada representa una importante carga de capital y energía.

En lo que respecta al ancho de banda, los grupos de entrenamiento de IA y los análisis de alto-rendimiento generan patrones de tráfico que difieren marcadamente de las cargas tradicionales de servicio web del norte-sur-. Estas cargas de trabajo producen un intenso tráfico de este-oeste - GPU-a-GPU, de acelerador-a-memoria y de nodo-a-nodo - en cientos o miles de puntos finales. Las topologías tradicionales-centradas en servidores con tramos cortos de cobre entre cajas fijas no se diseñaron para ese patrón. A medida que las velocidades de los enlaces aumentan de 400G a 800G y más, las limitaciones eléctricas del cobre se vuelven más difíciles de sortear.

¿Cómo funciona la interconexión óptica en un centro de datos desagregado?

Una vez que los recursos de procesamiento, memoria y acelerador se ubican en grupos separados, la estructura que conecta esos grupos se convierte en la capa{0}}crítica para el rendimiento. La interconexión óptica sirve a esa capa al convertir señales eléctricas en luz y transmitir datos a través demodo único-ofibra multimodoy convertirlo nuevamente a eléctrico en el extremo receptor.

La física del transporte óptico le otorga ventajas estructurales para este trabajo. Las señales de luz en fibra experimentan mucha menos atenuación por metro que las señales eléctricas en cobre, lo que significa que los enlaces ópticos pueden mantener la calidad de la señal en distancias más largas sin el acondicionamiento de señal que consume -energía (retemporizadores, DSP, ecualizadores) que el cobre exige a velocidades más altas. A 800 Gbps, el cobre pasivo es práctico hasta aproximadamente 3 a 5 metros. Los cables eléctricos activos extienden esa distancia hasta quizás 7 metros. Los enlaces ópticos habitualmente abarcan entre 100 metros y 2 kilómetros con la misma velocidad de datos, y la óptica coherente puede alcanzar decenas de kilómetros.

Short copper links and longer optical connections

En una arquitectura desagregada, esta ventaja de alcance no es abstracta. Determina directamente qué tan separados pueden ubicarse los grupos de recursos sin dejar de comportarse como un sistema unificado. Específicamente:

  • Dentro del bastidor:El cobre todavía domina las conexiones muy cortas de - servidor-a-la parte superior-del-conmutador de rack, GPU-a-GPU dentro de una bandeja. A distancias inferiores a 2 o 3 metros, el cobre es más simple, más barato y tiene menor-latencia.
  • Bastidor-a-rack (de 2 a 100 m):Aquí es donde la interconexión óptica se convierte en el valor predeterminado práctico a 400G y más. Conectar un bastidor de computación a un grupo de memoria en un bastidor adyacente o vincular bandejas de GPU en una fila generalmente requiere la densidad de ancho de banda y el alcance que proporciona la fibra.Conjuntos de cables de fibra óptica.yConectividad MPO/MTPson estándar para estos caminos.
  • Habitación-a-habitación y edificio-a-edificio (100 m–10+ km):Sólo el transporte óptico es viable a estas distancias y velocidades. Este alcance es importante para la desagregación de escala-de campus, donde los grupos de almacenamiento, la computación de respaldo o los recursos de recuperación-de desastres se encuentran en edificios separados.

Interconexión óptica versus cobre en centros de datos desagregados

La elección entre fibra óptica y cobre no es binaria - sino que depende del alcance-. A continuación se muestra cómo se comparan los dos entre los factores que más importan en un diseño desagregado:

Factor Cobre Fibra óptica
Alcance práctico a 800G 3–7 m (pasivo/activo) 100 m – 10+ km (dependiendo del tipo de óptica)
Densidad de ancho de banda Bajar por cable; Los cables son más gruesos a velocidades más altas. Mayor por cable; La fibra delgada admite un alto número de puertos
Potencia por bit (mayor alcance) Se requieren - DSP, retemporizadores y acondicionamiento de señal más altos Baje a un alcance y velocidad equivalentes
Latencia (corto alcance) Muy bajo (el cobre pasivo no tiene gastos generales de conversión) Ligeramente superior debido a la conversión electro-óptica
Inmunidad EMI Susceptible a interferencias electromagnéticas Inmune - importante en entornos densos y de alto-poder
Peso del cable y flujo de aire Más pesado y voluminoso en recuentos más altos Más ligero y delgado, mejor para el flujo de aire en estantes densos
Costo (corto alcance, baja velocidad) Bajar por adelantado Más alto por adelantado
Costo (a nivel de sistema-, a escala) Puede ser mayor cuando se factorizan los límites de potencia, refrigeración y alcance A menudo, un costo total de propiedad más bajo en 400G+ y rutas más largas
Mejor ajuste en diseño desagregado Enlaces cortos intra-bandeja, intra-rack Estante-a-estante, fila-a-fila, sala-a-sala y campus-escala

La conclusión práctica: use cobre donde la simplicidad-de las distancias cortas aún prevalece. Utilice la óptica cuando el alcance, la densidad del ancho de banda, la eficiencia energética o la gestión de cables se conviertan en limitaciones vinculantes. En un entorno desagregado, la proporción óptica de la interconexión total crece porque la arquitectura misma crea rutas más largas y de mayor-ancho de banda entre grupos de recursos separados. Para una comparación más profunda de los tipos de medios, consulteCables de fibra óptica versus cables de cobre: ​​cuál es el adecuado para su implementación.

Copper versus optical interconnect comparison

Beneficios clave de la interconexión óptica para la desagregación

Mayor densidad de ancho de banda para grupos de recursos separados

La desagregación aumenta el volumen de tráfico que cruza la capa de interconexión porque los recursos que alguna vez estuvieron co-ubicados ahora se comunican a través de la estructura. La fibra óptica respalda esa demanda con un mayor ancho de banda por-fibra y más fibras por cable. un solocable de fibra de cintapuede transportar cientos de fibras en una sección transversal- compacta, lo que permite el tipo de densidad de puertos que requieren los grupos de memoria y los clústeres de GPU desagregados.

Menor carga energética y térmica a escala

La eficiencia energética es más importante en un diseño desagregado porque la capa de interconexión transporta una proporción mayor del tráfico total del sistema. A 800G y superiores, los enlaces de cobre en distancias moderadas requieren un procesamiento DSP intensivo-en energía en ambos extremos. Los enlaces ópticos a velocidades y distancias equivalentes consumen menos energía por bit. La documentación técnica de NVIDIA sobre su plataforma de conmutación óptica co-paqueteada informa unReducción de 3,5 veces en el consumo de energíaen comparación con los transceptores enchufables tradicionales. A escala del centro de datos, esa diferencia se traduce directamente en facturas de electricidad más bajas y una infraestructura de refrigeración reducida.

Escalado modular e independiente

Una de las principales promesas de la desagregación es que la computación, la memoria y el almacenamiento pueden escalar a diferentes velocidades. La interconexión óptica respalda esa promesa porque agregar capacidad a un grupo de recursos no requiere rediseñar todo el tejido.Módulos ópticos enchufablesse puede actualizar o agregar gradualmente - de 400G a 800G a 1,6T - sin cambiar la planta de fibra subyacente.

Flexibilidad para cargas de trabajo heterogéneas

Cuando los recursos se agrupan y conectan a través de un tejido óptico de alto-rendimiento, los equipos de infraestructura pueden asignar recursos a las cargas de trabajo de forma dinámica en lugar de configurar las cargas de trabajo en torno a configuraciones de servidor fijas. Esa flexibilidad es especialmente valiosa en entornos donde los trabajos de capacitación de IA, la inferencia en tiempo real-, los procesos de análisis y las aplicaciones con mucho almacenamiento- coexisten y compiten por diferentes tipos de recursos.

Cómo se relaciona la interconexión óptica con la óptica empaquetada de CXL y Co-

CXL: la capa de protocolo para compartir memoria y recursos

CXL (Compute Express Link) y la interconexión óptica resuelven diferentes partes del problema de desagregación. CXL es un protocolo estándar abierto - construido en la capa física PCIe - que permite la caché-una comunicación coherente entre CPU, dispositivos de memoria y aceleradores. Define cómo se pueden agrupar y compartir recursos separados de manera eficiente a nivel de software y protocolo.

El Consorcio CXL, cuyos miembros incluyen Intel, AMD, NVIDIA, Samsung, Microsoft, Google y Meta, lanzó CXL 3.1 en noviembre de 2023 con soporte explícito paraconmutación multi-nivel y desagregación basada en-estructuramás allá del estante. CXL 3.0 introdujo compatibilidad con hasta 4096 nodos en una estructura unificada, lo que permite la agrupación de memoria a escala de rack-y potencialmente de clúster-.

La interconexión óptica es el transporte físico que puede transportar tráfico CXL (y otros protocolos) entre esos nodos distribuidos. Un equipo que evalúa la agrupación de memoria basada en CXL- y un equipo que evalúa la interconexión óptica a menudo trabajan en la misma iniciativa de desagregación desde diferentes ángulos - uno que aborda el protocolo y la lógica de intercambio de recursos-y el otro que aborda el transporte físico.

CXL over optical transport with co-packaged optics

Óptica co-empaquetada: acercando la óptica al chip

La óptica empaquetada (CPO) de co- va más allá al integrar motores ópticos directamente en el mismo sustrato de paquete que el conmutador ASIC o GPU, en lugar de depender de transceptores enchufables separados conectados mediante trazas eléctricas en un panel frontal. Esto elimina los caminos eléctricos más largos y que consumen más energía-del sistema.

En GTC 2025, NVIDIA anunció su primerplataformas de conmutación de fotónica de silicio co-empaquetadas(Quantum-X Photonics y Spectrum-X Photonics), que ofrece un ancho de banda de hasta 409,6 Tb/s con 512 puertos a 800 Gb/s. El director ejecutivo de NVIDIA, Jensen Huang, señaló que escalar a un millón de GPU utilizando transceptores enchufables convencionales consumiría aproximadamente 180 MW solo en potencia del transceptor - una cifra insostenible que CPO está diseñado para abordar.

El CPO no es algo que todos los equipos que evalúan la desagregación deban implementar hoy. Los módulos ópticos enchufables siguen siendo el factor de forma dominante para la mayoríacentro de datos fibra opticaimplementaciones y continuarán así al menos hasta finales de la década de 2020. Pero el CPO representa la dirección de la hoja de ruta óptica, y los equipos que planifican grandes grupos de IA o estructuras desagregadas de próxima-generación deberían seguir de cerca su madurez.

¿Cuándo tiene más sentido la interconexión óptica?

Entornos con uso intensivo de -aceleradores y IA

Los grupos de capacitación en IA se encuentran entre los casos de uso más sólidos para la interconexión óptica en un contexto desagregado. Estos sistemas generan un tráfico masivo de este-oeste a través de rutas de GPU-a-GPU y de GPU-a-memoria. A medida que el tamaño de los clústeres crece de cientos a miles de GPU, las demandas de alcance y ancho de banda superan rápidamente lo que el cobre puede soportar. En la arquitectura GB200 NVL72 de NVIDIA, por ejemplo, los costos de red (incluidos los transceptores ópticos) representan entre el 15% y el 18% del costo total del clúster, y los transceptores ópticos representan aproximadamente el 60% de ese costo de red. Los argumentos económicos y de rendimiento para optimizar la capa óptica son sustanciales.

Agrupación de memoria e infraestructura componible

Si su equipo está evaluando la agrupación de memoria basada en CXL-, la capa de transporte físico debe admitir esa separación sin agregar latencia inaceptable ni limitar la escala. CXL 3.1 apunta explícitamente a la desagregación de escala de tejido-más allá del rack, lo que significa que las rutas de interconexión abarcarán distancias más largas que los tradicionales buses de memoria intra-servidor. Los enlaces ópticos son la opción natural para esos caminos.

Entornos-de gran escala con necesidades de escalamiento desiguales

La interconexión óptica también tiene más sentido cuando la computación, la memoria y el almacenamiento necesitan escalar a diferentes velocidades. Si su capacidad informática crece 3 veces por año pero el almacenamiento crece 1,5 veces, una arquitectura desagregada le permite expandir cada grupo de forma independiente - y la interconexión óptica lo hace físicamente posible sin tener que rediseñar la planta de cableado cada vez.

Cuando NO tiene sentido

La interconexión óptica no es el punto de partida adecuado para todos los entornos. Si su centro de datos ejecuta principalmente cargas de trabajo equilibradas y de propósito general-en servidores convencionales, y su tráfico de bastidor-a-rack es modesto y está bien-atendido por la infraestructura de cobre existente, es posible que el costo y la complejidad de una primera estructura óptica-no estén justificados. De manera similar, si opera a una escala en la que unas pocas docenas de servidores satisfacen sus necesidades, la desagregación en sí misma puede introducir más complejidad operativa de la que ahorra. La arquitectura vale la pena cuando la escala, la heterogeneidad y el desequilibrio de recursos son reales y mensurables - no hipotéticos.

Qué evaluar antes de la implementación

1. Mapee su cuello de botella real

Comience con una pregunta clara: ¿cuál es la restricción vinculante? ¿Tiene alcance (las vías de cobre son demasiado cortas para el diseño de su bastidor)? ¿Densidad de ancho de banda (no hay suficiente rendimiento por cable para alimentar su clúster de GPU)? ¿Energía (los enlaces eléctricos consumen demasiada potencia a 400G+)? ¿Utilización de recursos (servidores sobreaprovisionados en un eje y deficientes en otro)? La interconexión óptica es más valiosa cuando el cuello de botella es físico y mensurable, no cuando se adopta como un gesto de modernización general.

2. Evalúe el costo total del sistema, no el costo del cable

Un error común es comparar el precio de un cable de cobre con el precio de uncable ópticoEn aislamiento. Esa comparación es engañosa. La comparación significativa incluye el consumo de energía, la sobrecarga térmica (y el costo de enfriamiento que genera), la densidad de puertos por unidad de rack, el alcance utilizable, la flexibilidad de actualización y el costo de los recursos inutilizados en la arquitectura más amplia. En muchos entornos desagregados a 400G y más, el costo total de propiedad de la fibra es menor que el del cobre cuando se tiene en cuenta el sistema completo.

3. Verifique la compatibilidad y la disponibilidad operativa

Evaluarpruebas de cables de fibra opticarequisitos, interoperabilidad de módulos, herramientas de monitoreo y la familiaridad operativa de su equipo con la fibra. Los módulos ópticos conectables (OSFP, QSFP-DD) están bien-estandarizados y cuentan con un amplio soporte, pero su equipo de operaciones debe sentirse cómodo con el manejo, la limpieza y la resolución de problemas de la fibra antes de implementarlos a escala. Considere comenzar con un dominio piloto donde pueda validar estos factores operativos.

4. Planifique la longevidad de la planta de fibra.

Una ventaja importante de la infraestructura de fibra es que la planta de fibra pasiva - los cables, los paneles de conexión y las vías - puede admitir varias generaciones de tecnología de transceptores. Un bien-diseñadoconectividad del centro de datosLa planta de fibra instalada hoy para 400G puede admitir actualizaciones de 800G y 1,6T intercambiando transceptores, sin necesidad de utilizar cables nuevos. Eso hace que la inversión inicial en fibra sea más defendible en un horizonte de planificación de 10 años.

Un camino práctico de adopción

Paso 1: identificar un dominio restringido.Busque el lugar donde el alcance del cobre, la potencia, la densidad del ancho de banda o el varamiento de recursos ya están generando un dolor mensurable. Podría tratarse de una expansión del clúster de GPU, un cuello de botella-de-rack en un entorno de análisis o una prueba piloto de agrupación de memoria.

Paso 2: Pilotar y validar.Implemente la interconexión óptica en ese dominio. Mida el comportamiento de latencia, el consumo de energía, la complejidad operativa y la economía de expansión en comparación con su base de referencia existente.

Paso 3: Ampliar según la evidencia.Utilice los datos piloto para construir el caso técnico y comercial para una adopción más amplia. La desagregación y la migración óptica rara vez se manejan mejor como un único gran proyecto-. La implementación por fases le permite aprender, adaptarse y generar confianza organizacional.

Lista de verificación de decisiones: ¿Es la interconexión óptica adecuada para su iniciativa de desagregación?

  • ¿Las distancias de enlace entre bastidor-a-rack o de habitación-a-sala exceden el alcance práctico del cobre a su velocidad objetivo?
  • ¿Está planeando implementar velocidades de enlace de 400G o más en el corto plazo?
  • ¿El consumo de energía procedente de la interconexión eléctrica se está convirtiendo en una parte importante del presupuesto energético de su centro de datos?
  • ¿Está evaluando la agrupación de memoria basada en CXL-, la infraestructura componible o la expansión del clúster de GPU?
  • ¿Es la inutilización de recursos (cómputo inactivo, memoria o almacenamiento bloqueado dentro de servidores fijos) un problema de costos mensurable?
  • ¿Su entorno necesita escalar la computación, la memoria y el almacenamiento a diferentes velocidades?

Si se aplican tres o más de estos, la interconexión óptica merece una evaluación seria como parte de su hoja de ruta de desagregación.

Preguntas frecuentes

¿Qué es la interconexión óptica en un centro de datos?

La interconexión óptica es una tecnología de transporte que utiliza señales luminosas sobrecables de fibra opticapara transportar datos entre dispositivos de red, servidores, conmutadores, sistemas de almacenamiento y grupos de recursos dentro y entre centros de datos. Ofrece mayor ancho de banda, mayor alcance y menor potencia por bit en comparación con el cobre a velocidades equivalentes -, lo que lo hace especialmente importante para arquitecturas desagregadas y orientadas a la IA-.

¿En qué se diferencia la interconexión óptica del CXL?

Operan en diferentes capas. La interconexión óptica es una tecnología de transporte físico - que mueve bits del punto A al punto B mediante luz. CXL es un protocolo estándar que define cómo las CPU, la memoria y los aceleradores se comunican de forma coherente. La interconexión óptica puede transportar tráfico CXL, pero CXL también se ejecuta a través de enlaces eléctricos para conexiones de corto-alcance. Los equipos suelen evaluar ambos simultáneamente porque la desagregación genera demanda de mejores protocolos (CXL) y mejor transporte físico (óptica).

¿Pueden coexistir el cobre y la óptica en un centro de datos desagregado?

Sí, y normalmente lo hacen. La mayoría de los entornos desagregados utilizan cobre para conexiones intra-de rack muy cortas (de menos de 3 a 5 metros), donde sigue siendo más simple y económico, y fibra óptica para conexiones de rack-a-rack, de fila-a-fila y rutas más largas donde las limitaciones de alcance, potencia y densidad del cobre se vuelven vinculantes. La decisión depende del alcance-, no de todo-o-nada.

¿Qué es la óptica co-empaquetada y la necesito ahora?

La óptica empaquetada (CPO) de co- integra motores ópticos directamente en el mismo paquete que el ASIC del conmutador o el procesador, eliminando la necesidad de transceptores conectables separados y reduciendo el consumo de energía y la latencia. NVIDIA y Broadcom están implementando CPO en plataformas de redes de IA de próxima-generación. La mayoría de los centros de datos no necesitan CPO hoy en día -módulos ópticos enchufablessigue siendo el estándar -, pero el CPO está en la hoja de ruta para la infraestructura de IA a gran-escala en el período 2026-2028.

¿Cuándo NO debo buscar la desagregación con interconexión óptica?

Si sus cargas de trabajo están bien-equilibradas entre computación, memoria y almacenamiento; su escala es modesta (unas pocas docenas de servidores); y su infraestructura de cobre existente maneja sus necesidades de ancho de banda actuales y-a corto plazo sin esfuerzo - la complejidad adicional de la desagregación y la migración óptica puede no justificar la inversión. Comience con el cuello de botella, no con la palabra de moda.

¿Qué tipos de fibra se utilizan en la interconexión óptica del centro de datos?

Fibra monomodo-se utiliza para enlaces de mayor-distancia-mayor velocidad (normalmente de bastidor-a-rack y más).Fibra multimodoes común para conexiones más cortas dentro del-centro de datos-de hasta unos pocos cientos de metros. La elección depende del alcance, la velocidad y el perfil de costos requeridos de cada enlace.

 

Envíeconsulta