Høyhastighets optisk sammenkobling: Datasenterløsninger

Apr 27, 2026|

I forrige kvartal hadde vi en kunde som sendte tilbake førti 400G DR4-moduler som gjorde krav på tilfeldige koblingsklaffer på Arista 7060X5-svitsjene. Før vi i det hele tatt åpnet RMA-papirene, stilte testingeniøren vår ett spørsmål: inspiserte duMPO-kontakterfør installasjon? Det hadde de ikke. Vi sendte modulene gjennom vår fulle regresjon, øyediagrammer rene, BER under 1E-13 over alle fire baner,DDM-avlesninger nominelle. Deretter ba vi dem sende bilder av kabelenden-under et fibermikroskop. Hver enkelt kobling hadde partikkelforurensning. Førti moduler, null feil. Problemet var støv.

 

Vi ser en versjon av dette hver måned. Høyhastighets optiske sammenkoblinger i alle skalaer treffer den samme veggen, og tallene støtter det: et sted mellom 65 % og 70 % av alle 400G- og 800G-koblingsfeil spores tilbake til kontaktforurensning, ikke til transceiverfeil. (IEEE 802.3-feltdata via AscentOptics) Vi tar dette opp først fordi det rammer inn hvordan vi tenker om hele sammenkoblingsvedtaket. Modulen er nesten aldri det svakeste leddet. Det fysiske laget rundt det er.

Microscopic view of an MPO fiber optic connector end-face showing severe dust and particulate contamination on the four precision glass cores of a 400G module, illustrating the number one cause of link failure.

 

Trafikkmønsteret ditt bestemmer din optiske sammenkoblingsarkitektur

 

Alle starter med delenummeret.QSFP-DD eller OSFP, SR eller DR, multimodus eller enkelt-modus. Vi gjør det også. Men distribusjonene som gikk bra for kundene våre startet alle et annet sted: hvordan ser trafikken egentlig ut?

Stor-AI-opplæring genererer alt-til-all GPU-kommunikasjon som viser seg å være overraskende forutsigbar over tidsskalaer fra minutter til timer. Google utnytter dette med optiske kretsbrytere i Jupiter-nettverket, og rekonfigurerer fysiske lysbaner mellom stativer i stedet for å bytte pakker. Deres publiserte resultater fra et tiår med produksjonsbruk: 41 % strømreduksjon, 30 % lavere capex og 50 ganger forbedring i stoffets oppetid sammenlignet med deres tidligere Clos-arkitektur. (Google SIGCOMM'22) Disse tallene er reelle, men de tilhører et selskap som brukte et sted mellom $500 millioner og $1 milliard på OCS-infrastruktur over fem år. Vi har hatt en håndfull mellomstore-kunder som har bedt oss om å evaluere OCS-gjennomførbarhet for miljøene deres. I alle tilfeller, når de kjørte tallene på sub-500 nodeskala, oppveide kapitalkravene rekonfigureringsfordelene, og de holdt seg med konvensjonelle ryggradsblader ved bruk av pluggbare moduler.

Inferens snur ligningen. Trafikken er sprengt og uforutsigbar på strømningsnivået, og latenstidstoleransen er nær null. Du kan ikke rekonfigurere optiske baner på-forespørselsbasis. Det du trenger er et konsekvent overprovisionert stoff med deterministisk latens, som presser deg mot pluggbare sendere/mottakere i en rygg-bladtopologi der hver kobling alltid lyser. Vi selger moduler inn i begge scenariene, og ingeniørsamtalene er helt forskjellige. Kjøpere av treningsklynge ønsker å vite om samlet båndbredde per rack og kraft per bit. Inferenskjøpere spør om halelatens og hva som skjer når en kobling går ned.

 

Conceptual architectural diagram of a data center network topology comparing a custom Optical Circuit Switch (OCS) fabric for long-running AI training jobs versus a standard non-blocking Spine-Leaf topology for bursty inference workloads.

 

For tradisjonelle bedrifts- og colo-miljøer under hyperskala, dominerer kostnaden per port, og bakoverkompatibilitet med eksisterende fiberanlegg betyr mer enn råbåndbreddetetthet. Vi har testet vår400G QSFP-DD-moduler på tvers av 14 bytteplattformerinkludert Cisco Nexus 93600CD, Arista 7060X5 og Juniper QFX5220. I disse miljøene er ikke hastigheten den dominerende bekymringen. Det er om modulen blir gjenkjent av bryterfastvaren uten manuelle overstyringskommandoer.

 

800G Dead Zone som fanger ingeniører på vakt

 

Ved 400G var det å velge en sammenkobling en to-prosess: mål avstanden, velg kobber eller fiber. Passiv DAC dekket 3 til 5 meter komfortabelt. 800G brøt det. Hver bane kjører 112G PAM4. Kobbertapet ved disse frekvensene dobles omtrent mot 400G, og resultatet er et hardt tak på rundt 2 meter for passiv kabel.

 

High-speed cable comparison showing an Active Electrical Cable (AEC) vs a standard Direct Attach Copper (DAC) bundle. The AEC uses internal retimers to extend the 800G signal reach to 7 meters at the cost of slight latency overhead.

 

Vi lærte dette på den dyre måten. En tidlig kunde bestilte vår800G passive DAC-enheteri 3-meters lengder basert på deres 400G rack-layout. Linktrening mislyktes på over 60 % av portene. Kobberet var ikke defekt; fysikken ville bare ikke tillate det. De byttet til AEC for løpene på 3 til 5 meter og pluggbare optiske moduler for alt utover, og utplasseringen stabiliserte seg i løpet av en uke. Siden den gang har vi sluttet å ta imot bestillinger for passiv 800G DAC over 2,5 meter og lagt til en distribusjonsavstandsinformasjon i bestillingsbekreftelsesprosessen vår.

 

AEC eier nå gapet på 3 til 7 meter. Digitale retimere regenererer signalet elektrisk uten optisk konvertering, noe som holder kostnadene nede, men legger til ventetid. KP4 FEC alene legger 50 til 100 nanosekunder på hvert hopp ved 800G, og retimeren stabler mer på toppen. Vi målte total ekstra latens ved 85 til 110 ns på AEC-enhetene vi for øyeblikket sender. For rygg{10}}bladstoffkoblinger er denne overhead usynlig i applikasjonsytelsen. For tett koblede GPU-klynger er det en annen historie. Basert på profileringsdata fra tre kundedistribusjoner som kjører H100-noder, hvis treningsjobbens kommunikasjonsoverhead allerede er over 15 %, begynner de ekstra hundre nanosekunder per hopp over flere svitsjnivåer å bli sammensatt i NCCL AllReduce-operasjoner.

 

Utover 7 meter er pluggbare optiske transceivere for 800G den eneste levedyktige veien. De fysiske lagkravene strammes betraktelig her. Slutt-til-budsjetter for innsettingstap under IEEE 802.3ck lander under 1,5 dB for de fleste 800G-rekkeviddeklasser, og hver tilkoblet MPO-tilkobling må holde seg under 0,35 dB. Vi har sett installert fiber som har bestått sertifisering ved 100G viser PMD-verdier to til tre ganger høyere enn klassifisert spesifikasjon etter flere år med kompresjon i kabelbakker, i samsvar med det Junipers nettverksforskningsteam rapporterte i 2023. Vår standardanbefaling før enhver 800G-transceiver-distribusjon: kjør OTDR- og PMD-karakterisering på hvert eksisterende fibersegment. Ikke en prøve. Hvert segment. Kostnaden for å-retrekke to trunkkabler er en brøkdel av kostnadene ved å feilsøke intermitterende koblingsflapper i seks måneder.

 

CPO vs LPO vs Pluggbar: Hvor hver teknologi faktisk står i 2026

 

Sam-pakket optikk vil endre hvordan bytteinfrastrukturen for datasenter er bygget. Vi sier dette som en pluggbar modulprodusent, så ta vårt syn som informert i stedet for nøytralt.

 

På OFC 2026 viste pålitelighetsdata på CPO-prototyper feilrater potensielt lavere enn tradisjonelle pluggbare moduler. Uten mekaniske innsettingssykluser eller synlige kontaktoverflater, vil de dominerende feilmodusene til pluggbare moduler ganske enkelt ikke gjelde. Broadcoms Bailly 51.2T CPO-svitsjplattform demonstrerte omtrent 70 % lavere strømforbruk på det optiske laget sammenlignet med tilsvarende pluggbare konfigurasjoner. (DataMIntelligence Optical Interconnect-rapport) NVIDIA viste CPO-integrerte brytere ved GTC 2026-målrettingsoppskalering-i 2027 til 2028-vinduet.

 

Vår posisjon: hvis du ikke er en hyperskaler som bygger tilpasset brytersilisium, er pluggbar optikk ditt eneste distribusjonsalternativ gjennom minst 2027. CPO trenger bordarkitekturer som de fleste bryterleverandører ikke har levert ennå, koblingsstandarder som ikke er ferdigstilt, og en helt ny spillebok for håndtering av feil du ikke kan fikse ved å trekke en modul. Økosystemet for generelle bedriftsanskaffelser eksisterer ikke ennå. Vi har hatt to potensielle kunder det siste året som har forsinket sine 400G-til-800G-oppgraderinger i påvente av CPO. Begge kom til slutt tilbake og la inn pluggbare bestillinger etter at båndbreddehullene deres ble produksjonshendelser. Vi skrev om den tekniske begrunnelsen for denne stillingen mer detaljert på vårpluggbar transceiver-arkitekturanalyse.

 

LPO sitter i en annen plass. Hvis du fjerner DSP-en fra modulen, kuttes den mest strømkrevende komponenten-, som er ansvarlig for opptil halvparten av modulens totale strømforbruk. Resultatet er 30 til 50 % lavere forbruk og opptil 15 nanosekunder mindre ventetid. Vi begynte å presentere LPO-spesifikke tilbudsforespørseler på slutten av 2025. Tre av de fire kom fra kunder som bygde enkelt-leverandør GPU-klynger på NVIDIA Spectrum-X. Ingen opererte stoffer fra flere{12}}leverandører, som forteller deg alt om hvor LPO jobber i dag. Hvis nettverket ditt blander bytteleverandører, er ikke LPO kompatibel med miljøet ditt. Hvis du kjører en enkelt-leverandør AI-klynge, kan det være den smarteste oppgraderingen som er tilgjengelig, og vi forventer å ha LPO-klare moduler i kvalifisering innen midten av 2027.

Hva 800G termiske marginer betyr for modulvalg

 

Den termiske matematikken ved 800G fanger folk på vakt. Høyhastighets optisk sammenkoblingskrafttetthet ved denne generasjonen skaper problemer som rett og slett ikke eksisterte ved 400G. En 64-ports svitsj fullastet med 800G-moduler på 16W hver trekker omtrent 1kW i transceiverkraft alene, før svitsjen ASICs egne 400 til 500W. Det er 1,4 til 1,5 kW per bryter. Åtte brytere i et rygglag gir deg over 11 kW fra nettverksutstyr alene, i stativer som ofte ble klargjort for totalt 8 til 10 kW.

 

Juniper Networks advarer eksplisitt om at tredjepartsmoduler- med høyt strømforbruk, spesielt koherente ZR- og ZR+-typer, kan forårsake termisk skade på vertsutstyr, med ansvar som faller på brukeren. (Juniper Networks 800G Optics FAQ) Det er ikke et argument mot tredjeparts optiske moduler.- Det er et argument for å vite nøyaktig hva du kobler til. I vår termisk sykling-kvalifisering tester vi hver 800G-moduldesign ved vedvarende 85 graders overgangstemperatur i 2000 timer og sporer laserbiasstrømdrift som den primære aldringsindikatoren. Enheter som driver over 38 mA blir trukket fra produksjonslinjen. Ved 800G tettheter bestemmer forskjellen mellom en modul som trekker 14W og en tegning 18W om et stativ forblir innenfor termisk konvolutt eller utløser avstengningsalarmer klokken 02.00. Å få spesifikasjonen feil har alltid vært irriterende. På disse effektnivåene er det dyrt.

Thermal heatmap of a high-density switch rack illustrating extreme heat concentration in the transceiver cage area where 64 modules drawing 16W each generate significant thermal load, nearing cooling capacity limits.

 

 

Vi sender pluggbare moduler fra 1G SFP til 800G OSFP, og vi tester mot store bryterplattformer. Vi fører oversikt over hva som fungerer og hva som ikke fungerer. Hvis du trenger en kompatibilitetssjekk mot et spesifikt brytermiljø, eller ønsker termisk og kraft-spesifikasjoner for 800G-rack med høy-tetthet, kjører ingeniørene våre disse samtalene hver uke. Vår800G OSFP og QSFP-DD800 transceiver sidehar spesifikasjoner, rekkevidde-klassealternativer og eksempler på forespørselsskjemaer for hver modul vi sender.

Sende bookingforespørsel