英偉達(dá),開啟硅光新紀(jì)元
如果您希望可以時常見面,歡迎標(biāo)星收藏哦~
隨著人工智能計算的快速發(fā)展,數(shù)據(jù)中心網(wǎng)絡(luò)基礎(chǔ)設(shè)施面臨著日益增長的需求。在2025年3月18日的GTC2025會議上,NVIDIA公布了其開創(chuàng)性的NVIDIA光子學(xué)硅光子技術(shù)。通過采用共封裝光學(xué)來取代傳統(tǒng)可插拔的光學(xué)收發(fā)器,這一創(chuàng)新使光纖可以直接連接到交換機,預(yù)計可將數(shù)據(jù)中心的電力消耗減少40兆瓦。該技術(shù)同時提高了人工智能計算集群的網(wǎng)絡(luò)傳輸效率,為下一代大規(guī)模人工智能數(shù)據(jù)中心奠定了基礎(chǔ)。
基于這一創(chuàng)新,NVIDIA推出了Spectrum-X和Quantum-X硅光子網(wǎng)絡(luò)交換機,將電子電路與光通信技術(shù)深度集成。這些解決方案使AI工廠能夠跨地區(qū)互聯(lián)數(shù)百萬個GPU集群,同時降低能源消耗和運營費用。
-
Spectrum-X以太網(wǎng)平臺:專為多租戶、超大規(guī)模人工智能工廠設(shè)計,提供比傳統(tǒng)以太網(wǎng)架構(gòu)高1.6倍的帶寬密度,支持世界上最先進(jìn)的超級計算基礎(chǔ)設(shè)施。
-
Quantum-X光子學(xué)InfiniBand平臺:利用200GbpsSerDes技術(shù),它擁有該平臺將144x800Gbps端口,配備液體冷卻的硅光子學(xué)塊。與前幾代相比,AI計算速度提高了一倍,實現(xiàn)了5倍的更大可擴展性。
Spectrum-X
NVIDIA Spectrum-X光子學(xué)交換機提供多種配置,包括 128 個800 Gb/s 端口或512個200 Gb/s端口,總帶寬高達(dá) 100Tb/s,以及512個800 Gb/s端囗或2048個200Gb/s 端口,總吞吐量高達(dá) 400 Tb/s。
Spectrum-XCPO采用多芯片設(shè)計。其以太網(wǎng)交換機ASIC具有單芯片包處理引擎,周圍有八個SerDes芯片和四個額外的芯片在角落。Spectrum-XCPO芯片的每邊包括九個端口,總計36個端口,以800 Gb/s的速度運行。
Quantum-X
這款115.2 Tb/s Quantum-X光子交換器包含2個CPO模塊。每個封裝模塊由一個量子X800 ASIC和6個光學(xué)組件組成,總共包含18個硅光子引擎。量子X800 ASIC提供28.8Tb/s的吞吐量,并使用臺積電的4N工藝,集成了1070億個晶體管。在每個CPO模塊中,直接連接的光學(xué)組件具有3個硅光子引擎和3個緊湊的可插拔連接器,實現(xiàn)4.8 Tb/s的吞吐能力。每個硅光子引擎都采用200 Gb/s微環(huán)調(diào)制器,將功耗降低3.5倍。
在外部連接方面,Quantum-X光子交換器具有144個單模光纖MPO連接器。每個外部光源配備有八個激光器(200 mWCW-DFB),并提供自動溫度跟蹤以及穩(wěn)定的波長和功率輸出。
總的來說,一個Quantum-X光子學(xué)交換機集成了2個CPO模塊、18個外部光源和144個MPO連接器,總計4460億個晶體管,并提供115 Tb/s的吞吐量。
InfiniBand CPO將于2025年下半年首先推出,而以太網(wǎng)CPO將于2026年下半年推出。請注意,CPO將是可選的-NVIDIA將繼續(xù)提供具有可插拔模塊的交換機系統(tǒng)。
CPO 技術(shù)
CPO是高速網(wǎng)絡(luò)集群的核心組件,特別是對于需要低延遲和高帶寬連接的人工智能集群。與傳統(tǒng)基于DSP的可插拔光模塊相比,CPO具有顯著優(yōu)勢。它通過將ASIC和光學(xué)組件-嵌入DSP功能直接集成在ASIC中,消除了對單獨DSP芯片的需求。這種創(chuàng)新的封裝方法極大地提高了整體模塊性能,同時顯著降低了數(shù)據(jù)中心的功耗,而效率是數(shù)據(jù)中心的關(guān)鍵。此外,由于AI集群需要超高的帶寬,CPO可以最小化與信號轉(zhuǎn)換相關(guān)的延遲和功率損耗。博通和思科都聲稱,在一臺配備64個800GbE端口的51.2T交換機中,CPO可以比標(biāo)準(zhǔn)的可插拔光模塊降低30%的功耗。
NVIDIA的CPO基于新的微環(huán)調(diào)制器,以提高能效。博通的CPO提供了50%的功耗降低(通過去除DSP),但它是基于馬赫-曾德爾調(diào)制器(MZM)-光收發(fā)器的標(biāo)準(zhǔn)組件。
下圖說明了NVIDIA CPO中涉及的各種組件。它從臺積電制造的電子和光子集成電路開始,并組裝在一個3D堆棧中。臺積電的緊湊型通用光子引擎(COUPE)技術(shù)包含一個微透鏡,用于表面耦合到光纖陣列。在量子-X光子平臺中,這些光引擎組件通過中間件連接到開關(guān)ASIC。NVIDIA的CPO合作伙伴包括Browave、Corning、Fabrinet、富士康、Lumentum、Senko、SPlL、住友商事、TFC和臺積電。
然而,CPO也面臨著一些挑戰(zhàn)。CPO模塊的固定配置可能帶來限制,平衡可靠性與可替換性仍然是一個問題。在傳統(tǒng)可插拔光模塊系統(tǒng)中,光鏈路故障只需要移除和更換故障模塊。相比之下,CPO系統(tǒng)中的故障需要更換整個系統(tǒng)。CPO光學(xué)引擎中使用的硅光子器件提供的可靠性與其他硅基組件相當(dāng),只有ELSFPS可能面臨光學(xué)故障問題。幸運的是,這些設(shè)備支持現(xiàn)場更換。
雖然CPO技術(shù)提供了顯著的優(yōu)勢,如降低功耗和簡化部署,但可插拔的光塊仍然是市場的主流。它們的靈活性和成熟的標(biāo)準(zhǔn)化使其繼續(xù)成為數(shù)據(jù)中心的首選。
NADDOD 提供高速可插拔的光學(xué)解決方案,涵蓋200G、400G、800G和前沿的1.6T 硅光子模塊。經(jīng)過大規(guī)模集群部署驗證,NADDOD 模塊表現(xiàn)出卓越的性能、穩(wěn)定性和兼容性,確保 AI 計算集群的可靠運行。同時,我們行業(yè)領(lǐng)先的制造設(shè)施和強大的生產(chǎn)管理系統(tǒng)能夠無縫支持 InfiniBand/RoCE AI基礎(chǔ)設(shè)施,確保高質(zhì)量產(chǎn)品和大規(guī)模快速交付。
總結(jié)
英偉達(dá)推出其1.6Tb/s硅光子CPO交換機,標(biāo)志著交換和半導(dǎo)體市場的轉(zhuǎn)型階段。在市場需求激增和技術(shù)突破的推動下,CPO正在引領(lǐng)整個行業(yè)的顛覆。隨著技術(shù)的成熟和普及,CPO交換領(lǐng)域有望加速增長,為下一代AI基礎(chǔ)設(shè)施解鎖前所未有的可擴展性。
CPO是人工智能行業(yè)漫長旅程的第一步。在短期內(nèi),CPO可能會在特定場景下進(jìn)行試點,例如超大規(guī)模集群,而可插拔模塊仍將是主流。然而,從長遠(yuǎn)來看,隨著對高帶寬傳輸?shù)男枨筮_(dá)到高頻信號傳輸?shù)臉O限,CPO技術(shù)將獲得動力。未來,可能會出現(xiàn)混合的“CPO+可插拔”架構(gòu),根據(jù)應(yīng)用需求提供靈活的選擇。
半導(dǎo)體精品公眾號推薦
專注半導(dǎo)體領(lǐng)域更多原創(chuàng)內(nèi)容
關(guān)注全球半導(dǎo)體產(chǎn)業(yè)動向與趨勢
今天是《半導(dǎo)體行業(yè)觀察》為您分享的第4071期內(nèi)容,歡迎關(guān)注。
『半導(dǎo)體第一垂直媒體』
實時 專業(yè) 原創(chuàng) 深度
公眾號ID:icbank
喜歡我們的內(nèi)容就點“在看”分享給小伙伴哦
聲明:本網(wǎng)轉(zhuǎn)發(fā)此文章,旨在為讀者提供更多信息資訊,所涉內(nèi)容不構(gòu)成投資、消費建議。文章事實如有疑問,請與有關(guān)方核實,文章觀點非本網(wǎng)觀點,僅供讀者參考。