AI算力大爆发,传统光纤“跑不动”了
来源:电子发烧友网原文链接

专属客服号

微信订阅号
大数据治理
全面提升数据价值
赋能业务提质增效
电子发烧友网报道(文/黄山明)AI时代下,算力中心正将分布式GPU集群变为主流,因此对网络提出了更低时延、更大带宽、更长跨数据中心距离的硬需求。但这时候发现,传统的光纤在物理极限上已经不够用了,不仅速度达不到,容量和能耗也令人头疼。 xa0 这时,一个在上个世纪末就被验证的技术,重新获得市场的关注,那就是空芯光纤。这款产品能够完美解决传统光纤所面临的问题,而唯一的问题,就是有点贵。 xa0 空芯光纤的优势 xa0 如今在万卡集群
电子发烧友网报道(文/黄山明)
AI
时代下,算力
中心
正将分布式
GPU
集群变为主流,因此对网络提出了更低时延、更大带宽、更长跨数据中心距离的硬需求。但这时候发现,传统的光纤在物理极限上已经不够用了,不仅速度达不到,容量和能耗也令人头疼。
这时,一个在上个世纪末就被验证的技术,重新获得市场的关注,那就是空芯光纤。这款产品能够完美解决传统光纤所面临的问题,而唯一的问题,就是有点贵。
空芯光纤的优势
如今在万卡集群训练中,成千上万个GPU需要频繁同步数据。如果网络时延高,快的显卡要等慢的显卡,导致整体算力利用率大幅下降。
而传统光纤,光是在玻璃中进行传播,其速度约为真空中光速的三分之二。这意味着
信号
每传输1000公里,就会比在空气中多花约1.6毫秒。
在上世纪末,英国南安普敦大学的Philip Russell等学者开始构想,既然光在空气中传播更快、损耗更低,为何不能制造一种“空心”的光纤。后续,一篇名为《空芯单模光子带隙光纤》发表于《Science》中,首次在光子晶体光纤中实现空心、单模、光子带隙导光,证明光可以在空气芯中被稳定限制并传播。
不过在后续的研究中发现,这种空芯光子带隙光纤(HCPBGF)技术,其表面散射损耗很高,很难把损耗压到1dB/km以下,限制了
通信
应用。
直到近几年,随着云厂商与AI算力入局,发现空芯光纤由于可以让光在空气/真空中传播,其传输速度比传统光纤提升约47%,时延降低30%-40%。
这对于跨数据中心,例如东数西算,或者跨国算力调度来说,节省的几毫秒可能意味着模型训练周期缩短几天,或者高频交易多赚数百万美元。
并且传统光纤中,光在实心玻璃中传输时,光强越高,玻璃介质会产生非线性效应,会导致信号畸变、串扰。为了避开这个问题,传统光纤不能无限增加发射功率或信道密度,限制了单根光纤的总容量。
空芯光纤就没有这个困扰,由于99%的光在空气中传输,空气的非线性效应比玻璃低1000倍以上。这意味着单根光纤的传输容量可以轻松突破100Tbps甚至更高,轻松应对未来800G、1.6T光模块的普及,避免网络拥堵。
此外,传统光纤由于损耗和非线性限制,长距离传输需要更多的中继
放大器
,这些设备不仅耗电,还产生大量的热量。
但空芯光纤随着这几年技术的发展,其损耗已经可以做到0.1dB/km以下,超越传统石英光纤的理论极限,传输同样距离需要的放大器更少,信号处理更简单,
DSP
的负担减轻,进一步降低功耗,进一步降低成本。
并且玻璃在强辐射环境下会产生色心效应而变黑,导致损耗剧增甚至失效,且玻璃的热膨胀系数较大。而空芯光纤主要介质是空气,对辐射不敏感,耐高温性能更好,除了AI,还适用于卫星互联网、深空探测、核工业监控等极端环境。
2024年Igni
te
大会上,微软宣布计划在未来24个月内部署约15000km空芯光纤,用于AI和数据中心互联,直接将空芯光纤从小众高端推向AI基础设施明星赛道。
空芯光纤这么好,为何不大规模采用?
从全球范围来看,随着
AI技术
的愈发普及,也在加速对空芯光纤的工程化探索。但目前来看,空芯光纤的量产还面临不少技术问题,这些技术并非是生产,而是如何高良率、低成本的制造出来。
空芯光纤在制造时,需要在光纤内部制造纳米级的空气孔阵列,且拉伸过程中不能变形,良品率极低。目前能够做到的厂商非常少,例如OFS、被微软收购的Lumenisity、Relativity Networks等,国内的长飞、亨通等。
从
机械
强度来看,空芯光纤典型纤芯直径200-250µm,包层结构复杂,对微弯非常敏感,布放、盘纤、余长处理都要特别小心。并且空芯光纤与普通单模光纤模场直径差异大,存在严重模场失配,直接熔接损耗大,需要专用的熔接程序和模场适配器。由于背向散射信号弱、非线性小,普通OTDR不完全适用,需要专用测试方案,否则很难精确定位断点和事件点,这些都抬高了施工和运维的成本。
即便能够生产,目前的年产量也就在数万公里级别,根本满足不了全球大规模建设需求。而传统光纤可以直接采用一根实心玻璃棒拉丝,结构简单,工艺成熟,单根预制棒可拉上百公里,因此产能可以达到千万公里级。
制造工艺困难直接导致成本高昂,有分析指出,当前空芯光纤量产成本约是传统G.652光纤的5-8倍,要具备大规模竞争力,至少要降到2倍以内。
再一个,对于运营商而言,空芯光纤的空气芯中,水汽、CO₂等气体会对特定波长产生吸收损耗,需要控制气体成分和封装工艺,目前尚未有一个持续运营20年以上的可靠案例可以参考。
更重要的是,目前的国际标准,例如ITUT G.652/G.654.E,主要针对实芯单模光纤,参数体系、测试方法并不直接适用于空芯光纤。没有标准化组件、测试流程、部署规范,规模部署风险很大。
因此现在真正愿意买单的场景还有限,除了微软计划2年内部署1.5万公里空芯光纤,用于AI大模型互联外。AWS也已经在城域数据中心互联中部署空芯光纤,用以扩展数据中心选择范围。
国内的中天科技率先实现O波段反谐振空芯光纤在AI数据中心内部的规模化部署,并已进入中国电信现网试点。并且中天科技还与阿联酋电信运营商在中东地区完成空芯光纤技术试点,显著降低传输时延。
此外,在金融领域,例如2025年中国移动在粤港澳大湾区开通首条完全自主反谐振空芯光纤商用线路,是我国首条完全自主知识产权的反谐振空芯光纤商用线路,专门服务于深港跨境金融业务,随后中国电信与中国联通也在同年跟进,开通空芯光纤专线。
其采用的产品由长飞光纤提供,其最新的空芯光纤最低衰减达0.04dB/km,时延较传统实芯光纤降低约31%,传输速度提升约47%。长飞明确指出,目标就是支撑AI算力、6G和超大数据中心的传输需求。
烽火通信也发布了新一代超低损空芯光纤,最低衰减约0.06dB/km,时延降低约31%,专门面向AI智算中心海量数据高速交互需求。
总结
随着AI的发展速度超过传统光纤物理极限的承载能力,为了迎接算力爆发,必须进行技术升级,而空芯光纤被视作替代传统光纤的技术路线。完美解决传统光纤的传输速率限制,还能解决信号干扰、能耗等问题,尽管制造困难,成本高昂。
但随着AI算力需求旺盛,当前在超大规模智算中心的跨楼宇/跨园区互联场景,空芯光纤有望成为首选方案。而在金融领域,对于新建的跨城/跨境金融专线,空芯光纤将毫无悬念成为首选方案,传统光纤在顶级高频交易场景将逐步被边缘化。
光纤
AI
转载说明:本文系转载内容,版权归原作者及原出处所有。转载目的在于传递更多行业信息,文章观点仅代表原作者本人,与本平台立场无关。若涉及作品版权问题,请原作者或相关权利人及时与本平台联系,我们将在第一时间核实后移除相关内容。

