骰宝
mg游戏 中国“光策划芯片”降维打击英伟达GPU? 团队回复
发布日期:2026-03-09 13:24    点击次数:141

mg游戏 中国“光策划芯片”降维打击英伟达GPU? 团队回复

转自:中国科学报

不久前,上海交通大学集成电路学院张文军院士团队的“全光策划芯片”最新后果在《科学》(Science)杂志在线发表并得到剪辑部Highlight要点推选。在这篇题为《大限度智能语义视觉生玉成光芯片》的论文中,接洽团队建议的全光大限度语义生成芯片“LightGen”,被合计是一把破解东说念主工智能(AI)对算力黑洞般需求的钥匙。它在某些特定任务中的策划速率、能效,比顶尖数字芯片(如英伟达A100芯片)逾越至少2个数目级。

关于该后果,上海交通大学集成电路官网给予了高度评价:LightGen为新一代算力芯片助力前沿东说念主工智能“设备了新旅途”,也为探索更高速、更高能效的生成式智能策划“提供了新的接洽标的”。

泰斗期刊背书、官方认证,媒体也纷纷赐与关注和报说念,“降维打击”“换说念超车”等论调甚嚣尘上。联系词,关于这么一款尚存在于论文中的芯片,它能否达到东说念主们对“下一代算力芯片”的预期?它在特定任务中所展现出来的对顶尖数字芯片的“降维打击”,能否确实达成?

为此,论文作家、上海交通大学教会翟广涛近日收受《中国科学报》专访,并对有关疑问作出了回复。

光策划芯片为何难“挑大梁”?有三大瓶颈

{jz:field.toptypename/}

《中国科学报》:请用庸俗的话,解释一下光策划芯片与电子芯片有何不同?

翟广涛:

不错从策划风物的各异来长入。电子芯片的信息载体是电信号,主要靠晶体管开关注换来策划,限度越大就越容易被功耗、蔓延、发烧这些现实问题“拖住”;光策划是把信息编码到光上,通过光场传播把大齐运算并行地策划出来,在速率和能耗上有很强的潜在上风。不错类比为,电芯片就像是铜线电话传音问,以电信号为载体;而光策划芯片则像光纤宽带,速率更快、能耗更低。

举个例子,咱们的眼睛不错一样长入为陋劣的光策划:它不错将物体的“像”从一个位置成像到视网膜上。咱们研发的光策划芯片则比这复杂得多,通过光的振幅、相位、频率、偏振等搭载信息,完成更复杂任务,如大限度AI和端侧高速AI策划等。

《中国科学报》:为什么光芯片在AI策划任务中,比较传统电子芯片有更大上风?

翟广涛:

领先,光子的物理特色,天生适配AI对策划“高速+低耗”的需求。光子传播速率是光速(约3×10?m/s),而电子在芯片中的移动速率仅为光速的千分之一。AI策划(尤其是生成任务)需要大齐数据的传输与运算,光子的高速传播能大幅减少“数据搬运蔓延”。同期,电子在导体中畅通时会因电阻而产热,这是电子芯片能耗高的一大进攻原因(比如GPU运行时需要大型散热修复);而光子传播过程中险些窝囊量损耗。

其次,AI模子(尤其是生成式AI)的中枢是“大限度并走时算”,比如处理512×512像素图像时,需要同期对几十万级像素点进行特征索要、矩阵运算。电子芯片受“冯?诺依曼架构”狂妄,数据需在存储器和运算器之间往还传输,并行度往往被硬件结构制约,而光子不错“多通说念沉寂传播”,可减少分批次运算,光策划芯片的并行性相较电子芯片更具潜在上风。

同期,光策划芯片的上风,试验是“光子的物理特色与AI策划的中枢需求高度契合”——AI需要“高速并行、呆板耗、高算力密度”,而光子的“光速传播、极低损耗、自然并行”特色,赶巧精确匹配这些需求。传统电子芯片则受限于“电信号传输蔓延、能耗与发烧管理、集成极限”,难以在这些维度龙套。这亦然为什么光策划芯片能在AI策划中展现出数目级的性能上风的原因。

《中国科学报》:既然光芯片在速率和能耗方面有自然上风,为何往时它没能在策划芯片中“挑大梁”?

翟广涛:

这几年大模子和生成模子发展很快。模子限度显赫增长后,算力和能耗需求带来的压力就愈加彰着。传统芯片架构的性能增长速率,跟这种需求之间出现了更大的缺口,是以人人运转关注新的策划范式。

在这个大配景下,光策划等新架构也会被反复说起。联系词,传统全光策划芯片更多停留在小限度、分类任务;一朝引入光电级联或复用,速率会被减弱,放到复杂生成任务上,就更难体现端到端的速率和能效上风。

换言之,此前光策划芯片之是以未被大限度运用、没能成为核默算力芯片,试验是三大瓶颈的重叠——集成限度撑不起算力、维度变化适配不了任务、老练算法对接不上需求。这三大问题让光子策划的“高速低耗”上风只可停留在实验室的省略任务中,无法回荡为救助大限度AI的试验算力,最终只可“旯旮化”,难以“挑大梁”。

回复“突出英伟达”质疑:“长入外界的审慎魄力”

《中国科学报》:你们团队的这项接洽,针对你上述提到的光策划芯片的瓶颈,有哪些龙套?

翟广涛:

论文的中枢亮点等于同期龙套了界限内三个公认的瓶颈:百万级光学神经元集成、全光维度转机、无真值光芯片老练算法。

咱们采纳高度集成的衍射超名义本领,通过对多层超名义进行纳米级深度刻蚀的结构假想以实现对光的精确调控,生效在芯片中集成了数百万个光子神经元,为生成任务需要重大的神经元限度问题提供了决策。

同期,团队还研发出一种专为生成式光子策划系统量身打造的老练算法,mg试玩不依赖预界说真值的老练算法,处置了生成式光子芯片如何老练的问题。

《中国科学报》:论文中提到,LightGen在端到端的策划速率和能效上远超英伟达A100图形处理器。有不雅点合计,将尚未产物化的光子芯片与闇练的GPU横向对比预想有限,且咫尺的优厚性更多体当今表面层面,还未能在产业中解说我方。你和团队对此作何评价?

翟广涛:

关于这类商讨,咱们长入其严慎魄力。光子芯片仍处于从实验考据走向更闇练体系的阶段,与闇练GPU进行横向比较时,外界更审慎是正常的。

咱们论文采纳的是端到端耗时与耗能的径直测量口径:在生成质料与前沿电子神经网罗附进的同期,比较系统层面的速率与能效。需要强调的是,大限度生成式任务本人往往较慢,对端到端时延与能耗尤其敏锐,许多真实场景也确乎会受这两点制约,因此下一代算力芯片能否灵验救助这类任务具有现实预想。

从这个角度看,论文扫尾是在端到端口径下,展示了全光道路在大限度生成式任务上的可行性与后劲;同期也诠释了几许关节难点龙套关于全光片上实现大限度生成式网罗的进攻预想,为下一代算力芯单方面向生成式智能策划提供了一条可抓续探索的旅途。

《中国科学报》:连年来,光子芯片界限往往给东说念主“雷声大雨点小”的印象,对此你如何看?

翟广涛:

{jz:field.toptypename/}

前沿标的在从见解走到可考据、再到可用体系的过程中,外界会有“雷声大雨点小”的担忧,这个咱们长入。光子芯片这条途经去往往被反复商讨,主淌若因为许多全光策划芯片停留在小限度、分类任务上。濒临复杂的任务,光电级联或复用带来的速率能效上风赔本会更彰着,与大限度生成式任务还有距离。

而像LightGen这种前瞻性的职责,龙套性在于将全光芯片的适用范围拓展到了大限度生成式神经网罗。咱们更但愿用永久的视角去看它的价值。

全光生成式AI芯片,并非“灵光一现”

《中国科学报》:LightGen处置了一个什么层面的问题,它最大的现实预想是什么?

翟广涛:

从近几年大模子的发展节律看,模子武艺抓续增强,运用也在加快走向分娩生计。与之相伴的是,大限度模子带来的端到端时延与能耗压力束缚突显。许多生成式任务对这两点高度敏锐,往往也会因此受限。

在这么的配景下,学术界和产业界才会更往常地关注下一代算力芯片。中枢诉求很明确:芯片要大概履行真实天下需要的任务,尤其是大限度生成模子有关任务。

LightGen对准的恰是这一层面——面向大限度生成式智能策划给出一条新的旅途,使新一代算力芯片更逼近前沿东说念主工智能的试验需求,同期为更高速、更高能效的生成式智能策划拓展了新的接洽标的。

《中国科学报》:你们是如何猜测这个处置决策的?接洽中最疼痛的方位是什么?

翟广涛:

早在2019年,咱们的助理教会陈一彤(这次论文第一作家)就运转想考如何故全光实现生成式模子,并在ScienceAdvances发表了国外首个全光生成式网罗。想考这个方针时,现时流行的生成式模子尚未大举走入公众视线,也未引起往常的关注。

在进一步推动时咱们发现,委果疼痛的方位在于,下一代算力芯片能否履行真实天下所需的任务,尤其是大限度生成模子这类对端到端时延与能耗很敏锐的任务。

围绕“让下一代算力光芯片支抓复杂生成模子”这个公认难题,咱们一步步推动,最终变成了全光大限度语义生成芯片LightGen,这亦然国外初次实现的大限度全光生成式AI芯片。

这个过程不是灵光一现。咱们把问题拆伙渐渐处置,先阐述关节瓶颈,然后仔细琢磨,中间也踩过不少坑,临了逐步迭代才变成当今的后果。

《中国科学报》:与过往一些光策划芯片比较,你们有哪些不同?

翟广涛:

往时许多全光策划芯片主要局限于小限度、分类任务,光电级联或复用又会严重减弱光策划速率,是以如何让下一代算力光芯片能运行复杂生成模子一直是一个难题。

咱们这项职责则是面向真实天下所需的任务,将全光芯片的适用范围拓展到了大限度生成式神经网罗。这是业内初次实现的大限度全光生成式AI芯片,实验粉饰了高远离率(≥512×512)图像语义生成、3D生成、高清视频生成及语义调控、去噪、局部及全局特征移动等多项大限度生成式任务。

更关节的是,咱们不是用电提拔光生成的风物,而是让全光芯片齐全走完输入图像、长入语义、语义操控、生玉成新媒体数据的端到端过程,让光具备“长入”和“显露”语义的武艺。

《中国科学报》:从这项后果动身,团队异日在本判辨线和产物化想路上有哪些经营?

翟广涛:

本领上,咱们会持续沿着新一代算力芯片这条干线推动,围绕大限度模子有关任务在端到端时延与能耗上的真实需求上抓续深远。咱们合计,LightGen有望率先在内容分娩经由中实现运用,如及时预览、极速出图等最“吃”算力且最需要及时响应的按序。

产业化层面,咱们也曾与工业界合营开展运用实践,后续将持续与产业方密切合营,使接洽更细巧对接真实需求。

实习生张昊睿对本文亦有孝顺

有关论文信息:

science.org/doi/10.1126/science.adv7434