光学大家 | Demetri Psaltis教授:站在光学与AI的交汇口

编者按

Demetri Psaltis,希腊裔美国物理学家,是光学信息处理和光学计算领域的开拓者。1980年至2006年任教于加州理工学院,于2007年转至EPFL,目前任瑞士洛桑联邦理工学院(EPFL)光学教授、光学实验室主任。研究领域包括光学成像、全息术、生物光子学、机器学习、非线性光学、用于氢气生产的电解技术以及光流体学。他是IEEE、美国光学学会、欧洲光学学会和国际光学工程学会的会士。他曾获得1990年国际光学委员会奖、2003年Humboldt研究奖、2012年Emmett N. Leith奖章、2006 Dennis Gabor奖和2016年Joseph Fraunhofer奖/ Robert M. Burley奖等多项国际重要奖项。

Advanced Photonics 特邀 AP Nexus编委、AI and Photonics专题编委司徒国海研究员对Demetri Psaltis教授进行专访,Psaltis教授分享了年少时选择光学图像处理作为研究方向的想法,并谈及一场偶然的报告如何激发了其对光学计算的兴趣。作为光学计算领域的亲历者,Psaltis教授回顾了该领域的发展历程,深入分析了当前光学计算所面临的问题与挑战,并展望了未来可能的发展方向。他还探讨了光学技术与AI产品融合发展过程中的关键难题,同时提醒大家在使用ChatGPT等AI工具时要保持警惕,避免过度依赖导致创新能力丧失。 此外,Demetri Psaltis教授还分享了自己在学生培养方面的经验,他认为“培养学生才是职业中的头等大事”,并强调要将学生视为独立的个体,因材施教,与学生建立起良好的关系。

英文全文已发表在Advanced Photonics 2024年第5期,欢迎查看:

全文链接

特约作者:司徒国海,中国科学院上海光学精密机械研究所研究员。

诺贝尔获奖者Hopfield的一场报告,四十年光计算研究的开局

司徒国海:Demetri Psaltis教授您好,感谢您于百忙中抽空接受我们的采访。距离我们上次见面已有几年时间了,如果没记错的话,上次见面还是在旧金山的SPIE 西部光电展。当时我和田磊一起,与您在一家自助餐厅进行了交谈,您总是能给我很多启发,带给我很多灵感。您最近在瑞士洛桑联邦理工学院(EPFL)的工作生活如何?一切还都顺利吗?

Demetri Psaltis我在瑞士一切都挺好的,日子平淡却充实。但今年一直很冷,而且冷空气似乎将会充斥整个春季。

司徒国海:2007年,您从加州理工学院到了EPFL。自1980年以来,在长达四十载的职业生涯中,您为光学计算、全息存储、光流控以及光学成像等多个领域做出了开创性的贡献。回顾四十年的职业生涯,您能与我们分享一些在这些领域内的关键时刻吗?

Demetri Psaltis正如你所说,我的研究领域十分广泛。在我的学术生涯中,虽然我致力于尝试新鲜事物,但我的研究主题始终围绕着信息与光学结合的领域。我进入这一领域是在卡内基梅隆大学期间,在那里我完成了硕士和博士学位。当时,为了确定研究方向,我去参观了David Casasent教授实验室,David Casasent教授后来也成为了我的博士导师。在参观实验室时,我在墙上看到了一个氦氖激光器和旁边红色的正弦函数,f(x) = sin(x)/x,这是我在通信相关的课程里学过的公式。物理系统竟然可以用数学表示,这给我留下了深刻的印象。当时我才22岁,还非常年轻。这就是信息和光学最初抓住我注意力的时刻,而时至今日,这仍然是我所追求的。

司徒国海和您一样,我还记得我第一次使用空间光调制器产生出可利用数学推导出来的东西时的那种感觉,非常美妙。

Demetri Psaltis是的,那个时候,还没有空间光调制器,只有感光胶片。也没有数字全息,所以得将全息图案记录在光盘上,然后在黑暗的屋子里才能将自己的三维全息图案复现出来,这是令人无比兴奋的!后来数字全息领域的相机能够被轻松获得了,使得很多原本不可能的事情成为了可能。

回到关于“关键时刻”的问题。来到加州理工学院时,我已经完成了关于光学图像处理的博士论文,并继续从事着这方面的研究。有一天,正在学术休假的宾夕法尼亚大学教授Nabil Farhat特意来看望我,他是个非常非常好的人。他说:“有一个有趣的报告,你愿意和我一起去听听吗?”

我答应了,尽管那段时间非常忙,但我仍然愿意去寻找一些新的灵感。那是一场John Hopfield(2024年诺贝尔物理学奖获得者)关于脑科学的报告,并且介绍了Hopfield模型。我和Nabil都十分兴奋,尽管我们之前都对脑科学不甚了解,然而John Hopfield却用浅显易懂的语言让我们了解了其中的精妙之处。

听完这场报告后,我们萌生出了一个想法:是否可以利用光学实现Hopfield模型。于是我们花了很多年的时间去研究如何用光学手段实现神经网络,但这一切的开始都来自于Nabil那句“让我们去听报告吧”。

司徒国海是的,很多人的职业道路都曾被偶然事件影响,我们这些从事光学研究的人也不例外。正如您前面所提到的,光计算与光神经网络是光子信息研究领域内的热门话题,而您正是用光学实现Hopfield模型的第一人,这是您投身光学计算领域的原因吗?还是只是因为听了那场报告,并结识了John Hopfield教授?

Demetri Psaltis有两方面的原因:其一,正如你所说,我们在机缘巧合之下接触到了与脑科学相关的知识,这是我们未曾涉足的领域,如果能够用光学手段进行研究,这必将是一个激动人心的研究主题;其二,当时已有了许多数字光学计算的工作,例如Joseph W. Goodman教授等人已经发表了许多与光互连相关的论文。就个人的研究兴趣而言,我意识到要实现神经元的模拟,仅靠硅基芯片中焊接电线的方式,很难实现数千个神经元相互连接的设计,实际上仅两三个数字逻辑门的连接,就已大大增加了电路板排线的数目。因此我们在首篇论文中就指出:由于丰富的连接功能,光学系统是实现神经网络模拟的理想系统。然后所有人都开始意识到,光学具有单元连接的极大优势,能够在不同器件之间建立有效的能量传递连接。

总结一下,我进入这一领域的动机有两个:一是因为对脑科学研究感到兴奋,二是想发挥光学连接性的优势。

EPFL实验室开发的基于结构非线性的光学计算装置

光神经网络到光计算,在加州理工和杰出科学家们一起迈入下个研究阶段

司徒国海即使现在,您的那篇文章依旧极其出色,值得反复品读。从20世纪90年代到2010年前后,光学计算领域经历了平静的发展阶段。回顾历史,将当时与现在的条件进行比较,我们能够发现,当时的硬件条件还无法满足实际的实验要求。您认为本领域研究能够在这种情况下兴起,背后的主要原因是什么?

Demetri Psaltis光学计算的故事应该从20世纪80年代讲起,加州理工学院当时有一个JPL实验室,是专为NASA(美国国家宇航局)运行服务的。我去参观了这个实验室。当时该实验室里有一台极其著名的光学计算机,他们用这台计算机处理合成孔径雷达图像。这是当时唯一处理合成孔径雷达图像的方法。巧合的是,用这台计算机处理的第一张照片,便是我的家乡,希腊的萨洛尼卡。

在当时,这台计算机做的工作,其他设备根本无法实现,当时的数字信号处理 (DSP) 技术和以德州仪器为代表的技术公司还未兴起。后来,随着DSP技术的出现,这台计算机便逐渐淡出了历史舞台,这也是我们这些人继续前进的动力。后来,随着光纤网络的架设,一些与全光交换相关的技术,开始在一段时间内成为热门技术,时至今日热度仍然不减。谷歌公司便大规模应用了这种技术,其Apollo系统的切换功能是依靠全光MEM实现的,这是一种有效的光学信息处理形式。

光学神经网络是在近几年才重新火起来的,它重新引起人们注意的根本原因,莫过于现代科学对于计算能力、神经网络和机器学习的庞大需求。众所周知,任何呈指数级增长的事物,其发展背后都存在一些问题和隐患。对于神经网络和机器学习来说,它们的急速发展,消耗了大量的电力能源和经济成本,人们急需去寻找一个具有更高性价比的“平替”。而光学系统,由于出色的连接性和极高的能量利用效率,再次登上了科学舞台的中央。

司徒国海:在光学网络的实现过程中,涌现出了许多方法。在过去的数年时间里,您认为光学计算领域内最具变革性的发展是什么?

Demetri Psaltis在现代光学计算领域,有两个方向的发展极其重要,同时也很有趣。其一是衍射光学计算,在三维光学系统里,可以通过衍射的方式实现神经元的连接,并且获得非线性,且不需要太长的处理时间;其二是集成光学,无论是谐振器、谐振结构还是马赫-曾德尔干涉仪 (MZI),都可以通过在芯片上编程的方式,完成特定的任务。

这两个方向都是当下的研究热点,除了光学连接,通过光纤互联的器件也在带宽方面具有巨大的技术优势。如今,人们甚至能以100 Gbit/s 的速度实现对光信号的调制,可以在此速度上构建任何其所需要的计算结构。

这两个当下的研究热点方向也很有可能交互融合。我刚刚读到清华大学戴琼海院士团队的一篇优秀论文,这篇工作结合了集成光学和衍射光学。因此,我认为这两个方向都很重要,既可以使用类似MZI、MGI等可编程线性结构,也可以使用空间光调制器及自由空间传输等手段来实现神经元之间的密集互联。

司徒国海:我也知道还有一些团队在使用其他复杂的介质进行这种光学计算。

Demetri Psaltis你说得对,例如Sylvain Gigan教授以及其他研究者,他们会使用多模光纤。这个想法基于“极限学习机”理论,由中国台湾的一位教授提出。该理论与深度学习不完全相同,其主张使用随机矩阵将数据映射到其他域,然后使用一个简单的单层神经网络去获得非常好的性能。这正是光学所擅长的,因为可以通过散射介质或是多模光纤进行映射,再加上简单的数字处理,就可以获得很好的结果。这项技术虽然不会带来最优的网络性能,但它胜在训练速度快,并且使用权重较少,可移植性很高。

司徒国海:那您是如何评估不同的光学计算方法呢?

Demetri Psaltis我相信在全球各地,有很多学者对光学计算感兴趣,但很少会有人使用非线性光学。神经网络本质上是非线性的,训练函数会随着训练集的变化而变化,当决策中有激活函数时,例如Sigmoid或是ReLU,网络中非线性的作用便开始突显。在光学中,互联是一项极其有利的性质,一个光子就是一个权重,这根本不算什么,它们的连接几乎是免费的。但非线性方面的情况则正好相反。因此,大多数研究人员都依赖OEO(光-电-光转换)的方式,即从光学到电学再到光学的数据流传输方式:在某个点上检测光学信号,并将其转换为电信号,经过线性处理后重新转换为光信号。多年前,我们尝试了非线性光学。我们使用光折变晶体和非线性晶体来实现权重,并使用不同的技术(主要是基于砷化镓),来尝试实现激活函数的非线性。这非常有趣,但也极其困难,因为这种非线性非常难以控制。时至今日,非线性光学仍然没有被大规模应用在光学神经网络中,大部分网络还是基于OEO模式的。但幸好,调制技术的发展非常惊人,这是我们当年做梦也难想到的。如今,电光调制器可以在几十吉比特,甚至上百吉比特的速率下工作,而所需的电压仅为1伏特。

在麻省理工学院,有一位名为Dirk Englund的美国教授,他就有一个专门生产电光调制器的公司;而瑞士的Rassel Granz等人,则将这些调制器做得很薄,这样便能够用很弱的电压去调制信号。而且现在这些调制器可以被集成进硅片中,也可以在硅片上安装。对于OEO模式来说,更低的电压意味着更少的能量消耗,同时也能够获得极高的带宽,这是实现神经元互联的希望。而神经元之间的连接,要么在硅基的MZI或谐振器结构中实现,要么在集成平台上实现,抑或利用衍射光学在自由空间中实现,在与OEO相结合后,就能够以电信号的形式实现激活函数的功能。由此,就可以得到一个具有高带宽和极低能耗的OEO接口,因为所需电压很低。

我认为非线性光学的发展希望在于结合线性的光学互连(不论是通过马赫-曾德尔干涉仪(MZIs)或谐振器,还是通过集成平台,或是通过自由空间中的衍射层)和OEO技术,在电子领域完成学习和激活函数的非线性处理。

司徒国海您说得对,但若是如此,势必需要进行光电切换,这种切换速度相当慢,对吧?因为在非线性光学的环境中,非线性介质对于电场的响应也需要一定的时间。所以,如果把这些都放入光学神经网络中,是否会减缓训练速度呢?

Demetri Psaltis非线性光学在神经网络中的应用研究,现在还处于一个发展阶段,仅是一个可预见的优秀解决方案。目前我们依赖OEO,从光到电子再到光。非线性功能在网络中,无论是用于学习还是决策,都是在电子域实现的,然后再转换回光学域。使用光学方式实现非线性,需要降低速度,或者使用非常高的峰值功率,比如必须使用飞秒激光,而这意味着失去功率优势。当然,也有一些相变材料,可以通过热效应进行改变,这对于训练是有帮助的。但即便如此,训练本身依然是通过数字方式完成的,然后再转换到光学域。”

司徒国海:所以,至少在当下,光学计算或是光学神经网络仍然依赖数字信号或电信号训练,在完成训练并且获得加权参数后,信号才被转换到光学域,然后再利用光学的优秀特性进行数据预测。

Demetri Psaltis是的,有两种方法,一种是全数字化训练,需要使用数字孪生技术来模拟光学系统的工作,最终将信息传递到光学系统中。第二种方法,我认为也非常有趣,是使用光学反馈回路,换句话说,就是在数字系统中训练,但在光学领域进行推理或前向传播。如果光学部分出现错误,学习算法可以进行纠正。我认为光学反馈回路方法是一个非常有前景的方向,并且它实际上是一个模拟系统,如果系统随时间发生漂移或变化,使用者可以定期或持续地重新训练原系统,而无需重建系统。

Demetri Psaltis教授与博士后在光学实验室中讨论问题© Alain Herzog

图片来源:Phys.org News

司徒国海:在20世纪90年代,您就担任了加州理工学院计算神经系统的执行官,后来还担任了NSF神经形态系统工程中心的主任。对于光学计算领域的发展,您不仅是一位具有深入研究的专家学者,还是一位具有广泛视野的管理者。那么,从您的视角来看,光学计算是如何以及为何发展到如今的状态的呢?

Demetri Psaltis无论是在加州理工学院,还是如今在EPFL,我一直承担着一些行政职责,究其原因,是因为我个人对此非常喜欢。对我而言,帮助大家组织或负责管理方面的工作似乎要比指导学生或设计课程更容易,尤其是在我和Hopfield共同成立的计算与神经系统系,他是首任系主任。在20世纪80年代,计算与神经系统已然成为热点研究领域,Hopfield提出我们应该将加州理工学院的活动重点放在教育上,让学生也对生物学、工程学与计算机的交叉领域感兴趣。我认为这是一个很棒的想法,这可以让教授们聚集在一起,共同探讨课程设置或是与学生互动环节的细节等等。

在这个院系成立的几年时间里,陆续吸引了Carver Mead(美国电子工程学家和计算机科学家,推动了超大规模集成电路(VLSI)设计的革命性发展,奠定了现代芯片设计的基础),Abu Mostafa(埃及裔美国计算机科学家,提出了开发学习理论)以及Christof Koch(德国裔美国神经科学家,意识研究的先锋,尤其以研究如何通过大脑神经元活动理解意识状态而闻名)等非常优秀的人加入我们。我相信,如果这个系成立得再早些,我们甚至能够吸引到Geoffrey Hinton(2024年诺贝尔物理学奖获得者)或是Roman Hart。当时我还很年轻,遇到这些杰出的科学家对我来说也是终身难忘的经历。后来,我成为了系主任(在加州理工学院称为执行官),我们一起迈入了下个阶段。

司徒国海:如今您也已与他们同样杰出。

Demetri Psaltis我还是比不上这些人的,但还是要感谢你的夸赞。那是一段十分美好的时光,因为那是我职业生涯和在这个领域刚刚起步的阶段。但那时的我们,即使是用最夸张、最超乎想象的方式去展望这一领域的未来,也无法描绘机器学习在今天所取得的惊人成就。如今,人们用机器学习所做的事情,例如ChatGPT,都是当时的我们完全无法想象的。

光学领域也是如此。当时,在几年时间内,光学计算公司迅速筹集到了数十亿美元,学界也有工作被发表在诸如Nature Photonics之类的期刊上,展示了每秒数十太赫兹的卓越性能。这是曾经的我们所不敢想象的。所以,那是一个令人兴奋的时代,而在这样的时期担任管理者对我来说也是一件很有帮助的事情。

当时我们所面临的其中一个难题是如何协调物理学家和生物学家的工作。最初,加州理工学院的神经系统计算系有半数是生物学家,另一半则从事计算机研究。由于我是希腊人,我最初甚至不能理解“突触”这个英语单词的含义(因为在希腊语中这个词表示“连续”)。但后来我学习到很多有关大脑的知识,如大脑不同区域、不同视觉系统等等,这让我产生了极大的兴趣。但在当时,生物学家强烈反对用计算模型辅助他们的研究工作。在这样的反对之下,渐渐地,工程师们也对大脑的工作细节失去了兴趣,仅仅只是通过技术手段去进行结果上的模拟。

但最初,这个领域存在很多交流和沟通,有很多人像Henry Markham(他现在是我EPFL的同事)一样,致力于开发大脑的完整模型,并试图了解其工作原理,他们称这种模型为“连接体”,并通过人类和动物大脑切片为实际样本,试图确定完整的连接结构,然后尝试为神经元之间发生的信息传递建立模型。但我认为我们距离实现这一目标还很遥远。也许我们对视觉区域和听觉区域已经有了一定的了解,但总体而言,我们还没有一个完整的模型。

在缺乏这种模型的情况下,计算机工程师们发展了自己的技术,例如反向传播,还有Transformer等技术,然而这些技术与大脑并没有直接联系。最近,许多研究者如Hopfield和Hinton开始指出,我们目前的计算模型是没有生物学原理的。因此,他们开始寻找新的技术,Hinton称之为“前向-前向”算法,而Hopfield则称之为“平衡传播”。这些方法的学习规则是局部的,因为在生物学中,并没有证据表明存在全局的反馈传递,因此神经网络的学习规则也应该是局部的。这意味着,如果有两个通过突触连接的神经元,那它们之间突触连接状态的变化应该仅依赖于这两个神经元的状态,如同Hebbian学习规则那样。

因此,现在又有很多人开始寻找符合生物学原理的计算模型,像这个领域的研究刚展开时那样,生物学家和工程师们再次开展了紧密的交流与合作,这是非常令人激动的,因为通过这样的交流,我们都学习到了更多知识。后来,机器学习革命发生了,对大脑的理解和研究也有了新的独立发展。而随着新的研究活动的展开,生物学研究和计算机模型的合作关系又有了回归的趋势。

日新月异的计算成像变革,面对AI挑战既要适应和调整也要警惕

司徒国海:我认为神经计算的理论也同时在不断发展,对吗?

Demetri Psaltis这一发展绝对是日新月异的,像ChatGPT这样的开放模型以及各种生成式模型层出不穷。我正在教授一门计算成像课程,但我很难跟上谷歌、微软等科技公司的推出的新想法。事实上,大多数新的成果都来自于工业界,而非大学。

司徒国海:是的,这的确是个不容忽视的问题,这也与我将要提问的下一个问题有关。请问,您觉得光学在这些前沿应用中能够扮演什么样的角色?因为目前的一系列成果,例如ChatGPT和其他大模型,它们都是基于电子计算和数字计算的,而光学目前基本上只能用于模拟计算。回溯历史,已经有很多人曾尝试做一些数字光学计算和光学逻辑的实验,但仍存在一些困难,是否有办法去克服这些困难呢?

Demetri Psaltis这是个好问题,我们每天使用的数字计算机是基于布尔逻辑的,因此具有非常明确的非线性特性,即0和1,几乎没有容错空间。但在生物学中,大脑并不是这样工作的,它通过进行非线性变换,执行极其复杂和强大的计算,做出决策。从脑科学研究中,我们能够学到很多东西,其中之一是连通性,要建立足够多的连接;另一个是做好一个事情并不一定需要极端的精确。这二者是相关的,因为一个神经元与成千上万个神经元连接着,也会接收到来自如此之多的神经元的输入,其间存在一定的容错空间,即时其中的一个输入偏离了几个百分点,但神经元的响应是基于所有输入的,在对数据进行综合计算分析后,能够对这一误差进行补偿,具备内置纠错能力,而光学也正是如此。假设我们有一个特殊的光调制器或一组MTI,就能够实现David Miller所说的自我校正,自我修复。这是因为一旦其中一个出现错误,其他的可以在训练过程中对其进行补偿。

现在,除了模拟光学系统,受到广泛关注的还有超大规模集成电路 (VLSI) ,此外,具有类似功能的设备也有不少。值得一提的是,Barbars Mead在这方面做出了许多的努力。所以,我认为神经网络的优秀宽容度,不仅适用于光学的连接性,也适用于光学固有的模拟性质。

话虽如此,但我认为对于光学或其他任何模拟系统来说,准确性并非最关键的要素,因为当你训练模型时,温度或其他物理要素会发生变化,这会影响输出的结果。因此,对于模拟系统,尤其是光学模拟系统,我认为比起准确性,更重要的是稳定性。

司徒国海:光学可以加速AI领域的研究,正如您前面所说的。而AI也是计算成像领域内变革性的成就,作为亲历者,你我也参加到了这场浩大的技术革命中。对您来说,您会如何将AI融入研究工作中呢?

Demetri Psaltis这是一个非常好的问题。我们有为AI设计的光学系统,这意味着我们正在构建用于计算AI相关任务的光学机器。反之,AI也可以被用于光学设计,这个新工具能够帮助我们更好地设计光学系统。所以,和很多人一样,我也参与了这一领域。这是一个非常广泛的话题,我的主要贡献涉及多个领域,但我想先介绍其中的一个:我一直在做的是通过断层扫描对物体进行成像,就是利用一个物体的二维投影重建这个物体的三维形态。这就像我们去医院拍X光片,仪器从不同角度拍摄身体的图像,然后进行身体的重建。

但在二维到三维的重建中,无可避免地会丢失一些信息,所以必须做出一些猜测,而使用神经网络和相关数据集可以做出有根据的猜测。我们将使用神经网络从二维投影重建三维形状的技术称为“学习断层扫描”技术,这项研究已经发表在Nature Photonics上。这项技术非常强大,因为可以用数字模型数据或物体真实数据去积累一些该物体的数据。事实上,我们很难获得物体真正的三维形态,例如细胞,但神经网络可以帮忙完成从物体的二维投影重建其三维形态的任务。但仅利用数据库,还是很难直接从二维过渡到三维,在这个过程中,你还需要设计出合理的算法,用一定的技巧才能实现。

现在我们已经能够通过断层扫描得到清楚的图像,于是我们开始思考,这些细胞的清晰图像是否可以作为RNA或DNA等遗传密码的替代品。因为就像任何生物体一样,细胞的形状是由DNA表达所决定的。如果因为癌症或其他病变,导致细胞形状发生改变,那么我们可以结合数据和机器学习,实现对细胞病变行为的监测,从而对基因表达实现监测。这是机器学习的一个非常激动人心的应用。

司徒国海研究员与Demetri Psaltis教授2024年合影

司徒国海:是的,我们现在讨论的大语言模型模型,例如ChatGPT等,它们在很多方面都有着极其出色的表现。那么,我们作为光学研究人员,您认为应该如何从中受益呢?

Demetri Psaltis我认为ChatGPT对每个人来说都是一个不小的挑战,需要做出适应和调整。但即使是在研究工作中,我们也必须思考如何以富有成效的方式使用它,而不是以一种可能不利的方式。实际上,这能够在某种程度上削弱研究人员的创造力,如果你依赖它,结果肯定会趋于平庸。因为如果你对它说:“给我设计一个不错的光谱仪”,那么全世界的人都会从它那里得到相同的答案。

司徒国海:我们似乎可以开发一种算法来实现任何事情,比如重建或设计。但我不知道它们能否真正创造一些新的东西。最近,我与Wolfgang Osten讨论过当下的AI技术是否真的智能。但最后我们达成了共识,认为目前的AI还并不完全智能。它们的存在,只是让人类显著感知到了这个学科的发展趋势,但一些真正有创造性的工作,像ChatGPT这样的工具暂时还是无法胜任。

Demetri Psaltis在我第一次访问日本时,我与日本的一位教授讨论了“创新”这个话题。他告诉我:“在日本,我们不说创新,而只说发现”。他认为,当我们说自己实现了某种创新时,实际上我们只是发现了自然界中事物的某种存在形态。因此,爱因斯坦并没有发明相对论,相对论就在那里,爱因斯坦只是将其描述了出来。

这更像是一个哲学论点,我并没有明确的倾向性,无论说是创新还是发现,我都表示支持。回到ChatGPT和谷歌搜索引擎的话题,它们确实是巨大的科技进步,但我们当下必须继续向前迈进,因为它们能够模仿出我们可能要做的事情。所以,我认为与其它事情相比,面对AI的关键挑战在于,如何利用它们来帮助你变得更好,而不是让你陷入平庸。

司徒国海:我知道工业界中的许多人利用ChatGPT极大加快了工作流程,我认为学界也可以采用这种方法。

Demetri Psaltis是的,但我认为使用AI工具时也必须足够警惕,避免变得惰于思考,满足平庸。

司徒国海:的确如此。大语言模型的训练往往需要研究机构或大学对其投入大量的资源。有人担心这可能会阻碍人工智能的进一步发展,您对此有何看法?以及您认为光学在实际中有哪些作用?

Demetri Psaltis你的问题包含了两个要素,一个是能否通过大模型规模来判断能力。另一个是像OpenAI、微软和谷歌这样的巨头公司是否会主导这个领域。回到几年前,如果你不在Intel工作,几乎不可能为你的学术研究构造数字硅基电路。这的确是一个令人感到担忧的问题,就像我们前面谈到的那样,现在大多数新想法似乎都来源于这些大公司,但在某种程度上,它们又与科学和知识传播机构不同,它们的出发点在于盈利,这些技术是一种生意。我相信未来这些科技公司还能推出更好的AI产品,但我还是希望,科学部门也能够有所突破,这样会使AI领域的发展达到平衡,尽管很难预测这种突破可能发生在哪里。光学就是可能创造突破的新鲜元素,因为它是一种扩大计算规模的有效方式。

我敢相信,除了我以外,还有不少人都不认为GPU会一直发展下去,因为它消耗了太多的电力,并因此提升了AI的实际应用成本。因此需要发明新的方式。可能是模拟LSI、量子计算或光计算。因此,在这个过渡阶段,光学可能有助于分散目前由科技巨头公司主导的前沿研究活动。至于是否能够将相关的研究进行分散,使各个大学中的研究人员都去承担一些科技企业正在做的研究,我希望答案是可以。因为如果不能实现的话,我们可能将失去在某些领域的探索。对工业而言,创新则意味着风险,工业界就可能会由于发展原因而放弃探索某些领域;但对于学术界来说,创新十分重要,即使是在Nature 和Science上发表的论文,可能都仅是一个小小的创新突破。因此,我认为光学有助于在这个方面改变当下由科技巨头公司主导前沿研究的技术模式。

司徒国海:那么,展望未来,光子学和AI的交叉领域中,哪些是最令你感到兴奋的研究方向?

Demetri Psaltis当然,我有自己的研究领域。我自己的工作主要集中在结构线性上,这是一种用线性光学实现非线性函数的方法。我认为它非常有前景,因为不必再进行光-电-光(OEO)转换,而是可以停留在光学域中,进行线性映射。就我个人而言,这着实是一个令人兴奋的研究领域,它是值得我未来几年为之忙碌的方向。这个方向一旦出现突破性进展,就能够提高芯片加速器制造公司的发展速度,这些芯片能够被集成到现有的任意一个数据中心。而一旦这些公司成功站稳脚跟,这对我们所有人来说都是向前迈出了一大步,对这些公司来说也是一次赚钱的机会。因此,他们必将帮助数据中心完成技术升级,同时也能够为光学研究打开闸门,将资源、资金和人才源源不断地进入进来。

我不知道你是否知道,当你使用Python或其他编程语言写代码时,需要使用编译器对代码进行编译后才能运行。同样地,如果你写了一个神经网络,也需要先经过编译器编译后才能在GPU上运行。而对于像数据中心这样的庞大基础设施,所需要的编译器非常复杂。在这种情况下,如果我们引入光学去处理其中的部分问题,那么编译器需要随之进行更新,使之能够兼容光学的部分。这是一个很大的工程,而只有这件事情得到解决,光学才能够成为AI主要的研究领域。

司徒国海:您说得对。最后一个问题,我知道您是一位伟大的科学家,我们都很钦佩您,您培养出了一大批优秀的学生,他们在不同的行业中都做出了巨大的贡献,取得了显著的成就。您是如何做到这一点的呢?您的学生培养理念是什么?

Demetri Psaltis我很高兴你会问这个问题,因为我始终认为,培养学生是我工作中的头等大事。我认为我很幸运,遇到的都是极其优秀的学生,不管是之前在加州理工学院,还是现在在EPFL。我认为,作为一名教授,能够与年轻人一起工作,同时他们愿意倾听你的想法,这是一份十分了不起的礼物。对于学生培养,我并没有固定的模式,我只是尽力做到因材施教,有些学生期待鼓励,有些学生需要批评,有些学生则需要手把手的帮助,不同的个体有不同的需要。反之,对我来说,我也从与学生的交流合作之中也学到了许多。此外,我也经常让学生担任我课程的助教。

Demetri Psaltis在深度学习成像课程中为学生颁发“最佳项目奖”

图片来源: EPFL News

我过去的学生现在都成为了我的朋友。所以这是我们这个职业特有的巨大馈赠,它让我觉得自己这辈子从来没有工作过,我只是在追寻自己的爱好,这种感觉非常棒,而往往只有篮球或足球运动员才会有这种感觉。

司徒国海:好的,非常感谢您的分享。今天的采访到此就该结束了。再次感谢您在百忙之中接受中国激光杂志社的采访,我们也希望您能够将下一篇论文投稿到Advanced Photonics这本国际声誉在不断提高的期刊上。希望不久后的将来,我们能够在线下见面交流。

Demetri Psaltis同样感谢你的采访!

特邀采访人简介

司徒国海,中国科学院上海光学精密机械研究所研究员、博士生导师、国家杰青、美国光学学会Fellow。主要研究领域为计算光学成像与光信息处理,包括光学散射成像、单像素成像、相位成像和数字全息等,在Nature Photonics 等期刊上发表论文100余篇,所发表文章总引用达8500余次,连续三年 入选Elsevier 高被引中国学者榜。近年来,在基于人工智能的计算光学成像方面的多项开创性研究成果受到了国际同行的广泛关注和高度评价。

End

首发前沿光学成果,放送新鲜光学活动

如需转载,请直接留言。

免责声明

本文中所出现的所有图片均为转载,如涉及版权等问题,请作者在20个工作日之内来电或来函联系,我们将协调给予处理(按照法规支付稿费或删除)。

最终解释权归《中国激光》杂志社所有返回搜狐,查看更多

平台声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
阅读 (0)
我来说两句
0人参与, 0条评论
登录抢首评