不确定性和可微分成像
December 25, 2024 | Ni Chen


激光过敏

完成计算机科学本科学业后,我转向光学工程攻读研究生,却发现身体似乎在抗拒这个全新的环境。每次踏入实验室,恶心、头痛与眩晕便如潮水般席卷而来。在经历数月不明原因的折磨后,我曾得出一个戏剧性的结论:我一定是激光过敏。

如今回想,真相很简单 —— 我只是欠缺基础的光学知识。导师察觉我的困境后,尝试为我分配更多计算任务,尽可能减少实验工作。但在光学工程领域,实验始终是绕不开的必修课。即便满心恐惧与不适,我仍不得不硬着头皮面对挑战。

接踵而至的难题层层叠叠:首尔国立大学的安全规范禁止单独进行实验;实验室与办公室相隔甚远;而我又是团队中唯一的女性成员,实验通常会需要约三个人。在无数个举步维艰的时刻里,某个周末的经历尤为刻骨铭心 —— 我偷偷溜进实验室(我不是教大家违反学校规章制度),本打算完成一组简单的测量。我误将错误规格的螺丝拧进光学平台,偏偏卡在光轴的关键位置。公制与英制螺丝混乱,我用尽办法也无法取出。在实验室黑窗帘的包围中,长久积压的各种情绪使得我彻底崩溃,独自一人在映着一缕红色激光的黑暗房间里痛哭,最终连一组数据都未能采集到。

这不过是那些年无数挣扎的缩影。我选择的计算成像研究方向(当时这一概念甚至尚未被学界广泛命名),不仅需要深厚的计算学科背景,更离不开精湛的实验技能,而我,一个也没有。漆黑实验室里的泪水,似乎印证了我内心最深的恐惧:或许,我从一开始就选错了路。

漫长的徘徊

我的挣扎超越了光学实验的范畴。多年来,我仿佛被困在两个世界的夹缝中 —— 既不被光学领域完全接纳,也难以融入计算领域的核心圈层。在光学研究者眼中,我是连基础光学系统都调校不好的 “计算机门外汉”;而在计算领域同行看来,我又是个过分纠结物理细节的 “保守派”。

寻找适用于逆成像的计算算法,成了另一段艰辛的跋涉。传统优化方法往往脱离光传播的物理本质,仿佛在空中搭建楼阁;机器学习模型则将成像简化为纯粹的数据处理问题,粗暴剥离了图像形成过程中复杂的物理机制。我费无数时间复现算法:它们在仿真环境中运行得完美无缺,可一旦面对真实实验数据,却如同精致的玻璃器皿坠地,瞬间碎成粉末。

这些失败教会我最关键的一课:计算模型与物理现实的割裂,本质上是一场哲学冲突。我们总试图用整齐的代码逻辑去框定混乱的物理世界,用确定的数学公式去丈量充满不确定性的光场分布 —— 但现实从来不会屈从于人类定义的 “盒子”,它用光斑的偏移、噪声的波动、参数的漂移,不断提醒我们:科学的本质,是理解而非征服

理解的种子

转变始于细微之处。当我最初涉足可微分全息术1研究时,尚未对 “不确定性” 产生深刻洞见。彼时,这一技术仅被我视为一种精巧的方法 —— 借助梯度下降算法优化全息重建过程。2018 年 Yann LeCun 提出的 “深度学习已死,可微分编程万岁” 宣言,成为启发我的关键原点。他将可微分编程构建为统一框架的愿景,与我试图融合计算科学与物理世界的研究方向产生强烈共鸣,仿佛为我提供了连接两个领域的方法论桥梁。我曾试图在我们 2022-2023 年的 perspective2 论文中引用这句话,但因为我的草稿太乱了,在 Lam 老师的建议下最终给删除了。

Yann LeCun在2018年的帖子:深度学习已死, 可微分编程万岁!3

可微分编程的核心理念,逐渐孕育出 “可微分成像” 的研究雏形。当神经网络已实现可微分特性,为何不能将整个成像系统纳入这一框架?为何不能让梯度流贯穿光学元件、光传播过程乃至整个图像形成链路?这种思考推动了我在可微分全息术领域的早期探索,尽管当时尚未完全参透其深层内涵。

2020 至 2022 年间,随着全息系统可微分研究的深入,”不确定性” 的本质作用开始清晰显现。每一次构建端到端可微分系统的尝试,都迫使我直面那些曾长期困扰实验工作的不确定性问题。但此时,这些特性不再被视为研究障碍,而是被重新认知为物理现实的基本属性 —— 如同光的波粒二象性般,成为理解成像本质不可或缺的维度。

不确定性的本质

真正颠覆认知的启示往往简洁而深邃:不确定性并非宇宙的杂质,而是其本质的基石。从量子力学的概率波函数到热力学的熵增原理,从生物系统的适应性演化到宇宙膨胀的暗能量谜题,不确定性从来不是测量误差或模型缺陷的产物 —— 它是现实世界底层的运行法则,是构建物理规律的基本语法。

这种认知重构引发了我对计算成像领域的范式思考。传统方法论将不确定性视为需要围剿的 “噪声敌人”,试图通过算法优化、硬件校准或数据清洗实现绝对精确的成像结果。但当我们执着于消除不确定性时,是否正在与宇宙的本质规律对抗?或许更具智慧的路径,是设计能够主动拥抱不确定性、甚至将其转化为系统优势的新型成像架构 —— 如同量子计算机利用量子叠加的不确定性实现算力跃迁。

当《Advanced Physics Research》编辑邀我撰稿时,我意识到这是一个向学界传递全新认知的契机。那些在实验室中反复遭遇的 “失败数据”、算法优化中难以收敛的 “异常波动”,此刻都不再是研究的绊脚石,而是孕育计算成像新方法论的胚胎细胞。这种思维转换的本质,是将不确定性从 “需要克服的障碍” 重新定义为 “可被利用的资源”,如同冲浪者不是对抗海浪,而是驾驭浪潮的能量。

危险的简化

随着认知的演进,我注意到领域内滋生出一种值得警惕的学术倾向 —— 不少研究者陷入了 “计算成像 = 代码” 的还原主义迷思。这个看似简单的等式

\[\text{代码} \equiv \text{计算成像} ???\]

实则隐含着远超学术争议的认知危机。

这种过度简化的思维正在制造学术评价的认知偏差。我曾目睹优秀研究者因代码在异质光学装置上的失效而遭受质疑,甚至被指控 “代码藏错” 或 “能力不足”。批判者忽视了一个核心事实:计算成像代码本质上是特定物理系统的数字孪生体。当算法赖以生存的物理假设(如点扩散函数的空间分布、传感器的噪声模型)因光学元件的微偏移(如未对准的反射镜)或硬件特性的改变(如新相机的噪声谱)而失效时,代码的 “失灵” 恰是物理现实对计算模型的合理抗议。然而在还原主义视角下,研究者却成为代码与物理世界脱节的 “替罪羊”,其学术声誉与研究价值被粗暴否定。

这种认知谬误的根源,在于割裂了计算成像的 “物理 - 数字” 二元属性。传统光学显微镜天然具备物理自适应机制:更换样本时需重新调焦,本质是通过人为干预重建 “光学系统 - 样本” 的匹配关系。而代码作为静态的数学映射,如何能自动适配现实成像环境中光场分布、器件响应、噪声特性的动态演变?答案显而易见:纯代码无法独立完成物理世界的语义解析。真正的计算成像必须建立在 “物理直觉 - 算法设计” 的双轨思维之上 —— 研究者既要精通算法架构的数学本质,又需深谙光场传播的物理规律、传感器的量子响应机制以及不确定性在 “光 - 机 - 电 - 算” 链路中的传递特性。

颇具辩证意味的是,这种复杂性反而构成了知识产权的天然护城河。与可跨平台复制的纯软件不同,计算成像解决方案的价值内嵌于 “物理系统 - 算法模型” 的共生关系中。缺乏对特定光学设计、校准流程与物理约束的深度理解,即便获取代码也如获无弦之琴 —— 既无法解析算法背后的物理语义,更无法复现 “代码 - 硬件” 的协同效应。从这个意义上说,物理世界的不可替代性,为原创者构筑了难以逾越的技术壁垒。

多年的研究阵痛让我逐渐领悟:每一次光学元件的微偏移、每一组异常的测量数据、每一个收敛失败的算法,都是物理世界给予的启示 —— 它在提醒我们:不确定性不是需要 Debug 的程序错误,而是需要被算法设计主动编码的现实维度。当我们将物理系统的非理想性从 “需要消除的噪声” 重新定义为 “计算模型的内生变量” 时,或许才真正叩开了计算成像的科学之门。

可微分革命

随着可微分全息术研究的深入及其外延意义的逐步显现,学术探索的路径愈发清晰:可微分编程绝非局限于神经网络优化的技术工具,而是正在构建一种能够统一描述物理过程与计算逻辑的 “科学世界语”。这一认知突破催生了可微分成像的宏大愿景 —— 在光场传播的波动方程与算法迭代的梯度下降之间,搭建起信息交互的语义桥梁。

自 2020 年起,这段跨学科的探索之旅已伴我跨越三个国家、四个地区。其间,我有幸与多位顶尖学者深入交流。在不同文化背景与学术领域的思想碰撞中,我得以从多元视角重新审视 “可微分成像” 这一研究主题。这种跨维度的思维激荡,不仅为我的研究注入了新的活力,更让我对这一领域的认知边界不断拓展与深化。

2024 Nobel Prize in Physics

2024 年诺贝尔物理学奖授予 Geoffrey Hinton 的时刻,成为了一个极具象征意义的学术注脚。当目光落在 Hinton 的照片上时,我不禁惊叹 —— 这正是我在报告中频繁引用的学者!他的研究工作,恰是可微分编程从计算机科学向物理世界渗透的绝佳例证。我在早期的幻灯片中,用 Hinton 和其他两位图灵奖得主的照片阐释 “深度学习是可微分编程特例”。此刻回望,这幅图示竟悄然成为某种学术预言的注脚 —— 诺贝尔物理学奖这一科学界最高荣誉的加冕,本质上是对 “计算 - 物理统一框架” 这一底层认知的集体认同。这一跨越,不仅是对个体学术贡献的褒奖,更标志着人类对自然规律的认知,正通过计算范式的革新,迈向更深层的统一与融合。

我在2023年4月iCANX青年论坛演讲中的一张幻灯片4

可微分成像正是这一认知革命的自然演化产物:它超越了 “用梯度优化系统参数” 的工具理性层面,致力于构建 “光场能量流与数据信息流在物理空间 - 计算空间双向映射” 的新范式。诺贝尔奖的认可不仅是对个体研究的激励,更标志着一个时代的来临 —— 当麦克斯韦方程组的微分形式与反向传播算法的梯度流在数学上达成统一表述时,人类或许正在解锁一种全新的 “科学认知 DNA”,一种足以重构 “观察 - 建模 - 预测” 科学方法论的底层架构。

闭环

可微分成像绝非又一种普通的优化技术,它在物理现实与计算模型间构建起闭环,使系统得以从每一个光子、每一次测量、每一份不确定性中汲取养分。这些系统不再将噪声与变化视作需击败的敌人,而是将其视为有待处理与理解的信息567

这种方法让成像从单向的捕获过程蜕变为系统与环境间的动态对话。可微分成像系统既能依据计算反馈优化光学元件,又能基于物理约束调整算法,还能量化不确定性,从而对自身可解析与不可解析的内容做出判断。

必须强调的是,可微分成像研究目前仍处于早期阶段。我们正站在一场有望变革整个领域的旅程起点 —— 框架尚在开发,工具仍需完善,其全部潜力有待进一步探索。但即便在初期,可微分成像已为困扰计算成像研究多年的诸多基本问题提供了解决路径:它打破了光学与计算间的刚性壁垒,攻克了适应变化条件的难题,化解了不确定性量化的挑战,还消除了不同成像模式间的障碍。

这一框架的美妙之处,在于它与现实本质的哲学契合。当我们承认不确定性是根本属性而非偶然现象,便不再与宇宙对抗,转而与之协作。无论是设计适应生物样品的显微镜、补偿大气湍流的相机,还是研发考虑患者运动的医学成像系统,核心原则始终如一:拥抱不确定性,让一切可微分,让系统自主学习

展望未来,我们近期的研究已着手探索该方法与数字孪生等概念的融合,旨在打造真正自主的成像生态系统8。这些系统不再局限于捕获图像,更能理解自身局限、预测潜在问题,并为每个独特场景实现自我优化。尽管我们才刚刚触及可能性的表层,但早期成果已预示:未来的成像系统将如同使用它们的研究人员一样,具备强大的适应性与智能。

反思

写到这里,我不禁回想起那些充满挫折的时刻 —— 不仅是那个螺丝卡住、一筹莫展的周末,还有那些年徘徊在两个领域之间的迷茫:算法屡屡无法收敛,实验始终难以对准。每一次失败,都暗藏着关于宇宙中不确定性本质的深刻启示。

我所言的 “激光过敏” 确实存在,只是并非我最初想象的那样。那其实是对成像系统中僵化确定性思维的抵触 —— 这类系统往往刻意忽视不确定性的客观存在。从早期的挣扎到探索可微分成像的历程,本质上是一场与 “逃避” 和解的成长:我逐渐学会拥抱曾经极力规避的不确定性。

当我们让系统具备可微分与自适应能力时,解决的早已不止是技术层面的问题。这一过程,实则是让技术与现实的本质达成共振 —— 在真实的宇宙中,不确定性并非需要剔除的 “程序漏洞”,而是构成现实的基本特征;适应不是可有可无的选项,而是存续发展的必然要求;许多深刻的洞见,恰恰源自最痛彻的挣扎。

如今,那个黑暗实验室里的眼泪,早已幻化成一种全新的系统愿景:它们不再惧怕意外,而是将其视为学习的契机;不再执着于消除混乱,而是从中挖掘规律;通过接纳不确定性作为宇宙的本质属性,在混沌中寻得清晰的认知路径。

参考文献

  1. Ni Chen, Congli Wang, Wolfgang Heidrich, “∂H: Differentiable Holography,” Laser & Photonics Reviews, 2023. 

  2. Ni Chen, Liangcai Cao, Ting-Chung Poon, Byoungho Lee, Edmund Y. Lam, “Differentiable Imaging: A New Tool for Computational Optical Imaging,” Advanced Physcics Research, 2023. 

  3. Yann LeCun’s Facebook post: https://www.facebook.com/yann.lecun/posts/10155003011462143 

  4. iCANX Youth Talks Vol.8: https://ueurmavzb.vzan.com/v3/course/alive/754913272 

  5. Ni Chen, Yang Wu, Chao Tan, Liangcai Cao, Jun Wang, Edmund Y. Lam, “Uncertainty-Aware Fourier Ptychography,” Light, Science & Applications, 2025. 

  6. Ni Chen, Edmund Y. Lam, “Differentiable pixel-super-resolution lensless imaging,” Optics Letters, 2025. 

  7. Yang Wu, Jun Wang, Sigurdur Thoroddsen, Ni Chen*, “Single-Shot High-Density Volumetric Particle Imaging Enabled by Differentiable Holography,” IEEE Transactions on Industrial Informatics, 2024. 

  8. Ni Chen, David J. Brady, Edmund Y. Lam, “Differentiable Imaging: progress, challenges, and outlook,” Advanced Devices & Instrumentation, 2025.