KAN一作刘子鸣回国任教,清华官网认证

2026/1/13·来源:量子位
KAN神经网络可解释AI清华大学刘子鸣

爆火神经网络架构KAN的一作刘子鸣将回国任教。他拟于今年9月加入清华大学人工智能学院担任助理教授。KAN是一种可解释性强的神经网络,旨在替代传统多层感知机。

爆火神经网络架构KAN的一作刘子鸣将回国任教。他拟于今年9月加入清华大学人工智能学院,担任助理教授。KAN的初版论文发表于2024年4月,以优于多层感知机的准确性和可解释性引发学术界热议。其GitHub仓库在短短两三天内就收获了1.1k星星。KANs被视为MLPs的有力替代方案,为改进深度学习模型提供了新契机。刘子鸣的这一教职早前已敲定,他的首批博士生招生目前已经完成。刘子鸣是武汉人,高中投身物理竞赛,2015年入选物理国家集训队,保送至北大物理学院。本科期间,他关注物理学和机器学习的交叉领域,有文章发表在European Physical Journal C、Physical Review C等刊物和NeurIPS 2020等学术会议上。本科毕业后,刘子鸣赴MIT攻读物理博士学位,师从物理学家Max Tegmark。KAN是刘子鸣和Max Tegmark合作的成果,旨在提升神经网络的可解释性。KAN的初始灵感来自Kolmogorov-Arnold数学定理,该定理指出任何定义在有界域上的多元连续函数都能表示为有限个单变量连续函数的两层嵌套叠加形式。这为KAN的诞生提供了思路:将复杂高维函数学习转化为一组单变量函数的学习。KAN完全无需线性权重,MLP在节点上使用固定激活函数,而KAN则可将学习的激活函数置于边上,每条边的线性权重被单变量函数替代。这种设计使得网络中各变量的作用路径可以被直观观察到,KAN具备MLP无法提供的可解释性和交互性。论文发布后迅速引发强烈反响,Google Scholar显示KAN的引用量已经达到3000+。2024年8月,刘子鸣和合作者们又发表了KAN 2.0,以进一步提高KAN的实用性和易用性。刘子鸣将KAN解读为三个层面的AI+Science:Science for AI原理来自于数学;Science of AI澄清了一些关于Neural Scaling Law的现象;AI for Science依靠KAN能够发现科学和工程问题中的符号公式。2025年5月份,刘子鸣在社交媒体上更新了自己获得清华教职的消息。在招生文章中,他说明了自己的研究风格:好奇心驱动和影响力驱动;理论和实验结合;研究问题的层次通常介于纯理论和纯应用之间的中间抽象层。目前,刘子鸣在斯坦福从事博士后研究,合作导师是Andreas Tolias。刘子鸣现在每天更新的博客名为“physics of AI”,意为用研究物理学的方式来研究AI,旨在回答什么样的模型在什么样的数据上展现出什么样的现象。从2025年12月31日起,他每天都在更新博客内容。

背景阅读

KAN(Kolmogorov-Arnold Networks)是一种新兴的神经网络架构,于2024年4月首次提出,迅速在AI学术界引起广泛关注。其核心创新在于基于Kolmogorov-Arnold定理,该定理是数学中的一个经典结果,表明任何多元连续函数都可以表示为有限个单变量函数的叠加。KAN利用这一原理,将传统神经网络中的线性权重替换为可学习的单变量函数,从而提高了模型的可解释性。在深度学习领域,多层感知机(MLP)长期以来是标准架构,但因其“黑盒”特性而备受诟病。KAN的出现被视为一种潜在的替代方案,旨在通过数学理论驱动来增强神经网络的透明度和交互性。KAN 2.0的发布进一步优化了其实用性,推动了AI与科学交叉研究的发展。刘子鸣作为KAN的一作,其背景融合了物理学和机器学习,体现了AI领域向跨学科融合的趋势。清华大学人工智能学院的成立和发展,反映了中国在AI教育和研究方面的投入,吸引海外人才回国任教是其中的重要举措。

评论 (0)

登录后参与评论

加载评论中...