|
|
|
|
|
纽约州立大学石溪分校帝国创新教授凌海滨全职加入西湖大学 |
|
|
2024年6月,在西雅图召开的CVPR会议上,凌海滨偶遇了博士同窗郑冶枫。彼时,郑冶枫已决定全职加入西湖大学,正着手筹建医学人工智能实验室。
“海滨,我下个月就去西湖大学了。”郑冶枫开门见山,“你要不要考虑一起回国?”
这句话,如同一枚石子,精准地投入了凌海滨平静的心湖。在美国学术界深耕十五年,从博士生一路成长为资深教授,他确实开始思考人生的下一篇章。
郑冶枫的邀请来得恰逢其时。
2025年3月,凌海滨初次踏进西湖大学的校园。在云谷校区,他背着重重的书包,快步穿行在实验室之间,与一众已经入职的PI深入交流,看到了正在建设中的实验室、充满活力的年轻面孔,凌海滨心中已然有了确切的答案。
2025年夏,纽约州立大学石溪分校帝国创新教授、IEEE Fellow凌海滨全职加入西湖大学工学院,受聘讲席教授,牵头创立智能计算与应用实验室。
数学带来的正反馈
这不是凌海滨第一次“换地方”生活了。
18岁之前,他跟随父母,生活在贵州山区。谈及家乡的偏远,凌老师担心我们没听说过,特意补充道,黄果树瀑布你们知道吧?我家就在附近。
贵州安顺,60年代初,是国家三线建设中很多厂矿的所在地。为了支援国家建设,父母从祖籍湖南举家搬迁至贵州,年幼的凌海滨在安顺的工厂里度过了平静的童年时光。父母投身于车间的忙碌,对他的学业顾不上太多。母亲对成绩比较关注,考试考不好,便会重重地批评几句,但也仅限于此了。辅导学习是奢侈的,从解题到学习规划,路径都得靠自己摸索。
小学,老师在讲解循环小数时,凌海滨提出一个困扰自己的问题:“1/3等于0.3的无限循环,三个1/3相加等于1,那么三个0.3的无限循环相加得到0.9的无限循环,它和1之间是什么关系?”受限于山区教育资源的匮乏,这个小小的追问,“难”倒了站在讲台上的年轻老师。
到了初中,凌海滨对数学的兴趣逐渐变得清晰。“感觉这东西有‘想头’,像游戏一样可以琢磨。”他这样形容。解题的过程带来直接的愉悦感,想出解题方法、考试获得高分、得到老师表扬,形成了一个正向反馈循环。他用自己的研究领域做比喻:“在强化学习里,这叫奖励机制。你尝到甜头,就更有动力投入,自然就越做越好。”凌海滨并不将此归结于特别的天赋,而相信是兴趣加上一点努力所带来的结果。
于是,晦涩难懂的数学题,成了他眼中有趣的游戏。凭着这股琢磨的劲头和乐此不疲的练习,凌海滨自然而然地走向了数学竞赛的道路。高三那年,他便拿到数学奥林匹克冬令营的资格,提前保送北京大学。
“当时,在北京大学和清华大学之间犹豫了一下,班主任的儿子在北京读书,听他说北大环境比较宽松,就选了北大。”凌海滨这样描述选择大学的原因,对大学、对北京的模糊概念,只能靠返乡人带来的一点点消息,就这样,“小厂青年”懵懵懂懂地踏入了燕园。
从西南山区到未名湖畔,跨越的不仅仅是地理距离。
“第一学期数学摸底大考,班上几个拿金牌的,半个小时交卷了,我到最后都没做完。”他回忆道。当时北大每年都有学生因无法适应巨大的落差而陷入自我怀疑,严重的还会出现心理问题,凌海滨也去探望过生病的同学。谈到如何面对落差,他说:“接受就好,只要自己努力了,能做到多少算多少,不需要勉强自己。”
这种“接受现实,专注当下”的态度,后来成为凌海滨面对许多人生选择时的性格底色。
在热门的浪潮外
在北大完成从数学到计算机的专业跨越后,凌海滨开始着手选择博士研究方向。
2000年代初,当生物信息学凭借人类基因组计划的东风成为学术界的绝对焦点时,他却选择了一个在当时看来颇为“冷门”的方向:如何教会计算机识别形状多变的树叶,属于计算机视觉的研究范畴。
“那时候生物信息学有多热?”凌海滨回忆道,“一位刚入职的教授,已经有几十篇顶刊论文,也发了Nature,他的课连过道都站满了人。”整个学术界都在追逐基因测序的浪潮,顶级期刊上相关论文层出不穷。
凌海滨也曾尝试接触过这个热门领域。“我去听过那些课,但说实话,我听不进去。”那种感觉,就像他后来描述的,有些问题虽然热门,却无法真正点燃他内心的好奇。一位刚找到教职的师兄坦诚相告:“学术界的热点变得很快,你现在跟风,等四五年后毕业时,这个方向可能就不热了。”因此,他选择跟随自己的兴趣,研究树叶识别这个“小而美”的问题。
博士期间,凌海滨跟随导师与美国史密森尼博物馆的植物学家合作,为野外考察的专家开发一个辅助工具:拍一张树叶照片,就能快速鉴定它的种类。这个任务最大的挑战在于树叶形状的复杂多变性。同一种树叶,在不同季节、不同树龄、甚至不同部位,其轮廓、大小以及是否带有附属的小叶片都有可能天差地别。传统的图像匹配方法在面对这种“非刚性形变”时,显得力不从心。
如何为这些变幻无穷的树叶形状,找到一个稳定、可靠的描述方法?
凌海滨最初的灵感,源于对“距离”这一基本概念的重新思考。他打了个比方:要描述一个形状,最基本的就是描述其上各个点之间的关系,而点和点之间最直接的关系就是距离。但问题来了,如果直接用两点间的直线距离(即欧式距离)来测量,结果会极其不稳定——比如一片枫叶的两个叶尖,当叶片卷曲时,它们在三维空间中的直线距离很近;当叶片舒展时,这个距离又变得很远。计算机无法理解这其实是同一片树叶。
很快,凌海滨找到了解题方法。他为“距离”加了一个巧妙的约束条件,创造性地提出了“内距离”这一概念。想象一下,你不是在空中测量两个叶尖的直线距离,而是要求测量的尺子必须沿着叶片的内部来走。这样一来,无论这片树叶如何弯曲、折叠,只要它的拓扑结构没变,那么其内部两点间的“内距离”就保持了相对的稳定性,更进一步,在此基础上构建的形状描述也能保持相对稳定。无论树叶在四季变化的影响下如何形变,计算机都能精准识别它们的种类。
这个始于“如何识别一片树叶”的朴素思考,最终结晶为“内距离”理论,成为凌海滨叩开学术界大门的重要研究成果之一。而当时的他或许没有料到,这把为解决树叶识别而打造的“新尺子”,很快便量出了远超实验室围墙的广阔天地。
凌海滨在院子里种下一棵小树
就在凌海滨博士毕业前后,生物信息学领域的教职市场开始趋于饱和,计算机视觉这个曾经相对“冷门”的方向,正开始积蓄变革的力量,逐步走向人工智能舞台的中央。而几乎在同时,他博士期间的研究竟意外地催生了全球第一款手机植物识别APP——LeafSnap。这款应用迅速走红,被CNN等主流媒体报道,成为后来无数识花应用的先驱。一个始于兴趣的研究,就这样走进了千万普通用户的生活。
LeafSnap官网
这段经历也成为了凌海滨学术生涯的一个隐喻。有时候选择那条看似冷清的小路,反而可能通向更广阔的风景。重要的或许不是追逐当下的热点,而是找到那个真正能点燃你好奇心的问题。
巧解目标追踪难题
博士毕业后,凌海滨便将“解题方向”聚焦在计算机视觉领域,主攻动态目标追踪这一难题。这不仅是安防监控中的关键技术,更是医疗影像、AR/VR手势交互等诸多领域的底层支撑。
今年暑期热映的电影《捕风追影》中,成龙饰演的老警察有一幕令人印象深刻。在监控室面对数百个实时画面,他仅凭嫌疑人变换服装后的几个细微动作,一个习惯性的耸肩、一次独特的步态节奏,就能在人群中重新锁定目标。这一出现在电影作品中的虚构情节,正是凌海滨团队一直攻坚的难题所在:如何在动态变化的视频中完成对目标物体的追踪。
与电影中依赖经验的刑警不同,现实中的技术挑战要复杂得多。凌海滨团队研究的是难度最高的“通用目标追踪”:用户随手框选视频中的任意物体,可以是一只钢笔、一个水杯,亦或是人物的一片衣角,AI都必须能在后续每一帧中持续锁定它,即使目标被他人遮挡、短暂地离开画面再返回、甚至在光线剧烈变化的极端环境下,依然要保持稳定追踪。
这对人眼来说或许不算难,但对AI来说,却需要大量的训练和精确的测算。凌海滨解释了其中的技术细节。
视觉目标追踪的本质,是为动态目标建立一个不断更新的“坐标轴”。在最简化的场景中,假设人脸在画面中的大小和比例固定,那么追踪就可以简化为寻找一个二维点(X,Y坐标)。此时,每一帧的任务就是从图像中解算出这两个数字。当目标结构更复杂时,坐标轴的复杂度会急剧上升。以追踪手部关节为例,若定义16个关节点,每个点有X、Y坐标,那么每帧图像就需要解算出32个数字。如果追踪的是一件衣服就更难了,因为衣服是柔软的,那就需要用10×10的网格来描述它的曲面,坐标轴方程就变成了200个数字(100个点×2),每帧画面的计算量都会显著上升。
更进一步,如果要追踪一把已经进入患者体内的手术刀呢?不仅要追踪它的位置,还要知道它的旋转角度,那么状态至少需要包含X、Y和旋转角θ。在三维空间中,则需扩展为包含三维位置(XYZ)和三维旋转的6个或更多变量。
因此,视觉追踪听起来通俗易懂,被影视作品演绎的神乎其神。但它并非一个单一的技术,而是一个根据目标属性(点、刚体、柔性体)和应用需求(只需位置,还是需要全姿态)来定义不同复杂度,并持续通过图像匹配来求解方程的系统性框架。
从锁定屏幕上瞬息万变的物体,到追踪体内柔性的导管,目标跟踪技术正在为机器赋予一双能够像人类一样持续观察的眼睛。早期依靠精确的数学模型,如今借助深度学习与大模型,凌海滨团队让AI学会了动态学习、轨迹预测与综合判断。他们的研究,让机器之眼看得更深、更稳,从而更懂这个充满未知的动态世界。
凌海滨与学生合影
西湖新章
从石溪到西湖,并非一次简单的职场转换,而是一位顶尖学者在经过严谨的实地考察后,为自己学术人生的下一阶段,主动选择的最优实验场。
“传统AI方向已非常成熟,真正的突破需要新的探索。”他认为,像AI for Science,如量子计算这样的长线探索,需要时间与宽容度。“在这儿,我觉得有更多的自由度和包容性,学校也非常支持。”他希望在西湖,既能深耕计算机视觉追踪等领域,也能从容拓展那些眼下未必出成果、但未来可能很重要的交叉方向。
凌海滨将自己的研究风格概括为“一体两面”。一面是好奇心驱动的自由探索,喜欢做让自己觉得有意思的、跟别人做法不一样的东西,他享受学术界对“稀奇古怪想法”的包容。另一面则是问题驱动的务实求解。他主导的“智能投影”课题,让投影仪摆脱白墙限制,智能补偿复杂背景的色彩与几何变形,未来可应用于博物馆导览、家庭助老等实际场景。
关于做研究,面对当下焦虑迷茫的年轻人,凌海滨给出的建议格外朴实:破除对“绝妙想法”的迷信。
“你能想到的,别人也能想到,关键是怎么把它做出来。”在他看来,重要的不是找到一个无人触及的领域,而是在选定的方向上持续深耕,培养“往下深挖”的能力。这种在未知领域持续探索、直至解决问题的能力,才是科研训练最核心的产出。
凌海滨与西湖大学智能计算与应用实验室成员合影
从贵州山间到未名湖畔,从马里兰实验室到西湖大学讲台,凌海滨始终保持着一种“自洽”的节奏。在他身上,那份始于一片树叶的、对世界进行智能解析的好奇心,那份从数学中滋养出的精确与耐心从未褪色。
正如同里尔克在《给青年诗人的信》中所言:“耐心对待所有尚未解决的事情,试着去爱问题本身。”
如今,在西湖的山水之间,凌海滨正带着这样的心境继续前行。不去追逐转瞬即逝的风口,而是选择深挖一口井,静待泉涌之音从深处传来。
(原标题:纽约州立大学石溪分校帝国创新教授凌海滨全职加入西湖)
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。