【专访】南科大数学系何炳生教授——四十年上下求索

↑↑↑↑↑点击上方蓝色字关注我们!






『运筹OR帷幄』原创

作者:运筹OR帷幄

编者按:

何老师已经年过70,仍然笔耕不辍,热爱讲台。听过何老师课的南科大学生都说,何老师很喜欢写板书,经常写得黑板满满的,配置的课件也做的非常认真。由于使用计算机处理文件的速度,他备课往往需要更多的时间。何老师说,做导师对学生负责,首先是不能禁锢学生的思想。在做研究上,何老师说他鼓励学生当离群的羊,努力去寻找新的水源和草地。提起自己这些年在学术上尤其是在ADMM算法上的科研成就,何老师则谦虚地说,自己的工作成果能被他人用来解决问题,就心满意足了。

最近, 我们采访了何炳生老师。 为了行文方便,我们以何老师为第一人称写了这篇访问报道。

 

扫描二维码关注公众号,回复: 5167890 查看本文章

 忆高考 

我1966年高中就读完了,正准备考大学的时候爆发了文化大革命,最初说半年后还可以考大学,可是半年后文化大革命并没有结束。读中学时我在班上年龄最小,又很能考试,校长和老师们对我都比较器重。有老同学还记得,当我眼睛近视的时候,学校还出钱替我配了眼镜。这里有两方面原因,一是校领导对我的厚爱,另外也是因为我家经济条件比较困难。教我们高三解析几何的薛潮老师,她是学校里最年长的女教师,1966 年夏天我们毕业考试结束,文化大革命山雨欲来,地主家庭出身的她预感到自己不再有上讲台的机会,把自己的由俄文翻译的教学参考书送给了我。那个年代参考书很少,我爱不释手。文化大革命开始,我也参与“破四旧”,后来造反派学生开始把斗争矛头针对校长和一些老师,我就成了“保皇派”。再到后来我成了学校里和“造反派”对立的“保皇派”学生组织的一号头目,原因一直说不清楚。保皇派头头这个“桂冠”本不该轮到我,因为文化大革命之前,我只是高三年级六个班中一个班的团支部委员。是因为成绩好,跟我走的人多,还是互掐中我针对性的大字报写的不错? 1966 年10 月作为学生代表到北京串联之后,看到国家主席都能被打倒,就知道自己“错”了,从此偃旗息鼓。等队伍解散的差不多,我就溜回家种田了。文化大革命的混乱,我离校的时候居然一本念过的书都没有能带回家。

造反派得势之后,作为战果,要整几个“反动学生”,我必须是其中的一个。本来已经在离校20 多公里老家种地的我被押解回学校,关在一个窗户有钢栅的办公室,睡(有地板的)地铺。我成了待宰的羔羊,虽然提心吊胆,但皮肉没有受苦。所幸“造反派”很快分裂成两派,打斗愈演愈烈,以致无暇顾及我。机会来了,在一些朋友的帮助下,我侥幸逃脱。文化大革命开始时当“保皇派”,完全是念着校长和老师对我的好。后来“识了时务”,我也真以为自己犯了“大错”。最消极的时候,认为这一生能在农村安分守己种田就算不错了。 

回到老家当农民,多上的几年学还是有用的。当年在农村,读完高三的我就算是文化程度最高的。慢慢地,农村的基层(生产大队)领导认为我可以帮做些事情,先是让我当了大队团支部书记,年龄大了点以后又让当了大队办厂的负责人。但是,我不能入党。按照文化大革命中的说法,我的家庭和社会关系都有一些问题,爸爸的名字在国民党的花名册上,就连他本人也不知道;姨父是新四军内部的反革命,姑父是叛徒,其实都是不实之词。由于这些问题,我不可能被推荐上大学,不是党员,也就没有上升空间。但是,多一点文化,接受新技术也快一点,在农村我有一种被需要的感觉,上了大学以后的很长时间内再也没有过。文化大革命期间推广华罗庚‘优选法’的小分队到我们县城宣讲,县里的科技干部也通知我去听讲。学习‘优选法’的过程中,我知道了函数只是一种对应关系,不像中学书本上说的总有显式表达式,而是给了一个自变量,能观察到相应的函数值。实际生活中,这种观察往往是代价不菲的。优选法就是要通过尽可能少的观察次数,近似地找到对应最大函数值的自变量。我虽然没有从学校带回书本,但由于工作需要,学过的数理化还常常在脑海里盘旋。 

直到1977年10月,我到刚刚办成正在试产的上海金山石化总厂,洽谈购买他们的试车废料。那是个从日本全套引进的现代化工厂,厂区比较安静,因工作需要我在厂招待所住了几天。那时的招待所大多是一个大房间,随机地安排几个互不相识的人同住。我住的房间是三张单人床,一张办公桌,但只住了两个人。同房间的那个年轻人在做高考数学题,我问他做这些东西干什么,他说马上要高考了,听完后我的心情非常复杂。上大学一直是我的愿望,可是我当时已经超过 29岁,没有听说年近30还能考大学的。除了羡慕年轻人机会比自己好以外,我也安慰自己,心想总可以把自己的孩子培养得好一点,让他们以后圆我上大学的梦。谁知第二天在厂区走的时候,就听到大喇叭播新闻说要恢复高考了,而且66, 67届高中毕业生都可以考,30岁以内,婚否不限。这时候我简直有点惊呆了,有这等好事?赶快去邮局买份报纸看看。知道文化大革命期间的高中生学的东西不多,考试我是有竞争力的。我决定参加高考,当时已经是无锡农村有点像样的大队办企业的负责人,工作不可能马上找人接手。我白天忙于工作,晚上抽点时间复习,资料呢,都是人家主动送上门来的。刚恢复高考,家长们都想让自己的孩子试试,不知道有些家长通过什么渠道弄来一些油印的复习资料,带着子女来问我一些数学,物理和化学的题目,那些题目都不算太难,我基本上都能解答。这个为他人答疑的过程,同时也“复习了我”。那年报名参加考试的人太多,就由地区初考,合格的再参加省里统考。初试成绩不公布,只说过了没有(我现在也没有想通有什么保密的必要)。因为一些家庭社会关系的原因,统考前我填报的是江苏师范学院(现在的苏州大学)数学系,当时的无锡县也属于苏州地区,想毕业后当一位中学数学老师。好在省里把考得好,但没有报考重点大学的考生资料整理了出来,南京大学负责录取的老师就要了我。我很幸运地被南京大学录取,到南京大学数学系就读。那时候我在农村已经干了十几年,对数学的理解也很肤浅,还以为有那种只要今天好好学,明天就能立竿见影派用场的应用数学。

 忆大学 

到了南京大学数学系以后,我们这些老三届的学生是有自己的特点的。虽说原来基础比较好,慢慢地也认识到“数学是年轻人的学问”。好在长期在农村一线劳动的人能吃苦,就像一种惯性,我读大学时最大的特点大概就是用功。

学数学分析的时候,书上有个二元函数在某一点有偏导数,而在这一点函数不一定连续的例子,我怎么也记不住。倒是10多年的种田经历帮助了我,我家在江南水乡,是稻麦两季,水稻要水, 麦子怕渍。水稻收割前, 就把田里的水排掉,让地凉干。待水稻收割后种麦子, 要在地里纵横开沟。为多打一些粮食,这沟开的还有些讲究。沟要开的直,沟底要平,才便于瀝水;也要开的窄,那是为了增加麦子生长的有效面积。精耕细作, 是我30岁以前的那十多年里年复一年的工作。水田是平的,那些开成的沟的纵横交叉处,就可以看成偏导数为零而不连续的点。刚洗净脚上的污泥,我就进大学念数学系,想到这样的例子,是最自然不过的。其实,不管怎样的经历,对人生总会有帮助。

     

外语一直是我学习路上的拦路虎,我中学学的俄语。上了大学以后,因为没什么基础,英语就得从认字母开始,我的英语显然比同学差多了,特别是口语。大学三年级时候,学校开设了“二外”,我当时想着自己年岁大,选拔出国不可能会轮到我,就把刚学了一点的英语丢一边, 再去把中学学的俄语捡回来,二外就选了俄语。

大学四年级以前我没有考虑要读研究生,因为我本科毕业就要接近34周岁了,当时认为出国留学或者考研都是年轻人的事。等到快要毕业的时候,又觉得自己学的东西还解决不了什么问题,心想,是不是要读了研究生,才会有点真本事?前面已经说到,上大学之前,推广‘华罗庚优选法’小分队的报告对我影响很大。上了大学以后,1980年又在南京大学礼堂听了华罗庚教授关于优选法推广应用的报告。当年南京大学的何旭初教授,是国内优化方向的领军人物,也希望我考他的研究生。可是我英语根本考不起来,老师说如果考他的研究生,外语科目也可以选考俄语,这样我才能报名参加硕士研究生考试。

研究生考试主要考一二年级的基础科目,“老三届”的大学生们,前两年的学习还有优势,因此我考研又是比较顺利。考上南京大学的研究生以后又有机会出国学习,这我预先一点都没有想到。我的研究生考试成绩也不是最高,考得最好的是一位女生,她也年龄偏大。南京大学在录取的研究生中,每个系能安排1、2名学生出国留学,这个名额是分配给导师的。何旭初先生名下有一个,在考上他的研究生中他选了我,说不清是不是我也姓何的原因 (当年我父亲说的)。全校有二十几人得到这样的机会,这些人里边,几乎所有人考研究生时外语考的是英语,只要两位例外,考日语的一位和考俄语的我。考英语的都去了美国和英国,考日语去了日本。学校规定我只能在德国、法国和日本三个国家中选一个,因为去美国的学生已经超过教育部要求的比例了。这个时候我最后悔的是,大学三四年级不该去读俄语,而是应该把英语补一补。导师何旭初先生的意见是去德国也很好,并且要我师从德国维尔茨堡大学的 Stoer 教授。 为此,我就得到去上海外国语学院突击学习德语。回想起来,

上大学路还是很坎坷的,但也很幸运,就像走钢丝绳

稍有偏颇,大学对我来说可能就永远上不了了,仔细想想,也觉得有些事情也很有意思。

 在德国 

德语考试合格后我才去了德国。当年,全国来说,最优化也是比较受重视的一个方向——中科院送了袁亚湘去英国跟Powell读研究生,西交大有徐成贤到英国跟Fletcher读研究生,南京大学就送了我到德国Wuerzburg大学跟巴伐利亚科学院院士 Stoer。 Powell, Fletcher, Stoer 都是那时国际优化界巨头。Stoer是当年(1982年)刚刚开过的ISMP会议的主题报告人,他的著作 Introduction to Numerical Analysis是著名的研究生通用教材。导师对我帮助很大,我到德国的时候,是1983年下半年,已经过了35岁,而我的业务水平就是刚刚在国内念完本科。那时中国去的留学生还很少,导师给我安排了一些课程,让我参加讨论班,也给了我一些他们同行交流的预印本(当时还没有电子文档),这些对启发我独立思考非常重要。他根据我的能力,给我合适的题目,容我细细琢磨,大概由于我年龄偏大,导师有意放我一马?到头来,由于我一直在学术界工作,我导师这一生最欣赏的学生中,可能我也算一个(笑)。

我们中国学生比较能做题,德国高年级学生中也不乏强手。记得在德国学习的时候,一次导师出的题目,大概20-30个学生,普遍做的不好。我在习题课的前一个晚上,从学校回家的雪地里,边走边想,用了一个比较简单的办法做了出来,给负责习题课的助教和同学们都留下了深刻的印象。2015年我去德国母校参加一个校友会组织的学术活动,有几个德国同学知道我到了德国,就到母校来看我。其中有一对夫妇都是当年的同学,他们的女儿也念数学,即将大学毕业。这对夫妇还记得当年我让他们刮目相看的那堂习题课,要我回国后把题目和我的解答整理一下给他们,说要用来考考他们自己的孩子。其实那个时候我们中国公派出去的学生,被国内的单位选上不太容易,到了国外学习一般是比较出色的。

在专业学习的同时,为了提高自己的语言能力,我就在系图书馆找德文的书籍学习。对我专业发展影响最大的是Blum 和 Oettli 在Springer 出版的德文专著《Mathematische Optimierung》,其中第六章讲到投影收缩算法,跟导师建议我考虑的投影梯度法很有关系。Blum 和 Oettli 都是苏黎世大学毕业的博士, Oettli 教授生前还接受过我的访问。我后来研究的算法, 完全符合他们的专著中关于投影收缩算法的定义和算法框架,所不同的只是构造了未知距离函数的不同下降方向和步长法则,使得能在计算机上真正实现。出于对历史的尊重和对前人工作的一种敬畏, 我还是把这些方法称为投影收缩方法(Projection and Contraction Methods)。

我研究生毕业回国以后,跟导师还保持着联系。上世纪80年代后期还没有Email,交流还是靠信件邮寄。一次我将自己用打字机打的文稿寄给导师,他自己当时正在学用 TeX 软件写数学文章,索性帮我修改后用TeX打了文本给我,我也从那个时候开始,赶快学用 TeX 软件处理稿件。

在德国留学期间,我妻子在 85 年春节前出了一次车祸,昏迷了三天才醒来,消息还是中学同学写信告诉我的。那时,国家给我们的生活费中,是省不出一张来回机票的。导师知道以后,自己出了旅费让我回家探望,为了让我好意思接受,他说资助困难学生的费用是可以在税前列支的。至今,年近85岁的导师每年寄我一张贺卡。我能怎么报答?惟有忠诚科学,好好工作。学术生涯中,我总想着要对得起 Stoer 的学生这个称号。

 树木育人 

研究生毕业后,我回到南京大学工作。个人经历还在工作中自觉或不自觉地发挥作用。我总认为优化方法是最接地气的应用数学,越是普通大学生能懂的算法才越有用。当年华罗庚教授推广‘优选法’,就是看上了它的简单,一般技术人员就能学会,形成生产力。华罗庚先生深入浅出诠释的优选法,当时的高中生我都能听懂,尝试着在科学种田的实验中应用。现在全民族的文化素质提高了,现在的大学生应该不比过去的高中生少。从我们计算数学专业的优化工作者来说,要把着眼点放在提出一些一般大学生和工程师们都能听懂,并在实践中应用的方法,才有可能变成一种生产力。

我的这些观点,可能也会耽误一些研究生。 所以,等到自己有资格带博士生的时候,我就再也没有招揽学生到自己门下就读,也不强求学生做什么。

 

按照学校的规定,研究生要在老师毕业(喔,那应该叫退休)之前毕业,因此过了62岁就不能再招研究生。几十年来,庆幸自己能当一名大学老师,与研究生生日常交流也能迫使自己不断学习,更新知识。也就是在8年前的2010年,不能再招收研究生的时候,我写了一个关门感想,里面说到我带学生的心理负担,我给你读一读:

“自己可以一事无成, 就怕耽误门下学生”

 

 科学研究有一种不确定性,需要一颗奋发向上的心,更需要一颗平常心。兴趣是最好的导师,自己觉得有意义,就去做,能不能做成是另外一回事。有人觉得某个方向人家已经领先,我做不过别人,不能当第一就干脆不做,我认为有点过分功利。科学研究的结果不是能预先规划好的。

带研究生还是有一定责任的,社会上都认为‘跟了一位好老师,学生以后一定能怎样怎样的’,其实学生跟着老师做的东西,还是一个阶段性的成果。评价一个人的研究成果,还要看他离开导师后能不能做出一些独立的工作。学生在读期间,受老师阶段性的兴趣影响,有的能做出一些好的结果,有的并不出色,这些都无所谓,不能以此来评判一个人的科学贡献。说一句大话,我觉得我在中国优化界还是独立做出了一些工作的(笑)。除了交替方向法方面的理论和算法的系统成果以外,我20多年前提出的一类投影收缩算法,近10年在工程领域也得到了很好的应用,起到了其他算法不能替代的作用,救了人家的急。

我自己不招学生以后,还建议自己有了资格的学生晚一点招或者少招一点研究生为好。我们毕竟不是直接做工程的,自己没有好的想法会影响学生的发展。不带研究生,研究做得比较低迷是自己一个人的事情,但当时能带学生时,

我常担心自己的研究课题,能不能给学生带来足够有益的训练。

学生自己一定要有好的眼界,能把遇到的问题看透,当然这个能力不是一天两天培养的。比如做题,大家都做出来了,但有的人几步就做出来了,条理清晰,有的人写了很多,把老师都绕糊涂了,虽然分数一样,却是有区别的。因此我在改完考卷后一般都要自己再看一看,有好的思路的,有点笔误也不计较了。在我的新工作单位南方科技大学,新生入学不是马上分专业的。一年级想读数学分析的学生很多,就设了一个选课分级考试。我不仅希望看到分数,更希望看到学生怎么答题的,据此给学生更合适的建议。对学生自己来说,了解自己适合做什么,非常重要。我觉得,一个考试题没有答完,学生应该没有理由去争该得多少分。

说到创新,数学研究实际上还是个体劳动,不要把研究人员往一条道上赶。当然最好是几个有共同意愿的人,互相激励,小范围讨论,擦出一些思想的火花。一般来说,不是让某个人去组织某个团队把某个问题解决了。我们不是做工程的,很难去分配任务。在学校教书做研究还比较容易,而解决工程界的问题往往是有难度的。我特别鼓励我的好学生到国防科研第一线,默默无闻为国铸剑。我的好学生中,有在咱们国内的重要研究所工作的,也有在国防科研单位的挑大梁的,我特别支持他们!我虽然是一个动手派,但是已经没有精力真正弄懂工程问题。工程界的朋友用我的方法解决了问题,说了几句公道话, 我特别感谢。

我们培养创新人才,从数学的角度来说,无非培养学生具有独立思考的精神。要引导学生看清问题的本质,反复琢磨。我大学同学中优秀人才很多,特别是搞基础数学的,在本专业计算数学的同学中,我的个体条件也比较差。最终我还做出一些或许能留下痕迹的东西,原因是我在研究的“入口”处多站了一会,仔细考虑了我能做什么,什么样的方法容易被相关学科采用。我们做优化方法,不是去解决一个具体的问题,而是希望我们做的方法,不同应用领域的能拿去解决实际问题。能做到这一点很不容易,这只能算是我们计算数学工作者可遇而不可求的希望。所幸我现在在一定程度上做到了。在数学研究中,有人不提倡领头羊的说法,我也同样认可。可以有一些散羊,如果一群羊都跟着领头羊跑,哪怕找到新的草原和水源,大家也吃不饱,有一些散羊,散开了走,自己去找路,当然散羊面临更严峻的生存问题,可能在半路中渴死了、饿死了,如果有几头散羊找到新的草原和水源,就是不小的成功。对整个学科发展来说,思想的自由是非常非常重要的。

我认为通过考试阅卷可以发现一些好的苗子。学生做得好的卷子,感觉就是到了多一个字太多,少一个字又太少的水平。养成这种习惯,具备这样的能力,对自己以后发展是很有帮助的。此外,我还是主张本科生的学期考试要有一个具有挑战性的题,让好学生也需要流点汗的题。对于我自己的工作,我说的是

“文章能否站住脚,弟子曾否被误导,算法是否真有效,余生哪能不思考。”

 

 潜精研思 

我研究的第一类算法叫做变分不等式投影收缩算法,这个我从38岁做到了48岁,做交替方向法时候我已经49岁了,做到59岁,接近60了。粗略地说,我是30岁读书,40岁念完,40岁到50岁之间在做投影收缩算法,50岁到60岁,我做ADMM这一类算法,也就是凸优化的分裂收缩算法。以后呢,60岁也快退休了,突然发现学者们对这些工作比较重视了,这个时候相比其他学者,我有了比较好的研究基础,所以后来在这个方向做的比较顺手,得到一些比较经典的理论结果,并且提出了一些新的算法。

我是在变分不等式框架下研究优化方法,有时候大家一听到变分不等式这个名字就会觉得难,其实变分不等式就是“瞎子爬山”的数学表达形式。大学生都知道,在中学求二次函数的最值,一般都用配方的方法,到了大学后,用了求导法则,二次函数求了一次导变成一次函数,那么用变分不等式处理优化问题,就像是学了微积分用求导数来求二次函数的极小点一样,这样会方便很多。

我做的优化算法又都跟邻近点算法有关系。邻近点的思想是,在探索的前进道路上,下一步不要离开当前点太远,也就是“饭要一口口吃,路要一步步走”,看似保守,把握却大一些。我做的研究所要的基础知识,只是普通的大学数学和一般的优化原理。理论证明过程中用得最多的是 Cauchy-Schwarz 不等式,矩阵和向量的基本运算以及中学就学过的余弦定理。

说起来,ADMM其实也有二十几年的历史了,我在做ADMM之前,有十多年是做投影收缩算法的。投影收缩算法其实也是一种分裂收缩算法,采用预测-校正的策略。能比较自然的接受这种思想,跟我离开农村的前两年负责一个根据用户要求按图加工非标准设备的工厂。这些设备并不精密,但个体大,制造工艺不是太容易。因为是非标准件,做好每个设备都要动点脑筋。和几个能工巧匠商定方案以后,就把工作分解给相关的工人(小组),各个部件做成之后再整合。这使我养成了一种比较自然的工作方式,这种工作方式也影响到了我做应用数学研究的思维方式。那就是,分解降低难度,整合把握方向。

提出交替方向法的人,都是从求解微分方程出发。我们看懂了这种方法后,觉得可以用来求解具有可分离结构的优化问题。投了一些稿子,其中有的还到了交替方向法创始人之一 Glowinski手里审,他很高兴,说真不知道交替方向法(也就是ADMM)还可以用来求解优化问题。交替方向法有两个起源,其中一个是从上世纪50年代就已经开始了,直到70年代底证明了收敛性,用的是算子理论,那个方面的知识我到现在还比较生疏。说实话,对于交替方向法,我是看懂了Glowinski 上世纪70年代发表的文章,看懂后我就认定,这个方法用来求解结构型优化问题是会有作为的。 擅长算子理论的,他们最近有篇题为“Suevey: Sixty Years of Douglas-Rachford”的综述文章,我也只能懂个粗枝大叶。或许是他们看懂我们的更容易,这篇“DR 60年”的综述文章,分别引用了我和袁晓明2012年以来发表在SIAM NA, Numer.Mathematik 和 Math.Programming 上关于收敛速率的三篇文章,说我们给出了简单的证明。我要说的是,我们这三篇论文,加起来还不到30页!简单,他人才容易看懂采用,有利于扩大影响。统一,回顾起来才清清楚楚,自己也有美的享受! 

2018 年初,中文版的《运筹学学报》发表了我的“我和乘子交替方向法20年”。这篇自成体系的文章,基本上总结了我近 20 年的工作。

交替方向法一个很重要的理念是‘化繁为简’,在每步迭代中把原本无从下手的问题分解成容易求解的子问题。我开始搞交替方向法是1997年,当时这类方法并没有引起足够重视。我觉得这种思想方法重要,又跟我97年以前做了十多年的投影收缩算法有密切的关系,就沿着这个方向去做。到了2006年,我准备结束这个课题研究的时候,发现这些工作在信息科学中用处很大,又重燃了我新的研究热情。当时国际上已经开始用一些分裂方法求解信息科学中的问题,我读了一些文章,觉得人们用的交替极小化方法应该都比不上交替方向法,因为后者让对偶变量(Lagrange 乘子)也参加了迭代,犹如诚意谈判也要考虑对手的感受(这可能也跟我上大学之前在小企业负责,要跟甲方洽谈有关)。当2009年华东地区运筹学博士生论坛请我做大会报告的时候,我就讲信息科学中的一些问题和交替方向法(ADMM)求解。这个会议以后,Stanford大学的 S.Boyd 教授(他在2017年当选为中国科学院外籍院士)在2010年写了一篇关于交替方向法的综述文章,其中提到了我们 2000年的工作,由于他的宣传,国内外就有不少学者知道了我们在交替方向法方面早就开展工作,并关心我们的后续研究。

我们从变分不等式的视角出发提出的一些方法,形式特别简单。我现在工作单位南方科技大学数学系的一位老师去英国访问,参加会议,不经意间发现第一位报告人讲的方法,就用一个 PPT说是用了我和袁晓明在2012年提出来的变分不等式的邻近点形式(Proximal Point Form)。

在学校里的工作还是比较单一,最令我高兴的是没有人规定我应该做什么研究。我没有思想可以向学生灌输,也不屑把时间花在争论哪个重要上,愿意把时间花在反复琢磨自己感兴趣的问题上。过去我的在读学生往往会问我,到底做什么好,我总会跟学生说,我自己都不知道做什么好,只能告诉你我做成了什么和现在正在做什么。因为我也听一些著名数学家说,他们也不一定知道明天该做什么。通常,我会建议我的学生去看看世界数学家大会上与我们研究方向关系密切的哪些学者在作报告,能不能看懂他们的报告?看不懂的话,再去浏览一下他们的主页,看看能不能跟他们的研究兴趣找到共同点。当年说这个话的时候,我根本没有想到,2006年以来的四届世界数学家大会,都有大会报告人在他们的文章或讲义中提到了我们的工作。世界“数学规划”会议上,Plenary Speaker 在报告中也提到我们 ADMM 方面

“Best known convergence rate”的工作。

对近代最优化发展,我经常讲几个里程碑,上世纪40年代中期的线性规划的单纯性算法,60年代的拟牛顿法,80年代的内点法,我总是把它归结为20年一个阶段。要是这么推算的话,到2005应该出现新的里程碑,但实际上没有一个代表性算法出现。其实在2005年后,信息科学的发展,对我们优化提出了新的要求。由于信息科学的发展,我觉得ADMM是被学术界最认可的一个重要优化方法之一。ADMM算法,本来是用来求解具有两个分块结构的优化问题的,要是用来求解具有三个分块结构的问题会怎么样?大家本来以为也可以做的,前几年我们才给出了否定的答案。在这以前,我们就给出了保持 ADMM优秀品性的求解多个分块结构的问题的修正方法。我们的方法的特点是对原问题的假设不加任何条件,这些方法一发表,很快就被加州大学洛杉矶分校 Osher 的课题组采用。

学界似乎对算法的理论结果更加重视。我们关于ADMM方法收敛速率的文章,发表以来一直被广为关注,SIAM 系列的各个期刊都会根据文章再过去一年中被下载的次数排个序,列出前20篇文章。我们这篇文章在 Numerical Analysis NM 的热点论文前10。

中国科学院文献情报中心科学计量中心也有个《中国热点论文榜》,每个学科在前五年发表的文章中按引用次数选 10 篇论文。中国数学界的 2012-2016年期间的热点论文,袁晓明和我的这篇论文排名第一。 我的看法是,大数据,当然首先是看数据。有了数据,一定要分析,对数据去伪存真,去粗存精,否则,数据就有可能误导人们。

当自己认为很好的工作没有得到足够重视的时候,也应该以平常心对待。即使是一个不错的东西被越来越认可,曾经说过风言风语的也不太可能歇手。这个时候,就用得着Max Planck 的一句话 :

“一个新的科学真理取得胜利,不是通过让它的反对者信服,而是随着这些反对者的最终老去,熟悉它的新一代终究会成长起来”

年轻学者往往会抱怨自己结果不错的文章很难发表,其实大部分学者都有这个困扰。能发好杂志当然很好,现在网络信息传播很快,我们的被国际著名学者引用的结果,都是在正式发表之前。Osher 课题组采用我们的方法求解三个可分离块的问题,提出原始-对偶一阶算法(图像学界也称为 CP算法)的Chambolle 和 Pock,他们那些说了我们许多好话的文章,引的都是我们贴在 Optimization-Online 上还没有正式发表的文章。我们的几篇有较大影响的论文审稿周期都比较长,做研究真的要有比较好的心理素质。只要结果实在,事隔多年人家也会发现,Boyd他们的ADMM综述文章引用的我的文章都是 JOTA 上发表的。

 传道授业 

由于交替方向法被越来越重视,最近几年,邀请我参加学术交流的单位也比较多。我自认为以变分不等式为工具,用两块黑板,两个小时,就可以把交替方向法连同其线性化方法讲明白。

2018年的暑假,是我跨越古稀的那个月,我应邀参加了好几个讲习班,做了不少讲座。我在 70 周岁那个暑假的工作,一定是值得自己日后回味的。

第一站是7月15日在湖南第一师范,湖南第一师范现任校长童小娇是我的博士后,她说我在这个培训班上 “圈了不少粉丝”,我说那得感谢你们提供了机会。的确,有人说已经读过我们的大部分论文,参加一些会议想见到我又没有见到,这次培训班终于如愿。学员中有自己就在讲授凸优化的老师,表示一定会在以后的课程中讲授我们的成果,学员中也有从国内名校毕业的博士,他甚至认为,几十年过后,我们凸优化方法的统一框架会走进教科书。

过誉的话,我照单全收。当然只能当成年轻人的祝福,到底有几分价值,只能由时间来检验。

童小娇告诉我,培训班结束,学员总结几乎都提到听我课的收获。对年轻人有益就好!

我在湖南第一师范的课,因为第一天有开班仪式,第二天有专家报告,前两天我每天讲3小时。的接连三天,我上下午都讲,每天讲6小时。讲课的,只是体力劳动; 听课的,是实实在在的脑力劳动。认真听课的学员,要动脑子消化,其实比讲课的还辛苦一些。

第二站是7月25-26日在西安交通大学,每次讲三小时。有学员拍了张我讲解交替方向法的照片。看得出来,由于设施符合心意,我讲的很投入。虽然神态并不优雅,但那总是我真实的一瞬间。我喜欢大黑板加颜色粉笔,有了这些,我就有了自己的标准讲法。对讲解效果,自己心里就已经有了底。 三小时不到,刚好把我准备讲的写满六黑板。照片上的我在想,还有点时间我干点啥。

第三站是南京理工大学,计算机专业的部分研究生关心算法的应用,我的演讲则注重给学员讲一些方法的机理。在黑板上勾勾划划,说明这些方法的原理是非常简单的。掌握这些框架原理,做工程研究的就能够根据自己碰到的问题去设计适当的算法。事成之后,一定会变得更有成就感!个别参加暑期班的博士生,知道我会到暑期班上讲课,带上从我主页上下载的讲义资料向我请教。到各地走走,总发现有人关注我的主页,日后我会对自己的主页好好维护和更新。在南京理工大学讲完最后一堂课,部分学员和我合影留念。

我在ADMM类方法的研究,在相关领域也有一定的影响。《图像处理和数字医药国际会议》已经两次邀请我去交流。 2017年的第一届会议他们让我做了个报告,2018年的会议组织者让我来给个系列讲座。这个理工医的跨学科的《图像处理和数字医药国际会议》邀请了一些老外牛人,有美国、英国、法国和荷兰等国家的一些院士。三天的会议让我做四个半小时的讲座,也是有点太抬举我。组织者和我都没有想到有这么多人来分会场听我的讲座。有次开讲前座位就已经被占完,后来的人就只能站在会议室门口,听课的有在读研究生,也有博士毕业的教授和副教授。

 

做讲座,传授知识,宾馆,PPT加白板,效果哪里抵得上教室加黑板 ?

我讲一个半小时,站的人就站了一个半小时。图片上可以看出,他们往白板越走越近,是因为挤,也因为真心想学。其实,我已经把讲稿的 PPT 发到了他们的手机里。不过,数学的东西,黑板上推导更好一些,便于听众理解。有的与会年轻老师跟我说,他们做图像的都在用这些方法,整天就在调参数,不懂所以然,听听我的讲座对以后的研究工作会有帮助。

感谢诸多单位给我提供机会,让我在过70岁生日的暑假做了些有意义的科普。能否把在数据科学和人工智能中有用的一些算法,用通俗简单的语言,给有点微积分基础的大学生们讲明白?我常常这样想,也这样努力着。

圈子里的人知道我喜欢说笑话,有同学认为已经超出了一个学者的界。我就用哲学家周国平的话为自己辩解:“我厌倦那种永远深刻的灵魂,它是狭窄的无底洞,里面没有光亮,没有新鲜空气,也没有玩笑和游戏。博大的深刻不避肤浅。走出深刻,这也是一种超脱。”

年纪大的人,喜欢唠叨。接受你们的采访,讲了这么多,无非是想跟年轻人说,不骄不躁,总能做出些有益的工作。

最后,在这篇专访截稿之前,何老师和他早年的学生袁晓明教授共同获得 2018 年度 教育部自然科学二等奖的消息刚刚公布。由衷地恭喜何老师。何老师得奖后写的感想,读后很有启迪,也附上跟读者分享。

吾复何求 ? ! 致谢朋友

2018年度的高校科研优秀成果奖近日公布了。我和我早年的学生,香港浸会大学(去年已经到香港大学当教授)的袁晓明联名申请的《交替方向法的理论与算法研究》,得了教育部自然科学二等奖。  

2018年已经是我这一生第四次报教育部奖了,前三次都没有成功。这两年朋友劝我再报,的确,年岁大了,能否得奖,于己意义已经不大,但数学系成果统计需要聚沙成塔。报奖要准备一本不薄的文本,我看了提纲头就发麻,那么多手续和材料,凭我的能力哪里能够办到 ! 感谢部分学生,以及学生的学生,是他们帮助收集和整理材料,古稀的我,是实在没有这个精力了。   

是的,我相信自己成果的含金量。几届世界数学家大会报告人,斯坦福,伯克利,加州洛杉矶分校的美国院士们,都在文章里毫不吝惜地说了我们许多好话。美国工程院院士、中国工程院外籍院士,斯坦福大学 Boyd 教授的团队搞的求解器软件包,材料中也明白写上参考了我们的策略。国际上众多知名学者赞扬我们简化问题的方法,同事到欧洲参加个会议,不经意间也发现人们在 PPT中介绍我们的算法框架。有了真材实料,也要能按规格整理成“八股”文本呀!

欧美学者称赞我们的研究工作,我最在乎的评价是两个字 — 简单,除此好像也没有其他的美言好话。简单,是我们研究工作的特色,也是灵魂 ! 因为简单,工作才在国际上引起较多的注意。

这次报奖主要是我和袁晓明在交替方向类算法方面的成果。我个人早年在投影收缩算法方面的基础,使得我们近20年交替方向法的研究特别顺手。投影收缩算法本身,近10年在工程领域也得到了应用,起到其他算法不能替代的作用,以下颇具代表性的两例应用让我深受鼓舞。

机器人控制里边有个特定的优化问题,要在三毫秒内给出结果。中山大学的教授和他的研究生们试用MATLAB库里的办法都不能满足要求,说是用我20多年前提出的求解线性变分不等式的方法才解决了问题。他们发的系列论文和出的专著都引用了我的文章,主持这项研究的教授现在是广东省珠江学者冠名教授。

中国科学院武汉岩土力学研究所的国家重点实验室副主任,用文献中宣传得比较多的方法求解一类接触力学问题,让学生做,说是消耗了几届博士生。后来他们发现了我 20多年前的文章,让我去讲一讲,简单的方法很快就学懂了,由此解决了困扰他们多年的问题。项目负责人到欧洲讲学,还用几幅附上我照片的 PPT,向同行介绍说是用了我的算法。有关工作他们还计划做成相应的商业软件。

尺有所短,寸有所长。优化界前辈 R.Fletcher早就说过,世界上没有一个算法是对所有问题都是最好的。我的算法能找到应用, 体现价值,完全是因为简单。工程界采用我们提供的算法,我却没有精力,去真正弄懂他们的问题。从这点上说,我还真得好好感谢那些用了我们的方法又说了实话的学者。

我是做优化通用算法的数学工作者,能在有生之年看到自己的方法被他人用来“救急”,解决一些他们原来解决不了的问题,吾复何求 ! 吾复何求 ?

我三十岁才上大学,既没有家学渊源,又不是聪慧过人。同是 77级大学生的李国平先生的儿子就说过,老三届 77 级读数学的几乎全军覆没。我认为前面要加个 “从农村出来,上大学之前就有了老婆孩子的” 这个定语才准确。知道自己不是念数学的料,那是到了大学三年级的时候。硬着头皮考研究生,不是因为有数学抱负,能把老婆孩子的户口从农村迁到城里,也是一份考量。

感谢南京大学何旭初先生根据我不错的考研成绩(其实主要考大学一二年级学的数学分析和线性代数),坚持送我出了国。感谢德国导师 Stoer 教授给了适合我能力的题目,宽容地让我慢慢独立思考,引发了我后来系列的研究工作。虽然我们在大学里也以悬梁刺股的精神学习,毕业后也兢兢业业工作,但毕竟丢失了读数学的黄金年龄,取得一些微薄成绩,运气的成分也很重要。

跨越古稀的那天,收到导师祝贺我生日的邮件。来信中他用德文说,人生70一定是回顾一生成就和困苦的好时机(70 Jahre geben Ihnen sicher Anlaß,  auf Ihr gesamtes Leben mit allen Erfolgen aber auch Schwierigkeiten zurückzuschauen)。

困苦就没有必要说了。回想起来,唯 “二” 不安的是下面两条。

一是儿女年幼,需要爸爸照顾和陪同玩耍的时候,我却常年独自在外读书,把孩子丢给只读了小学,在农村终日劳作的他们的妈。虽然儿女们长大后也都考上大学,自己找了工作,我总觉得年少时缺乏父爱的孩子,长大后身上缺些什么。

二是初当导师时没有把自己才学疏浅的情况跟学生反复强调说清楚,招了一些南京大学的高材生当自己的研究生,否则,他们或许会发展的更好。这方面我在学术生涯后期就做得好一些。

                                   何炳生  

初稿于2018 年 12 月 25 日 教育部高等学校科学研究优秀成果奖公示之际

修订于2019 年 1 月 25 日 教育部高等学校科学研究优秀成果奖公布之日。

—— 完 ——

猜你喜欢

转载自www.cnblogs.com/Eufisky/p/10374760.html
今日推荐