Eufisky - The lost book

AMSS

1. LSC, Academy of Mathematics and Systems Science, Chinese Academy of Sciences, Beijing 100190, P. R. China
2. School of Mathematical Sciences, University of Chinese Academy of Sciences, Beijing 100190, P. R. China
 
1、数学与系统科学研究院2017年重要科研进展(1)---著名PID控制器的理论基础与设计方法
 
具有百余年历史的著名 “比例-积分-微分(PID, proportion)” 控制器,由于其结构简单、不依赖被控对象具体数学模型、且鲁棒性强等突出优点,是迄今为止实际工程技术系统中应用最为广泛的控制器,例如,95%以上的过程控制迴路都是基于PID控制,90%以上航空航天控制迴路也是基于PID控制。此外,PID控制器的影响已经远远超出自动控制领域自身,涉及到科学技术领域中各种各样需要进行反馈调控的系统或对象。然而,长期以来在实际应用中,PID控制器中三个关键参数的选择,一直都是基于局部线性化的模型,或主要依赖设计者的个人经验或实验。因此,对于真正的非线性不确定性实际被控对象,近百年来在控制理论上一直缺乏严格的稳定性保证,也没有关于PID参数设计的具体理论指导。这是长期以来控制系统领域的著名科学问题。
 
郭雷院士与其研究生赵成所完成的这项科研成果,针对由牛顿第二定律所描述的一般二阶非线性不确定系统,首次定量地给出了使得闭环系统全局稳定时,PID控制器参数应当属于的三维无界开流形;并且针对一类自治非线性不确定系统,从数学上严格证明为了使闭环系统全局稳定,PID控制器参数所应满足的充分必要条件,从而建立了PID控制器的理论基础并给出了参数的设计方法。这一理论严格说明了PID控制器无论对非线性系统的不确定性结构,还是对PID 控制器的三个参数选择,都具有大范围的鲁棒性。这一理论和方法不仅为工程技术中广泛应用的PID控制器提供了理论基础、阐明了其被广泛应用的根本科学原理,而且还将为改进现有实际工程控制系统的性能以及设计新型控制系统,提供必要的理论基础和可靠的设计指导。这是控制理论研究的一项重要进展,得到国内外同行广泛关注和好评。
 
代表性论文:Cheng Zhao and Lei Guo, PID controller design for second order nonlinear uncertain systems, Science China, Information Sciences, 60(2), 1-13, 2017. 

 

[转载]交流一下开国际学术会议的窍门吧

交流一下开学术会议的窍门吧
开学术会议很贵,很花时间,但是毫无疑问对junior investigator非常重要
你可以在这里了解行业最新动向,发布自己的研究成果,还有networking
 
我开过不少会,但是总感觉没有充分利用资源, 就是说:不是很会开会
很想在这里跟大家交流一下。
 
自己先说几条,大部分是教训得来的,很多现在也做不到,随想随写,没什么顺序,
权当抛砖引玉吧。另外不同行业的会议开法也不太一样,不知道适用否。
 
-至少要提前一年开始准备。这时候已经开始有invited session proposal
solicitation了,是个很好的提高visibility的机会。自己present一下自己的
work, 再请几个各处认识的朋友,牛人,一个session就齐了。牛人自己不见得来,
但可以让自己的学生博士后代劳。
 
-和上条相关的,就是如果有invited session vs. contributed session,
自己比较得意的work最好不要投到后者。因为后者一般质量没有保证。争取会前
吹吹风,让自己的colleague请自己。
 
-同理,不是特别了解行情的话听talk也最好听前者, invited.
另外听talk不要一味听自己领域的,非自己领域的牛人的talk去听常有意外收获。
 
-有些行业文章发表了以后也可以拿到会上讲,有些就不行,所以交abstract要和
文章发表协调好
 
-开会给不给talk/poster都要穿得比较professional. 大家互相都不认识,第一眼
印象还是很重要的。
 
-对某个speaker的东西有些想法或comment要主动去和他/她讲,讲之前之后别忘
自我介绍。他们会很高兴你对他的东西感兴趣的。
 
-中国人一般比较晒啊。大会的reception不去可惜,去了又怕尴尬。最好就是和
一个比较senior或者network比较广的mentor, friend同去,就可以把他/她的圈子
变成你的圈子了。
 
-never eat alone during a conference. 每顿饭都是networking的golden opp.
 
-去conference前问问有什么外地的朋友,collaborator会去,在会上就可以交流
idea la
 
-还有事先申请travel grant la, young investigator workshop la, 都是需要
提前量的
 
-还有啊,听说很多会是了解grant行情的机会,program officer会来看你的talk
问你问题,同时也应该是咱们跟他们陶瓷的机会,但哪些会是这样的, 如何操作
我就不懂了,希望大家能交流一下。
 
 
 
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
 
2008 IEEE MSC 的投稿经历
 
北京时间2008年1月28日凌晨1:21,我的第一篇国际会议文章投出去了。
会议是2008 IEEE Multi-conference on Systems and Control
我是1月17日收到董老师的邮件,说这个会的deadline是1月30日,因为很想有机会参加一次国际会议,手里又正好有在写的文章,决定试一下。说实话,这后面10天的工作难度之大,如果之前知道,我肯定心里打鼓。不过就这么一步一步逼着也走过来了。为了攒些人品,希望文章可以投中,在这里简单的记录写这篇文章的经验和投稿的经验,方便朋友们吧。
 
一、写文章
1.1我是在工作中发现这几个问题值得一写的,就陆续积累数据和试验,然后组织文章,当然,文章开始是中文的。
1.2当明确要把这篇文章投国际会议后,就先用了三四天把文章的中文稿集中完成,包括图、实验数据、表格等等。这一步要感谢我的导师董老师和前任师兄刘老师以及大我一届,参加了MSC07会议的万师兄,他们给了我很多好的改进建议。
1.3然后就是痛苦的中翻英过程(我的中文稿实在1月21日定稿的,英文稿则是在1月26日定稿的,翻译用了6天)。因为我的英文水平绝对的烂,所以之前打死我也不信自己可以写出一篇长达4页半A4纸的英文文章。这个过程中,首先是阅读了本领域的一些英文文献,甚至就是本实验室师兄、老师们投过的文章的英文摘要等等,熟悉其中的关键词汇的英文说法。然后就使用google的翻译,进行中译英。google的翻译语序很烂,但是感觉使用的词汇还是不错的,包括一些专业词汇,比如标度因子什么的,都能翻对。所以,他给出的翻译结果,需要你参考他给的词汇,再把语序调整一下。基本就差不多了。这一步要特别感谢贝贝龙告诉了我google翻译这个好东西。呵呵
1.4英文文章定稿、语言润色和推敲。
这一步要感谢的人太多了:
1.4.1万师兄给我的文章提了不少改进建议,包括加术语表什么的,而且,身在家乡,被我用飞信骚扰了好几个晚上,真是不好意思。
1.4.2董老师和刘老师给我的英文文章做了不少语言上的修改。
1.4.3本科兄弟凯凯在给美国资本家工作的空挡里,义无反顾的帮我改了摘要;高中同学一祎帮我推敲了结论部分的语言;初中同学silence也给了我不少语言上的建议。
 
二、投稿
相比写文章,这部分我更是陌生一些。
2.1选择文章的分类:到会议网站上找call for papers,然后选择我要投的会议,是2008 IEEE Multi-conference on Systems and Control (2008 MSC),然后选择后面的Submit a contribution to 2008 MSC,进去之后,会有几个分会议(CCA,CACSD,ISIC),每一类文章又分三类:
Contributed paper:就像我这种普通的投稿
Invited session proposal :不了解,好像和我们关系不大
Invited paper:属于被邀请的文章,在投稿时,要提交一个invited code(这个是人家邀请你是给你的一个密码),可惜,我不是被邀请的。呵呵
 
2.2注册你的PIN,每个人需要在IEEE的数据库中有自己的PIN码,包括自己邮件、电话、地址、学校等信息。要记住他给你的PIN码(几位数字),还有文章所有作者的PIN码都应该有,投稿时都要填写的。
 
2.2按照要求test你的pdf文件。这步是最可怕的。进入投稿洁面后,他会要求你对pdf做检测,就是格式上是不是满足人家要求。你把文章upload之后,他会给你出来一堆表格,按照要求:页面边距是不是满足要求、字体是不是满足要求……一共有十几条吧,有问题的就画个小红叉,有warning的就是个叹号。这里面如果按照模板写出来的文章,基本就会在字体上有问题。解决方法如下:
首先,在word里写的时候,要把字体都设成Tims New Roman,一个别的字体不能有。然后就虚拟打印,虚拟打印的时候,在打印机旁的属性选项里有ADOBE pdf Setting这个选项卡,其中Default Setting一项要选择按照IEEE的模式打,但是这个模式默认里是没有的,需要通过Acrobat Distiller设置,这里再说说Distiller的设置:进入distiller后,settings|edit ADOBE pdf Setting|Font|把右下角Never embed选项框里的内容全部删除,然后save as,起一个名字,这就是我们需要在选择打印机属性时选的那个IEEE模式。不知道是不是说明白了,呵呵,反正挺乱的,看了N多英文help,并在贝贝龙的指导下才完成。对了,我用的是Acrobat7.0
 
2.3投稿,填好文章的名称、作者PIN、摘要等等,其中关键词要从他给的一个列表里选,师兄告诉我要注重其中关键词的选取,这样容易使文章掉到本领域熟悉的老师手里,呵呵,希望有帮助吧。填好后会先点一个verify,检查无误后,让你上传pdf文稿,就OK了!
 
这部分要感谢人就更多了:
万师兄在家乡遥控我做了很多投稿的准备,还给了我自动化系徐师兄的联系方式;
徐师兄在忙碌的工作中,还在电话里给了我很多中肯的建议,包括关键词选取的建议;
贝贝龙在最后一天晚上,远在聊城充当我的虚拟打印机(他打出来的文章被检测的warning比我打印出来的少一个,呵呵,奇怪),而且更重要的是,在最后时刻,我最感到孤立无援的时候,哥们儿帮我找到了问题,并陪我战斗到最后!兄弟啊~啥也不说了!
 
三、收到收条和修改
作者中需要有一个是联系人,我写的董老师,这样投稿成功后,他会把收条发给董老师邮箱,然后抄送给我以及其他作者。而且,我发现,如果我要更新文章、或者做任何修改的话,都已经没有权利了,要联系人才能做。呵呵。
 
四、几点体会
4.1、老师、师兄、同学、朋友,你们是我坚强的后盾,在我面对满篇英文几乎绝望的时候,是你们帮我出主意想办法,感动啊!没啥说的了,谢谢大家!
4.2、很多事情是逼出来的。清华有句话,叫“牛人都是逼出来的”,我算不上牛人,但是很同意这个话,要不是我十天前敢下那个决心,也就没有这段经历,无论中与不中,这几天的经历本身就让我受益匪浅。
4.3、英文一直很烂,超没有自信,不过被逼着翻译出一篇文章,然后看着自己也洋洋洒洒码了四页半的英语之后,对自己的英语信心倍增,而且总感觉写完之后,总有点儿提高,而且,在投稿的过程中,全是英文的网页,甭管用的金山词霸还是银山词霸吧,总把事办成了,心里还是挺满意的。
4.4、老外做事真TMD严谨,不佩服不行,就这个pdf test就让我五体投地,人家为了最后汇总文章方便,把规则写的特别清楚,而且有成熟的网络在线检测机制,一丝不苟,而且,这么做工作量都在前面解决了,到后面整理就很省事。佩服啊佩服~
 
总之,无论文章中与不中,这次投稿经历,都可以让我对国外的科技和学术做一次管中窥豹,不会夜郎自大了……呵呵
写到这里吧,希望对大家有帮助
 
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
 
Invitation to the 54th IEEE Conference on Decision and Control
 
http://www.cdc2015.ctrl.titech.ac.jp/index.php
 
The 54th IEEE Conference on Decision and Control  will be held Tuesday through Friday, December 15-18, 2015 at the  Osaka International Convention Center,  Osaka, Japan. The conference will be proceeded by technical workshops on Monday, December 14, 2015.
 
The CDC is recognized as the premier scientific and engineering conference dedicated to the  advancement of the theory and practice of systems and control. The CDC annually brings together  an international community of researchers and practitioners in the field of automatic control to  discuss new research results, perspectives on future developments, and innovative applications  relevant to decision making, systems and control, and related areas.
 
The 54th CDC will feature contributed and invited papers, as well as workshops and may include tutorial sessions.
 
<!-- In addition to the standard oral presentations, the conference will also feature interactive presentations and demonstrations, in order to encourage an interaction exchange with the audience. Topics for the interactive sessions will be selected specifically to benefit from the time for interaction and discussion that are not available in a typical lecture session, and the authors will be encouraged to make creative use of poster boards as well as hands-on computer simulations and demonstrations. 1</P> -->
The IEEE CDC is hosted by the IEEE Control Systems Society (CSS) in  cooperation with the Society for Industrial and Applied Mathematics (SIAM), the Institute for  Operations Research and the Management Sciences (INFORMS), the Japanese Society  for Instrument and Control Engineers (SICE), and the European Control Association (EUCA).
 
Osaka is the center of the second largest metropolitan area in Japan,  formed together with the nearby cities Kobe and Kyoto.  The conference venue is located at the heart of the city on  the island Nakanoshima. Many tourist sites such as Osaka Castle,  the vibrant business and entertainment districts of Umeda and Namba,  as well as the Bay Area with various museums and shops can  be reached conveniently. To appreciate the historical treasures  of Japan, tours can be made to the ancient capitals of Kyoto and Nara,  where you may visit temples and shrines from over one thousand years ago.
 
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
 
 
 
Enjoying the paradise life on earth, 
making a grand conference CCC&SICE2015!
http://ccc-sice2015.hdu.edu.cn/index.php?lang=en
 
 
The 34th Chinese Control Conference and SICE Annual Conference 2015 (CCC&SICE2015) is organized by the Technical Committee on Control Theory (TCCT) of Chinese Association of Automation (CAA) and the Society of Instrument and Control Engineers (SICE) of Japan, and locally organized by Hangzhou Dianzi University (HDU). 
 
CCC2015 aims to provide a forum for scientists and engineers over the world to present their new theoretical results and techniques in the field of systems and control. The conference consists of plenary talks, panel discussions, invited sessions, pre-conference workshops, oral sessions and poster sessions etc. for academic exchanges. The conference languages are Chinese and English. The CCC conference proceedings have been selected for coverage in ISTP (Index to Scientific and Technical Proceedings) since 2005, included in the IEEE CPP (Conference Publications Program) since 2006, and cited by EI since 2006.
 

读书、科研与人生道路

《读书、科研与人生道路》
 
——在清华大学“星火论坛”的讲稿(2013/4/25)
 
我是清华校友,毕业于1970年。在毕业43年后,能有机会回到母校,在《星火论坛》和大致是二阶代沟的小学弟、小学妹们交换自己大半辈子读书、科研和做人做事的教训、心得和体会,心情既亢奋又忐忑。像一个酿酒老头,正在打开深埋多年的老坛子,不管里边酿就的是醇香的好酒,辛涩的苦酒,还是无心错成的陈醋,它终究历经了一路的沉浮酸甜,承载着厚重的岁月沉淀。它也许会对后来人有所借鉴吧?
 
题目是林XX同学出的,算是命题作文罢。
 
1. 读书
 
按中国的传统说法,在座的都是读书人。读书的重要性是无庸置疑的。咱们不谈功利性的看法,如“书中自有黄金屋,书中自有颜如玉”之类的。只从做学问的角度看,读书是接受前人文化传承最重要的途径。大家都在读书,但可能效果迥异。“如何读书”本身就是一门学问。
 
1.1 读什么书
 
1979年诺贝尔物理学奖获得者Glashow除物理学相关知识还修过音乐、东亚历史、法学、文学,甚至电焊。访问他的记者颇感疑惑,问他:“学这么多其他科目对物理学研究难道也有帮助吗?”他回答说:“我想是有的,往往许多物理学问题的解答并不在物理学范围之内,涉猎多方面的学问可以提供开阔的思路,如多看看小说,有空去逛逛公园,都会有好处。这可以提高想象力。它和理解力、记忆力同样重要。”海纳百川,方能成其大。许多中国学者一大弱点是知识面狭,一辈子只能在一个很小的方向上工作。
 
特别想强调的是:理工科学生要学好语文,文科生当然也要掌握必要的自然科学知识。有人说:“文理相通”,我觉得有一定道理。写文章的逻辑性与数学推理在原则上是一致的。丘成桐说过:“在学好数学的同时,更不能偏废语文。语文的训练是成为真正学者的第一步”。李政道有个题词:“科学人文一肩挑”。所以理工科学生除了专业知识外,还应当抽时间读一点文学的、哲学的、以及社会科学的书籍。
 
1.2 怎么读书
 
我想说的是专业书籍。个人认为大约可分为两类:一类是基础性教科书,这类书要精读。例如,我以前没学过图论,前一阵子在学图论,我选了一本入门书“R. J. Wilson,Introduction to Graph Theory”。我一般的做法是:选一本容易读而又比较经典的书,作为教科书仔细读,每个证明都仔细看,每道习题都做。华罗庚说过读书要从薄读到厚,再从厚读到薄。从薄到厚就是精读的过程,弄清每一个概念,包括做笔记,做习题,这是第一步。在掌握了这些内容后,要进行综合和提炼,找出真正需要掌握的精华。将来自己真正能记住的可能就那么一点,但却能运用自如,触类旁通。
 
我有个朋友,当年和我一起从清华考进科学院研究生院。几十年后相遇,他说了一句话:“我们学了大半辈子数学,其实最后能记住的就是一些框架。”我觉得他说到了点子上,正是这些不多的框架,指导我们进行正确的思维。这大概就是所谓“由博返约,以约驭博”的道理罢。一个人艺多不压身,多修一门课就会多一份本事。
 
另一类是参考书,包括(除少数需精读的例外)大量的参考文献。这些东西要粗读,掌握你认为有用或有启发的思想、方法。这是一种能力的训练,中学生,甚至大学生都很难做到这一点。但作为一个研究生,特别是在知识爆炸的今天,一定要学会在海量的书籍、文献中过滤出自己所需要的信息。
 
歌德有一句话:“经验丰富的人读书用两只眼睛,一只眼睛看纸上的话,另一只眼睛看到纸的背面。”这是一种能力的培养,一定要从表面的,多半是赘长的陈述、推理、证明等中摆脱细节,发现它背后的想法、算法或原理。
 
对于怎样浏览科技参考文献,我还想说一点自己的体会。一是要重视摘要、前言、和结束语。对你不甚了解的新领域,前言几乎是最好的入门书。摘要和结束语常常会告诉你,你看的这篇论文是干什么的,有什么新结果。这些对理解论文很有帮助。二是怎么找参考文献,我的建议是:尽量找最新的,但不一定要细读它。如果你对该方向不太熟悉,可以从最新论文的参考文献中找到该方向的经典论文,不妨从这样的论文读起。
 
关于泛读,想举一个例子。我最近在做网络演化博弈方面的研究。演化博弈中有一个重要概念叫“演化稳定策略”(Evolutionary Stable Strategy),是由John M. Smith提出的。他有一本经典的书“Evolution and the Theory of Games”,主要讨论ESS。我只看了两章,了解了ESS是怎么回事,同时发现,他的方法不能用于网络化的演化博弈。于是就根据他的思想,提出自己的定义和算法。
 
总之,个人以为,精读、泛读都很重要。精读增加工具,泛读扩大视野。在科研工作中,两者缺一不可。
 
1.3 自学能力的培养
 
我在清华上学的时候,学校经常宣传“猎枪与干粮”的理论,好像说是蒋南翔提出来的。说学校要交给学生的是猎枪而不是干粮。干粮有吃完的一天,而猎枪会让你永远有饭吃。这个说法很有道理。在学校修一门课两门课……那是干粮,而自学能力则是猎枪。美国一个历史学家亨利·亚当斯说过:“一个人年轻时懂了些什么无关紧要,只要懂得如何学习就够了。”(What one knows is, in youth, of little moment;they know enough who know how to learn.)
 
自己中学的时候,老师介绍看过不少趣味数学或物理小册子。例如华罗庚的《从杨辉三角谈起》,吴文俊的《力学在几何学中的一些应用》,别莱利曼的《趣味物理学》等,这不仅学到不少有用的知识,更重要的是,培养了读书的习惯和自学能力。这种能力让自己受益终生。
 
自己只上了一年零八个月大学,学的是焊接专业,数学只学过简单的微积分。文革十年,有两段时间,自己自学了几门数学和物理课程,一段是大串联到武斗,还有一段是分到数学教研组后的培训班。我自学了北大的《复变函数》,周伯勋的《线性代数》,格列坚科的《概率论》,艾利斯哥尔兹的《变分法》,还有康帕涅茨的《理论物理》力学部分。自学的方法很简单,就是每道习题都做一遍。故人说:“不动笔墨不读书”,对专业书籍,我把它改成:“不做习题不读书”。
 
还有一点自己比较得意的是英语,自己从初中到大学,一直学俄语。只是在文革中偷偷学了点英语,还曾因偷看《毛主席语录》英文版被人将大字报贴到宿舍门口。到考研时我虽然一天英语课都没上过,但居然考了80分,算比较高的分数了。这些自学的知识,使我能在文革结束后考上数学所的研究生。
 
我觉得自己一辈子得益于从中学开始的自学能力的培养,我对奥校之类填鸭式的知识灌输很反感,深信“自己学会读书、学会吸收新知识”才是猎枪,是做学问的真功夫。
 
2. 科研
 
科研是知识分子的必经之路,也是知识分子自我表现的舞台。怎样登台,怎样亮相,怎样让自己的表演酣畅淋漓,这绝非我这样的末流演员所能回答得了的。但毕竟在科研上摸爬滚打了多年,算是见过猪跑,讲一点体会和教训罢。
 
2.1 读书与科研
 
小时候听过一个笑话:一个秀才在家里愁眉苦脸地搜索枯肠写文章,看他苦不堪言的样子,他老婆就说:“看你们写文章好像比我们生孩子还难。”他回答说:“可不是,你们生孩子肚子里有东西,可我肚子里没东西呀。”这笑话用来比喻读书与发表文章还是很恰当的。
 
我在美国上学的时候,博士学位只有修课的要求:16门课,48学分,却没有发表论文的要求。我毕业时发了一篇期刊论文,一篇会议论文,按国内标准可能不够毕业。我有的同学毕业时并未发表任何文章,却照样毕业。而我修过的16门课却让我终生受益无穷。
 
个人以为,从长远看,打好基础比发表几篇论文重要得多。做学问就像盖房子,打不好基础是盖不成高楼的。我招研究生,硕士期间就发表了一堆论文的学生一律不要。你该念书时不念书,就学会拼凑垃圾论文,就像你学武功不练基本功,却学了花拳绣腿,道走歪了么。工欲善其事、必先利其器。搞基础理论研究,肚子里必须有几门过硬的课程当利器。林肯年轻时当过伐木工人,他说过一句话:“如果给我8小时砍倒一棵树,我会花6小时磨斧头。”只有厚积薄发,才能写出好文章。
 
2.2 选题
 
对大多数研究生而言,科研选题从读文献,Follow他人的工作开始,大致是对的。除非少数天才人物,科研总要从模仿开始。但模仿有两种,一种是纵向的,就是把人家的方法应用一下,这通常被称为成法套用,就像学生做Homework一样,没什么创新性。另一种是横向的,即发现它不完善的地方或者可以平行发展的地方。这样,你研究的对象与原来问题有所不同,需要一些新的方法或新的思维,这种工作就有一定创新性,可以提高你的科研能力。
 
通常这种模仿容易出一些小文章,这是必要的。早年听过逻辑学家王浩的一个报告,说:“这种小文章做几篇,知道自己会做了,就不要再做了,要找点大点的问题做。”这种大一点的问题应当是有前途的研究方向。
 
那么,什么是有前途的研究方向呢?这里想引用何毓琦先生的几段话:“常常有事业刚刚起步的青年科研人员向我询问,什么是有前途的科研方向。人们常常倾向于推荐自己目前正在做的研究,但这样建议别人是自私的,也是危险的。”何先生的建议是:“去找一个人们渴望解决的实际问题,而这个问题又是你感兴趣的,但不太了解的,全身心地投入进去,试图解决这个问题,但不限于使用你熟悉的现有工具。”
 
何先生提到这种研究方向的几个明显优势:(1)一旦获得成功,就有一些现成的人替你宣传;(2)你可以试图将这个发现拓展为一个全新的研究领域;(3)在一个目前还很少人涉及的研究领域,不用花太多力气学习积累下的文献资料;(4)新课题像新矿,花同样的力气,新矿的产出比老矿高得多。
 
我想,何先生这里强调的有两点:(1)寻找新的、有意义的问题;(2)发展和使用新工具。我很同意这种观点,自己也有类似的人生体会。
 
2.3 矩阵半张量积与我
 
矩阵半张量积是自己比较得意的一项工作。矩阵半张量积是矩阵普通乘法的一种推广,它使普通矩阵乘法可以用于任意两个矩阵而不改变其性质。我在1999年首次提出这种运算。当初主要是用它计算连续系统。2008年开始将其应用于一个新的较热门问题:布尔网络的分析与控制,得到成功。相关工作获国际自动控制联合会(IFAC)颁发的Automatica 2008-2010最佳理论/方法论文奖。
 
现在,国内至少有包括清华、北大、山大、同济大学等在内的十几个高校,都有教师用矩阵半张量积解决各类问题,国际上有意大利、以色列、美国、英国等学者使用矩阵半张量积。目前本人主要研究矩阵半张量积在博弈论,特别是网络演化博弈中的应用,感觉这是矩阵半张量积的一个大有可为的新领域。
 
相信新的工具和/或新的领域是产生创新科研成果的不二秘笈。
 
2.4 创新观念与想入非非
 
创新观念与想入非非表面上看很难界定,而且,它们的确是存在相关性的。那么,它们的区别在那儿呢?创新观念是建立在坚实的基础上,包括你对问题的来龙去脉的了解和对相关知识的掌握。探索真理只能在掌握前人已有知识和分析已有结论的基础上,然后像胡适所建议的:“大胆设想、小心求证”,缜密的分析、细致的甄别、严格的推理、透彻的论证。这才是理性的创新思维。
 
量子力学创始人普朗克:“唯有观念才能使实验者成为物理学家,使编年史者成为历史学家,使古抄本鉴别者成为语言学家。”不妨将它归纳如下:创新观念+知识积累=>学术突破。
 
创新思维需要敢于挑战权威,个人理解就是不迷信权威人士的言论,敢于思考,敢于批评权威的错误,做到真理面前人人平等。但挑战权威要建立在尊重科学的基础上。要敬畏真理,人类社会长期积累下来的,已经被严格证明了的知识,是人类的共同财富。在没有对其深入了解之时就随便挑战它,这就成了想入非非。
 
辟如一位老先生,他对伽罗华理论一无所知,基本数学训练也极其缺乏,就非要去解五次方程,犯下了很低级的错误。而当别人指出他的错误,所有人都看清楚他错在何处时,他居然还弄不明白,坚持自己“是完全正确的”。这不属于科学探索,而是典型的想入非非。其他一些民数也是如此,他们缺乏专业训练,幻想轻易破解世界难题,一夜成名。
 
德国著名启蒙思想家和诗人莱辛曾说过一段被黑格尔多次引用的话:“真理不是一枚铸币,现成地摆在那里,可以拿来藏在你的衣袋里。真理是一个过程,是在漫长的、发展的认识过程中逐渐被掌握的;在这一过程中,每一步都是它前面一步的直接继续。”
 
自然科学发展到今天,科学问题的解决更是如此。最典型的是近年数学上两大难题的突破。怀尔斯证明费马大定理,是建立在一系列前人工作的基础上,包括弗赖将费马大定理转换为椭圆方程,谷山一志村猜想,椭圆方程模型式等。佩雷尔曼证明庞加莱猜想也是如此,Ricci流是以意大利数学家里奇命名的一个方程。当哈密尔顿利用它将不规则流形变成规则流形时,丘成桐就敏锐地提出“可以用这个证明庞加莱猜想。”佩雷尔曼就是按哈密尔顿的方法做下去的,所以他自称:“我是哈密尔顿的门徒”。
 
马克思说:“在科学上没有平坦大道,只有在崎岖小路的攀登上不畏劳苦的人,才有希望登上光辉的顶点。”这句话是至理名言,希望在科研中一蹴而就是懒汉无知的幻想。
 
3. 人生道路
 
“人生是一连串教训,要想理解人生就必须经历人生。” (Life is a succession of lessons which must be lived to be understood.)——爱默生
 
“无论发生了什么,都要直面人生”(Whatever reason,turn his back on life.)——罗斯福
 
3.1 人生路漫漫
 
人生是一段漫长的旅程,就像一场马拉松,风物长宜放眼量,一定不要计较一时的得失,谁笑到最后,谁才笑得最好。我曾经给自己写过这么一段话:“不要轻言放弃,只要还在跑道上,你就还有取胜的机会。”
 
如果人生是万米长跑,考上大学大概是百米节点,博士毕业大概是千米节点。真正的人生竞争在于千米后的漫漫长途。我对“不要输在起跑线上”的说法很不以为然。谁见过马拉松比赛上来就拼命的?有些学生,将大学当作终点,即使以百米速度冲进清华、北大,但后劲不足,还是可能败下阵来。
 
哈佛大学教授Brockett,被人称作“非线性系统几何理论之父”,而他的博士论文是化学专业的。一次聊天,我问他:“你是化学博士,怎么会想到用微分几何做控制?”他回答说:“PhD is only the entrance ticket to scientific palace. (博士学位只是科学殿堂的入门卷。)”
 
屈原的名言:“路漫漫其修远矣,吾将上下而求索。”年轻人对于人生道路既要未雨绸缪,放眼将来,以免“人无远虑,必有近忧”;又要脚踏实地,耕耘不辍,让“千里之行,始于足下。”
 
3.2 失败是最好的老师
 
对年轻人来说,要选定一个人生目标,然后坚定不移向这个目标前进。要有胜不骄败不馁的精神。特别是要经得起失败的考验,在人生道路上,挫折是比成功更好的老师。
 
《哈利波特》的作者罗琳,2008年在哈佛大学演讲,题目是:“从失败中学习经验和利用想象力”(Learn from failure and make use of imagination)。她曾经是单亲母亲,靠社会福利生活,她称自己当时是:“我所知道的最彻底的失败者。”她后来成为英国除女皇外身价最高的人。她说:“失败教会我很多,而这些不能通过任何其他途径了解到。通过失败,我发现自己拥有了坚强的意志。”“一旦你意识到自己已经在挫折中变得明智和坚强,那么从此以后你就获得了保证自己生存下去的能力。如果不在逆境中接受考验,你可能永远都无法了解自己。”
 
自己在人生路上也受过几次重挫,每次都让自己变得更坚强。初中一年级,我刚考上“福州第一中学”,是福州市最好的中学。我却无意间信手涂鸦,写了“反动标语”,被开除队籍。这让我比较早开始用功。中考以全校第一的成绩留在了福州一中;文革前,我在清华,入团,当了班干部,入党积极分子,又是因材施教的对像,对人生、爱情充满幻想。文化大革命,我又被点名为“反动学生”,像得了疥疮,两派都不要我。我偷偷跑到圆明园,在乱石丛中看书,后来考上文革后第一届研究生;我曾在德州理工大学教书,由于家庭原因,我辞职回国。后来我把成功的希望寄托于自己,拼命工作。有时觉得命运对我不公平,但其实正是坎坷的人生造就了今天的我。
 
3.3 机会只青睐有准备的人
 
“机会只青睐有准备的人”这是我最深刻的人生感悟之一。几次经历,让我对此深信不疑。
 
64年高考数学,据说是出了偏题难题。第八题是:“正方形内切两圆,一圆切左边与上边,另一圆切右边与下边,两圆相切,问何时两圆面积和最大?最小?”后面两道附加题,一是将正方形换为长方形;一是将正方形和圆换作立方体和球。我相信如果在现场,自己是想不出来的。但自己曾做过一道上海市数学竞赛题,求二次型在区间内极大极小。用这方法不难解出上面的问题。我成为福建省唯一完整解出这道题的学生,得了119分,是当年最高分。那几道偏题给了自己机会。
 
文革中读书无用论甚嚣尘上,我却自学了几门数学和英语,当时未必知道它们有用。但后来恢复研究生制度,它们帮我考上数学所,当年的录取率是五十比一。
 
我刚开始用半张是积表示逻辑等式时并不知道它有什么用。后来偶尔听清华赵千川教授在香港做的关于布尔网络的学术报告,当时就觉得逻辑的半张量积表示可能能用上。我当晚就把他请到宿舍讨论,后来形成了布尔网络控制的一套理论。
 
总之,做学问不能太功利,要不拘一格,刻苦钻研。天道酬勤,机会大致是同你的知识储备成正比的。
 
3.4 经历远比占有重要
 
卢梭曾说过:“生活本身没有任何价值,它的价值在于如何使用它。”每个人都活一辈子,或者说,都到这个世界上来走一遭,怎样才能使这一遭更有价值呢?
 
我以为不在于功名利禄、荣华富贵,而在于经历过、奋斗过,有一份精彩的人生历程。托尔斯泰在他的名著《安娜·卡列林娜》开篇就说:“幸福的家庭家家都一样,不幸的家庭一家一个样。”与此类似,我们也可以说:“顺畅的人生人人都一样,坎坷的人生则是一个人一个样。”不要去羡慕官二代、富二代,要用自己的奋斗去谱写自己声色独具的人生故事。
 
英国作家史蒂文森因患肺病周游世界各地,期间发表了大量游记和短篇小说。他曾感慨地说:“满怀希望的旅程比到达更重要,真正的成功在于进取。”(To travel hopefully is a better thing than to arrive,and the true success is to labor.)
 
爱因斯坦本人曾坦率地把自己称之为是“一个流浪汉和离经叛道的怪人。”年轻人不妨学学爱因斯坦,做一个流浪汉,到世界上不同的地方去流浪,到不同的学术领域去流浪,以增长自己的知识和才干;做一个离经叛道者,不循规蹈矩,去走前人未走过的道路,去披荆斩棘,开拓新的领域。如果这样,不管成功或失败,你的精神世界都会是富足的,你的人生都会是精彩的。
 
3.5 人生的目的
 
我一直认为,一个人活着就要有理想。我曾在一篇博文中写过:理想是什么?它是心头一缕淡淡的念想,一种对美好未来的期盼;它是胸中一丝拳拳的思绪,一份对事业和成功的渴望;它是一股向上的情结,催促你去实现自己最大的人生价值。它看不见、摸不着,却始终伴随着你。在困难的时候,它给你坚持下去的毅力;在失败的时候,它给你抚平创伤、从新站起的勇气;面对挑战,它让你知难而上;身陷歧途,它为你指点迷津。
 
我年少时也曾狂妄,自以为天下英雄,舍我其谁。几十年的经历让我看到,许多自己曾经看不上的人,在不同的领域,做出很出色的工作,让自己望尘莫及。终于明白了一个道理,每个人都有自己的长处,都应当有自己的理想,自己的梦,都可以去实现自己人生的最大价值。因此,我对理想的理解,不再是像科学家、工程师、甚至诺贝尔奖……这样的终极目标。它应该是一个过程,一种心态。一种努力拼搏的精神,一份永不放弃的追求,永远力争做到自己的最好。
 
有同学问我:“你现在的理想是什么?”我想:“我的理想是自己的工作能被留在历史上。”历史是公正的,它不会承认“头衔”、“官位”,被历史的长河淘洗过而能留下的才是金子。
 
奥斯特诺夫斯基在《钢铁是怎样练成的》中有句名言:“人最宝贵的东西是生命,生命属于人只有一次。人的一生应当这样渡过,当他临死时回首往事,他不因虚度年华而懊悔,也不因碌碌无为而羞耻……”也许,我们每一天都应该问问自己:“今天,我是在碌碌无为地虚度年华吗?”
 
我喜欢艾青的一首诗:
 
即使我们只是一支蜡烛,
 
也应该蜡烛成灰泪始干;
 
即使我们只是一根火柴,
 
也要在关键时刻有一次闪耀;
 
即使我们死后尸骨腐烂,
 
也要变成磷火在荒野中燃烧!
 
年轻的朋友们,愿你们的生命发出更加绚丽的光彩!

当以真诚待科研

原本不想再就五次方程解这个问题发什么议论了,但有人还在发奇谈怪论,有人一而再、再而三地揪住我不放。实在忍无可忍,还想再说几句。
 
一、关于五次方程解的最后说明(这个说明完全放弃数学的严格论述,希望仅具中学数学基础的年轻朋友也能看懂)
 
1.1 什么是不可约方程
 
最常用的数域有三个:有理数,实数,复数。它们之所以称为数域,是因为在其中可以做“加、减、乘、除”(做除法时分母不为零)。整数集合就不是域,因为不能做除法(即整数除整数一般不再是整数)。一个以整数为系数的多项式,或一个以有理数为系数的多项式(在解方程时,乘系数的公分母,后者就可以转换为前者),它可约,就是它可以表示为两个(不小于一次的)多项式的乘积。谈到可约、不可约时,一定要强调分解出的两个因子多项式的系数在那个域中。具体地说,就是它在有理数域是否可约,在实数域是否可约,在复数域是否可约。抽象地说一个多项式可约,不可约是没有意义的。
 
举几个简单例子:(i) $x^2-x-2=(x-2)(x+1)$,因此,$x^2-x-2$在有理数域可约。(ii) $x^2-2$,它在有理数域不可约,但在实数域可约:$x^2-2=(x+\sqrt{2})(x-\sqrt{2})$。(iii) $x^2+4$在实数域也不可约,但它在复数域可约:$x^2+4=(x+2i)(x-2i)$。
 
那么,在讨论五次方程解时,可约性应该指在那个数域中可约呢?代数基本定理说,在复数域每个n次方程都有n个根。也就是说,在复数域,每个$n$次多项式都能分解成:$(x-x_1)(x-x_2)\cdots(x-x_n)$。因此,在复数域里,任何二次及以上的多项式均可约。
 
由中学数学知道,实系数方程虚根成对。因此,每个五次有理系数方程至少有一个实根,即五次有理多项式在实数域都可约。因此,谈论五次有理多项式可不可约只有对有理数域才有意义。这是研究高次方程解时大家公认的事实,例如, $x^5-2$是不可约的。
 
1.2 什么是五次方程公式解
 
一个多项式方程的公式解(也称根式解),指的是方程的根是否可以用其系数通过有限多次加、减、乘、除、根式运算表示出来。(其实,这与多项式可约、不可约毫无关系。)
 
所谓公式解是指对任何一个方程,用同样的步骤,可以将其解表示出来。(回忆二次方程的解公式,就不难理解这一点。)因此,只要举出一个方程,它的根不能用其系数通过有限多次加、减、乘、除、根式运算表示出来,就说明这一类方程没有公式解。
 
“一般五次方程没有公式解”,这是一个数学上早已严格证明过的结论。它是阿贝尔最早证明的。这个结果已经被载入数学史。[1]中有这么一段话:“It was Niels Henrik Abel who finally proved (in 1827) the impossibility of solving a general equation of degree 5 or higher in terms of radicals.”(是阿贝尔在1827年最后证明了用根式解一般的五次或更高次方程是不可能的。)
 
1.3 伽罗华理论究竟讲了什么?
 
想将伽罗华理论的内容在这里讲清楚是不可能的(虽然我可以负责任地说,我对这部分内容完全掌握),但我可以将它到底讲的是什么讲清楚:对于每一个一元有理多项式,伽罗华都定义一个用来刻画这个多项式本质的东西,这个东西后来被称为伽罗华群。伽罗华理论讲的是:一个有理多项式有根式解,当且仅当它的伽罗华群可解。(这里,可解是指可分解成一列嵌套的正规子群。这超出本文范围,读者也不必细究,这不妨碍本文阅读。)
 
二、关于吴老先生最新结果的批判
 
最近,吴老先生在《任意5次不可约代数方程仅由其各系数有理运算表达的公式解》一文中称“具体给出任意5次不可约代数方程的仅由其各系数有理运算表达的公式解。”强调说是“这些解都是根本不引进任何根式,仅由其各系数的有理运算表达的公式解。”
 
根据吴老先生的新“理论”,一个有理系数的不可约五次方程,它的解可由有理系数经有理运算表达。有理数经过加、减、乘、除这些有理运算得到的当然是有理数。这就是说,有理系数五次(或更高次)方程的根都是有理数。任何一个学过二次方程解的中学生都不会相信这种奇谈怪论吧?
 
举一个简单例子,$x^5-2=0$。大家都知道,它有一个无理数根,四个复数根。这些根怎么可能用有理数来表示呢?吴老先生为什么连这么简单的方程都不能用你那“公式”算一算呢?
 
实际上,如果一个有理系数五次方程$P(x)=0$有一个有理数根a,那它就能表示成$P(x)=(x-a)Q(x)$,这里$Q(x)$是四次多项式,经比较系数就可知,$Q(x)$也是有理系数的。换言之,$P(x)$可约。因此,如果吴老先生的结论对:即,不可约有理系数五次方程有有理根(也就是有理系数经有理运算得到的根)。那么,这等于说:“不可约有理系数五次方程是可约的。”世界上还有比这个更荒谬的结论吗?
 
三、要以一颗真诚的心对待科学研究
 
一个农民,他对自己地里长的庄稼会真心相待,一个工人对自己的制作也会十分珍惜。只有这样,庄稼,产品才会给你回报。作为一个科学工作者,也应当以一颗真诚的心对待自己的科研工作。你的每一项工作,每一篇论文,都是你的产品,你的Baby,要用你的心去爱它,千万不能制造假冒伪劣的产品去骗取功名利碌。个人以为,对科研的真诚态度至少应包括以下几点:
 
3.1 知之为知之,不知为不知
 
要有实事求是的态度,知之为知之,不知为不知。不能想当然,强不知以为知。吴老先生正是犯了“想当然”的毛病。他对伽罗华理论完全不懂。伽罗华理论的核心是伽罗华群和它的可解性,吴老先生在谈到伽罗华理论时从未提及这些。
 
他用自己的想象代替伽罗华理论,信口开河地说:“伽罗华的理论所证明的,实际上,也只是:‘在求解$n$次不可约代数方程的整个过程中,所添加根式的指数,$n*$,应是小于$4$’,并非所解方程的次数,$n$,应是小于$4$,并非方程的次数$n$大于4就不能有根式解。”这是典型的胡说八道。以$x^5-2=0$为例,它的一个根是$\sqrt[5]{2}$。你怎么可能用根指数小于$4$的根式表示这个解呢?
 
吴老先生多次提到:“学术界似乎已公认(或说‘一般认为’) $n>4$的不可约代数方程没有根式解。”这又是一个外行的奇谈怪论。任何一个学过抽象代数的人都不会认为:“$n>4$的不可约代数方程没有根式解。”例如,$x^5-2=0$就有根式解。伽罗华理论说的是:不是所有的$n>4$的不可约代数方程都有根式解。有的有,有的没有,要看它对应的伽罗华群是否可解。
 
吴老先生还说:“阿贝尔没有证明,一般五次方程没有根式解。”我给你指出了[2]中就有证明。其实,我在[3]中也给出了详尽证明,它基本上是[2]中的证明。
 
每个人都有一个从不懂到懂的认知过程。不懂是正常的,但要实事求是,不能不懂装懂。作为一个资深学者,更不能信口开河,这样会误导年轻人。再有,我不反对挑战权威,但你首先要弄懂你挑战的对象。在一知半解,甚至连一知半解都没有的情况下,不负责任地信口雌黄,这不是科学研究,不是探索,而是哗众取宠。
 
3.2 要勇于承认错误,不要文过饰非
 
个人认为,在科研的时候,犯错误不仅是难免的,而且是一种常态。只有在不断犯错,不断纠正错误的过程中才有希望达到最后的正确的结论。但错了就要承认,不要文过饰非。
 
吴老先生在2011年的博文“任意n次不可约代数方程的根式解”中给出根式解法。本人先从理论上证明了它是错的,而后,在应行仁、徐晓等网友的共同下,我们用具体数值例子验证了其公式是错误的。但吴老先生不顾事实,蛮横地说:“告诉你吧,我给任意五次不可约方程根式解完全正确。”这不是一个科学家对科学讨论应有的态度。一个科学工作者要尊重事实、敬畏真理。在学术上犯错误其实并不丢脸,罔顾事实,坚持错误,这才可耻。
 
我有一篇文章,发在2011年IEEE TAC第一卷第一期的第一篇长文。在山大给学生讲课时,一位学生指出一个推论有问题。发现她的观点是对的,我当时确实有点失落。但我还是鼓励她写一个Comments。写好后我还帮她修改。最后这个批评我的Comments也发在TAC上了。我相信,在学术问题上,对就是对,错就是错,任何人在真理面前都没有讨价还价的余地。
 
3.3 正确对待科学争论
 
有人把所谓“程吴之争”说成是掐架,指责我“不负责任”。我不认为这是什么个人之争,而是学术讨论。我自信还是努力摆事实讲道理的。即使我对吴老先生的数学水平评价很低,但那也是我从他论文中得出的结论,是个人的评价。
 
有人说我数学水平低,不懂什么是代数数,什么是超越数。即使我不认可,但以为你完全有权这么讲,一点都不过分。但吴老先生对我的用词包括:“可笑”、“卑劣”、“恶劣”、“不通人性”、“学阀”、”学霸”、“耍两面派”、“不讲道理”、“胡说八道”。对此,我固然可以一笑置之,但还是以为在科学争论中这些是不宜的。
 
其实,在科学问题的争论中,尊重对方也就是尊重自己。
 
四、关于民科与民数
 
我开始常用“代数”或“民科”批评非专业人士,一些网友批评了我。反思之后我以为,从事科研不在于他(她)的社会地位,而在于他(她)是否以科学的态度对待科学问题。有网友提到:当年出山前的华罗庚,还有今天的佩雷尔曼,都是民数。我想,他们说的都对的。甚至最近证明了弱孪生素数猜想的张益唐,算为民数也不过分。
 
现在我相信,一个人只要对科学有一颗真诚的心,用科学的、实事求是的精神去探索科学真理,而不是将科研当获取名利的敲门砖,蝇营狗苟,投机取巧,他就是一名合格的科研人员。只要努力,他就会有登顶的希望!
 
参考文献
 
[1] V.J. Katz, 《数学简史》(英文版), 机械工业出版社, 2004.
 
[2] C.C. Pinter, A Book of Abstract Algebra, McGraw-Hill Pub., 1990.
 
[3] 程代展, 《系统与控制中的近代数学基础》, 清华大学出版社, 北京, 2007.
 

控制论-概率书单

这个书单是我研究的相关方向的书单, 主要侧重概率论/数学基础/控制论等
 
事出有因
对我曾经读过的书单做个梳理,也方便后来的同学继续学习使用。
使用说明
本目录单仅提供我所了解过的一些书目的基本信息,按使用方向进行归类, 按照我的个人感受胡诌两句, 评论不当真。欢迎各位补充更正。
 
概率工具方面

Probability theory: Independence, interchangeability, martingales

Y. Chow & H. Teicher, 1978
        内容比较艰深,习题也难,但技巧很多。
Foundations of Modern Probability
       O. Kallenberg
       概率方面集大全的书,有影印本。
Martingale Limit Theory and Its Application
       P. Hall & C.C. Heyde
        关于鞅列,收敛性、大数定律、中心极限定理及重对数律方面比较全面的著作。
Almost Sure Convergence
       W.F. Stout, 1974
        概率方面各种收敛性结果的综合性著作。
Statistics of Random Processes I, II
       R.S. Liptser & A.N. Shiryaev
        随机微分方程方面非常有深度的书。
 
基础工具方面

Theory and Applications of Infinite Series
       K. Knopp
       无穷加和序列方面结果最全的参考书。
Matrix Analysis
       R.A. Horn & C.R. Johnson
        矩阵分析方面相当全面的教材,适合参考。
Matrix Mathematics: Theory, Facts, and Formulas with Application to Linear Systems Theory
       Dennis S. Bernstein
        绝对震撼的矩阵参考书,囊括了矩阵方面的几乎全部的结论。
常用不等式
       匡继昌
       不等式大全,适宜查询。
 
随机逼近方面

Stochastic Approximation and its Applications
       H.F. Chen, 2002
       随机逼近方面相对而言条件最弱的收敛结果。
Stochastic Approximation and Recursive Algorithms and Applications
       H.J. Kushner & G.G. Yin, 2003
         随机逼近方向的大牛的全面回顾巨著。最近又出新的版本了, 连名字都换了
Adaptive algorithms and Stochastic Approximation
       A. Berveniste, P. Priouret & M. Metivier
        在一个框架下,研究自适应算法和随机逼近算法,值得参考。
 
辨识方面

Identification and Stochastic Adaptive Control
       H.F. Chen & L. Guo
      线性系统的辨识结果及相关结果,结果深入,技巧较多。
System Identification: Theory for the User
       L. Ljung
        辨识方向的大牛的巨著,辨识文章几乎都有引用。
Identification of Time-varying Process
       M. Niedzwiecki, 2000
        第一本涉及时变系统辨识的著作。
 
自适应控制方面

Adaptive Control
       K.J. Astrom & B. Wittenmark
          自适应控制方向的经典教材。
Adaptive Control: Stability, Convergence and Robustness
       S. Sastry & M. Bodson
         自适应控制的重要教材,有电子版。
Robust Adaptive Control
       P.A. Ioannou & J. Sun
         鲁棒自适应控制,有电子版。
 
非线性系统方面

Nonlinear Systems
       H.K. Khalil
        非线性控制系统的经典教材,内容全面。
Nonlinear Control Systems
       A. Isidori
         号称非线性控制的Bible。
Nonlinear Control Design: Geometric, Adaptive and Robust
       R. Marino & P. Tomei
        非线性控制的三本经典教材之一。
 
其他书单

Stochastic Convergence
       E. Lukacs
        对于概率中收敛性相关内容给出多种多样的结果,侧重结论,证明多数略去。

绝密 | 机器学习老手不会轻易告诉你的12件事儿

 
 
编译 | AI科技大本营
参与 | 彭硕 刘畅
编辑 | 明明
 
 
机器学习是人工智能的核心,而机器学习的算法是其最重要的武器。机器学习算法可以从例子中归纳出执行重要任务的重要方法,这种方法不仅可行还可节约成本,随着可用的数据越来越多,我们就可以利用其解决更多的问题,因此,机器学习在计算机科学和其他领域中都得到了广泛的运用。
 
尽管如此,开发出成功的机器学习应用程序还需要大量的“黑科技”,而这些是在课本中找不到的。华盛顿大学的Pedro Domingos教授发表的一篇题为《关于机器学习你需要知道的一些事儿》的科技论文,总结了机器学习研究人员和实践者所学习到的12个重要的经验教训,包括要避免的陷阱、要关注的重要问题以及常见问题的答案等等。营长找到了对这篇科技论文的一个解读文章,并将主要内容翻译如下。
 
 
▌1. 学习=表示+评价+优化
 
所有的机器学习的算法通常包括三个组成部分:
 
表示:一个分类器必须用计算机能够处理的一些正式语言来表示。相反,为学习者选择一种表示方式就等同于选择一组可以学习的分类器。这个集合被称为学习者的假设空间。如果一个分类器不在假设空间中,它就不能被学习。一个相关的问题是:如何表示输入,比如使用哪种特征。
评价:要区分好的分类器和坏的分类器,需要一个评价函数。算法内部使用的评估函数与分类器外部使用的评价函数可能不同,其主要是为了便于优化,以及下一节中我们要讨论的问题。
优化:最后,我们需要在语言的分类器中找到得分最高的一种方法。优化技术的选择是提高学习者效率的关键,同时也有助于确定分类器的评价函数是否具有多个最优值。初学者开始的时候使用现成的优化器是很常见的,不过这些优化器会被专门设计的优化器取代。
 
 
 
 
 
▌2 . 泛化起着举足轻重的作用
 
机器学习的基本目标是泛化训练集中的例子。这是因为,无论我们有多少数据,我们都不太可能在测试时再次遇到一模一样的例子。在训练集上做得很好很容易,机器学习初学者最常见的错误是,对训练数据进行测试之后以为自己成功了。之后把选择的分类器放在新数据上测试,发现还没有随机猜测的准确。所以,如果你雇了一个人来构建一个分类器,一定要保留一些数据用来测试他们给你的分类器。相反,如果你已经被雇佣来构建一个分类器,那么在开始的时候将一些数据放在一边,最后用它来测试你选择的分类器,也就是最后在全部数据的基础上学习你的最终分类器。
 
 
 
▌3. 只有数据是不够的
 
把泛化当成目标还有另一个重要的后果:不管你有多少数据,只有数据本身是不够的。 
 
这似乎是一个令人沮丧的消息。那么我们怎么能学到东西呢?幸运的是,我们想要在现实世界中学习的函数并不是由所有数学上可能的函数集合而来。事实上,一般的假设(比如平滑、具有相似的类(class)的相似例子、有限的依赖关系,或者有限的复杂性)通常都能很好地完成,这也是为什么机器学习如此成功的一个重要原因。像演绎法一样,归纳法(学习者所做的)是一个知识杠杆:它将少量的输入知识转化为大量的输出知识。归纳是一种比演绎更强大的杠杆,用较少的输入知识来产生有用的结果,但它仍然需要输入知识大于零才能工作。和任何杠杆一样,我们投入的越多,我们就能得到更多。
 
 
 
现在回想起来,学习知识的必要性并不令人惊讶。机器学习并不是魔法,它不能无中生有。它所做的是从很少的东西中学到更多。和所有的工程一样,编程也有很多工作要做:我们必须从头开始构建一切。学习更像是一种耕作,它可以让大自然完成大部分的工作。农民把种子和营养结合起来种植作物。学习者将知识与数据结合起来,以发展项目。
 
 
▌4 . 过拟合有多样性
 
如果我们所拥有的知识和数据不足以完全确定正确的分类器,那该怎么办?那样我们就会冒着产生幻觉的风险(或者一部分),这不是基于现实的,只是在数据中随机编码。这个问题被称为“过拟合”,是机器学习的难题。当学习者输出的分类器在训练数据上能达到100%准确度,但在测试数据上却只有50%的准确率,而实际上它在两个数据集上的输出结果都能达到75%的准确率,这就是我们所说的过拟合。
 
机器学习中的每个人都知道过拟合,但它的形式多种多样,而且也不会立即变得明显。理解过拟合的一种方法是将泛化误差分解为偏差和方差。偏差是一种学习者倾向于不断地学习同样的错误;方差是不管实际信号是什么,学习随机事物的倾向。线性学习者有很高的偏差,因为当两个类之间的边界不是一个超平面的时候,学习者就无法归纳它。决策树不存在这个问题,因为它们可以表示任何布尔函数,但另一方面,它们可能会受到高方差的影响:由相同现象产生的不同训练集的决策树通常是非常不同的,实际上它们应该是一样的。
 
 
 
交叉验证可以帮助对抗过拟合,例如通过使用它来选择决策树的最佳大小来学习。它不是万金油,因为如果我们用它来做太多的参数选择,它本身就会开始过拟合。
 
除了交叉验证,还有很多方法可以对抗过度拟合。最受欢迎的是在评价函数中添加一个正则化项。例如,它可以对具有更大结构的分类器进行惩罚,从而倾向于较小的结构,进而避免过拟合。另一种选择是,在添加新结构之前执行像卡方这样的统计显著性测试,以确定这个类的分布是否真的不同于这种结构。当数据非常稀缺时,这些技术尤其有用。虽然如此,你应该对某种技术能解决所有过度拟合问题的说法表示怀疑。想要避免过拟合(方差)很简单,我们可能会掉入另一个极端也就是欠拟合(偏差)。想要同时躲开这个两个错误需要我们学习一个完美的分类器,并且在事先不知道它的情况下没有任何一种方法总是能做到最好(世上没有免费的午餐)。
 
 
▌5 . 高维度中直觉不再好用
 
说完过拟合的问题,接下来要谈的是机器学习中的最大的问题——维度的诅咒。这一表达是1961年Bellman提出的,指的是许多在低维度上工作正常的算法在输入是高维度的时候变得难用。但在机器学习中,这里包含的更多。随着示例的维度数(特征数量)的增长,泛化变得更加困难,因为固定大小的训练集覆盖了输入空间的一小部分。
 
 
 
高维的普遍问题是,我们的直觉是来自于三维世界,通常并不适用于高维的情况。在高维的情况下,一个多变量高斯分布的质量并不在平均值附近,而是在一个越来越远的“壳”周围。高维度的橙色的体积大部分是在皮肤上,而不是在果肉上。如果一个常数的例子在高维超级立方体里均匀地分布,在多维度的情况下,大多数例子更接近于超立方体的一个面而不是它们最近的邻居。如果我们用一个超立方体来近似一个超球体,在高维度中几乎所有的超立方体的体积都在超球面之外。这对机器学习来说是个坏消息,其中一种类型的形状通常被另一种类型的形状所近似。
 
在二维或三维空间中构建一个分类器很容易:通过视觉检查我们可以找到一个不同类别的例子之间的合理的界限。但在高维度中,很难理解发生了什么。这就使得设计一个好的分类器变得困难。有些人们可能会天真的认为收集更多的特性并没有坏处,他们认为即使是最坏的情况,他们没有提供关于这个类的新信息而已。但事实上,它们的好处可能被维度的诅咒所抵消。
 
 
▌6 . 理论保证通常与实际情况不一样
 
机器学习的论文充满了理论保证。最常见的类型是为了确保良好的泛化所需要的示例数量。如何去看待这些理论保证呢?首先,要注意的是这些都是可能的。归纳法传统上与演绎法形成鲜明对比,在演绎法中你可以保证结论是正确的。在归纳法中所有的赌注都被取消了,这其实是许多世纪以来的传统智慧。近几十年来最重要的发展之一是我们认识到事实上我们可以保证归纳结果,特别是如果我们愿意接受概率担保。
 
我们要小心这个界限意味着什么。例如,它并没有说,如果你的学习者返回了一个与特定训练集一致的假设,那么这个假设很可能泛化的很好。它所说的是,如果有足够大的训练集,那么你的学习者可能会返回一个泛化很好的假设或者无法找到一个与训练集一致的假设。这个界限也没有说明如何选择一个好的假设空间。它只告诉我们,如果假设空间包含真正的分类器,那么学习者输出坏分类器的概率就会随着训练集的大小而减少。如果我们缩小假设空间,约束就会得到改善,但它包含真正的分类器的可能性也会减小。
 
 
 
另一种常见的理论保证是渐近的:有了无限的数据,学习者就可以输出正确的分类器。这是让人安心的,但由于它的渐近保证,在选择学习者的时候就会显得轻率。在实践中,我们很少处于渐近状态(也被称为“不对称”)。由于前面讨论过的偏差-方差权衡,如果给了无限的数据之后,学习者A比B更好,那么在给了有限数据的情况下,通常学习者B比A要更好。
 
在机器学习中,理论保证的主要作用不是作为实际决策的标准,而是作为算法设计的理解和驱动力的来源。在这种能力下,它们非常有用,事实上,理论与实践的密切互动是机器学习多年来取得长足进步的主要原因之一。不过需要注意的是:学习是一种复杂的现象,仅仅因为学习者既有理论上的依据又在实践中工作并不意味着前者是后者的原因。
 
 
▌7. 特征工程是关键
 
最终来看,有些机器学习项目能成功,而有些却失败了。那是什么造成了这样的差异?显而易见,最重要的原因应该是使用特征的方式。如果你有许多独立的特征,而其中每一个都和这一类相关联,这种情况下学习起来很容易。相反,如果这个类是一个关于特征非常复杂的函数,那就可能无法学习它。通常情况下,原始数据不是可以直接用于学习的形式,但是可以从中构建特征。这通常是机器学习项目中需要花费大部分时间的地方。它往往也是最有趣的部分之一,因为可以发现数据直觉、创造力和“黑科技”与纯技术性东西是同等重要。
 
常常令初学者感到惊讶的是,在机器学习项目中,研究机器学习算法花费的时间是非常少的。但是,如果你考虑了收集,整合,清理和预处理数据的时间,以及在设计特征上很多次尝试和失败的时间,那你就不会对之前的现象感到惊讶。
 
另外,机器学习中建立数据集和训练模型的过程不是一次性的,而是包含训练模型,分析结果,修改数据和(或)模型并重复迭代的过程。训练通常是花费时间最少的部分,但那是因为我们已经很好掌握了其中的技巧!而特征工程就显得更加困难,因为它具有很强的针对性,而模型在很大程度上是可以通用的。但是,两者之间没有明显的界限,这也是为什么能促进知识整合的模型才是最有用的模型。
 
 
 
 
 
▌8. 数据比算法更重要
 
在大多数计算机科学中,两种主要的有限资源是时间和内存。在机器学习中,还有第三种:训练数据。哪一种资源会成为计算机科学发展的瓶颈,年复一年,一直在变化。在20世纪80年代,这种瓶颈往往是数据。而在今天,却是时间。我们有大量可用的数据,却没有足够的时间来处理它,所以这些成为了没用的数据。这产生了一个悖论:即使原则上有更多的数据意味着可以训练更复杂的分类器,而实际上更简单的分类器才能被广泛使用,因为训练复杂的分类器需要很长的时间。这个悖论的部分答案是想出一种快速训练复杂分类器的方法,事实上在这个方向的确已经出现了显著的进展。
 
使用那些比期望回报更小的智能算法的部分原因是为了更加拟合数据,而所有的智能算法都做同样的事情。当你认为表征规则集和神经网络不同时,会令人感到惊讶。但事实上,规则项很容易被编码为神经网络,而在其他表征之间也存在类似的关系。所有的模型算法本质上的工作都是通过将近似的样例分组到同一个类,他们之间关键的区别在于如何定义“近似”。在数据是非均匀分布的状态下,模型会产生大量不同的边界,同时在重要的区域(即具有大量训练样例的那些区域,也是大多数测试样例可能会出现的区域)中也做出相同的预测。这也有助于解释为什么强有力的训练可能是不稳定的,但结果仍然准确。
 
 
 
通常,首先尝试最简单的学习模型(例如,朴素贝叶斯,k-最近邻)是值得的。虽然更复杂的模型更具诱惑力,但他们通常难以使用,因为如果你想获得好的结果,你需要踩更多的坑,而且这类模型的算法细节通常是不透明的。
 
模型可以分为两大类:具有固定大小的表征,如线性分类器;以及可以随数据一起增长的表征,如决策树。固定大小的学习器只能利用一定的数据。原则上可变大小的学习器可以在给定足够数据的情况下拟合任何函数,但实际上由于算法或计算成本的限制,他们可能达不到这一效果。而且,由于数据维度带来的灾难,现有的数据量根本还不够。出于这些原因,如果你愿意付出努力的话,那些能充分利用数据和计算资源的智能算法,往往会得到相应的回报。设计学习器和学习分类器之间没有明显的界限,相反,任何给定的知识都可以编码在学习器中或从数据中学到。所以在机器学习项目中,设计学习器往往会成为其中重要的部分,而从业者需要具备一定的专业知识。
 
 
▌9. 训练不止一个模型
 
在机器学习发展的早期阶段,每个研究者都有自己最喜欢的学习模型,并有一些先验的理由去相信它的优越性。在尝试很多不同方法上做了大量的努力,并选择了结果最好的一个。然而系统的经验比较表明,应用对象不同,最好的学习模型也是有所不同,而且包含许多不同学习器的系统开始出现。现在努力尝试许多学习器的许多变体,选择结果最好的一个。但随后研究人员注意到,如果不是选择去找到最佳变体,而是融合许多变体,结果通常是要好得多。而且对研究人员来说没有额外的工作量。
 
 
 
现在,创建这样的模型融合是机器学习标准化流程。最简单的融合技术,称为套袋(bagging),我们通过重新采样简单地生成训练集的随机变化,分别学习一个分类器,并通过投票策略来融合结果。这种方法是有效的,因为它大大降低了模型的方差,而只是稍微增加了偏差。在Boosting算法中,训练样例有权重,而且这些都是不同的,所以每个新的分类器都集中于前面那些往往会出错的样例上。在stacking算法中,单个分类器的输出是“更高级”学习器的输入,这个学习器需要计算出如何最好地组合它们。
 
也存在许多其他的技术,而总体趋势是越来越大的模型融合。在Netflix prize比赛中,来自世界各地的团队争相构建最佳视频推荐系统。随着比赛的进行,参数团队发现把他们自己的学习器和其他小组的结合起来,并且再与其他组合并为更大的模型,能取得最好的成绩。冠军和亚军都是融合了100多个学习器,而将两只队伍的学习模型再一融合,能进一步提高成绩。毫无疑问,将来我们会看到更大的学习模型。
 
 
▌10 . 简单并不意味着准确
 
奥卡姆剃刀定律阐明,如无必要,无增实体。在机器学习中,这通常意味着,给定两个具有相同训练错误的分类器,两者中较简单的可能具有最低的测试错误。有关这一说法的证据在文献中经常出现,但事实上有很多反例,“天底下没有免费的午餐”定理也暗示它不可能是真的。
 
 
 
我们在前一节看到一个反例:模型融合。即使在训练误差已经达到零之后,通过添加分类器,增强融合模型的泛化误差仍然在不断提高。因此,与直觉相反,一个模型的参数数量与其过度拟合倾向之间没有必然的联系。
 
其实,更复杂的观点是将复杂性等同于假设空间的大小,因为较小的空间允许假设由较短的符号表示。像上面有理论保证的那部分界限就可以被认为是在暗示更短的假设能更好地概括。这可以通过给空间中的假设分配更短的符号来进一步论证,这些空间我们是有先验偏好的。但是,把这看作准确性和简单性之间权衡的“证据”,就会是循环推理:我们做出假设,人们喜欢更简单的设计,如果它们是准确的,那就是因为我们的偏好是准确的,而不是因为在我们选择的表征方式上假设是“简单的”。
 
 
▌11. 可表征不意味着可学习
 
本质上,所有用于可变规模学习器的表征都与“每个函数都可以用这样的表征方式来表示或近似”的定理相关。基于此的理论保证,热衷于表征方式的研究者经常忽视所有其他的部分。但是,仅仅因为一个函数可以表征并不意味着它可以被学习。例如,标准的决策树学习器不能比具有训练样例的决策树学习更多。在连续的空间中,使用一组固定的原语来表示简单的函数通常需要无限数量的内容。
 
 
 
另外,如果假设空间具有许多评价函数的局部最优值,那么往往是这样,即使学习器具有表征能力,也可能找不到真正的函数。对于有限的数据,时间和内存,标准的学习模型只能学习所有可能函数的一小部分,而这些子集对于具有不同表征能力的学习器是不同的。因此,关键的问题不是“能否表现出来”,这个问题的答案往往是无关紧要的,而是“能否学习它?”,也值得去尝试不同的学习器(并可能是把它们结合起来)。
 
 
▌12. 相关性并不意味着因果关系
 
研究人员经常指出一点,相关性并不意味着因果关系,因此这也许是不值得的。但是,尽管我们所讨论的那种学习器只能学习相关性,但他们的结果往往被视为可以表示因果关系。这不是错的吗?如果是的话,那么为什么人们要这样做呢?
 
 
 
而事实往往是,学习预测模型的目标是用它们作为策略的指南。如果发现啤酒和尿布经常在超市同时被购买,那么也许把啤酒放在尿布部分旁边就会增加其销量。但是实际上很难说清楚相关实验。与实验数据不同的是,机器学习通常应用于预测变量不受学习器控制的观测数据。虽然一些学习算法可能会潜在地从观测数据中提取因果信息,但是它们的适用性会受到限制。另一方面,相关性是潜在的因果关系的一个标志,我们可以将它作为进一步研究的指导。
 
 
作者 | James Le
原文链接| https://towardsdatascience.com/12-useful-things-to-know-about-machine-learning-487d3104e28

程代展研究员:我的痴迷

逢人只说三句话,未可全抛一片心
 
昨天看到罗汉江博主的一篇精选博文《学习什么技术可以在退休后再做20年?》,该博文已有近万次阅读和60余个评述,看来编辑MM是选对了戴花人。博文的最后一句是:“感觉科研,退休后,如果不是很有条件、很有水平,估计是做不动了。您说呢?如果您退休了,还能坚持独立做科学研究,那么和大家分享一下您的经验吧。”我是2011年初(65岁)从科学院退休的,算是响应罗博主的召唤,抑或是回答一些关心我的博友们的疑问,我愿将自己近4年的历程和心路做一披露。
 
退休至今,我的科研工作一直照旧,自己觉得,一点不比退休前逊色。不知算不算“很有条件”:数学院给我保留了一个旧办公室,另外,我是山大特聘教授,在济南也有一个办公室。我还是哈工大的兼职博导,在这三处都还有博士生。我目前负责一项国家自然科学基金面上项目,参加一项重点项目,不缺基金。也许我的条件比大多数退休教授会好一点,但我觉得,我真正需要的只是一台计算机,能上网查资料、能打文章、还能通过网络投稿,就够了。至于“很有水平”,那就别说打肿了脸,就是浑身上下都打肿了,也充不成的。年纪大了,见多了,对自己的认识也清楚了一点:自己顶多也就是中上智力水平。如果有什么稍强一点,那就是我有幸受过Washington大学博士课程的严格训练,基础较扎实。
 
假如说我也“很有”点什么,那就是我对科研的那份“痴迷”。除了学术出访,我几乎每周七天在办公室工作,不是在纸上写写算算,就是在计算机上编程验证。研究工作是我心目中的唯一,不管走在路上还是坐在车子上,心里想得最多的还是那些正在烦恼着的数学问题。有时半夜里想到什么,会爬起来推推公式;有时想起白天的错误,会躺在床上睁着眼睛盼天明,好到办公室去改。APEC放假的那几天,几乎每天都是我走进办公楼楼道,打开走廊的灯。心里有一种自豪感:即使我不是到办公楼的唯一,也是第一。
 
那么,我究竞在做什么呢?一句话,还是在用我们自己提出的矩阵半张量积解决各种实际问题。前些年主要是布尔网络的控制,近三、四年主要是博弈论。例如,上一期的Automatica上有我的一篇长文:“On Finite Potential Games”,它给出判断一个博弈是势博弈的充要条件,以及势函数的计算公式。研究博弈的学者都知道,这是个困难的问题。例如,[2]中提到:“It is not easy, however, to verify whether a given game is a potential game.”(然而,检验一个博弈是否是一个势博弈是不容易的)。最早的检验方法是Monderer和Shapley在1996年提出的[3],Shapley是2012年诺贝尔经济学奖得主。[3]的算法复杂度是$O(k^4)$。后来,对只有两个玩家的特殊情况,[4,5]等将算法复杂度降到$O(k^3)$,再后来,[2]将其降到$O(k^2)$。而我的结果是一个简单的线性方程组(称为势方程,方程左边与具体博弈无关,只有右边常数来自具体博弈)。一个博弈是势博弈当且仅当该线性方程组有解。这个结果不仅简洁,而且是对任意位玩家的,文章进而给出了势函数的计算公式。这篇文章投出后,一次就被“provisionally accepted”,小修后,很快就接受发表了。期盼这个工作,或许会被历史留下来。
 
前几天看黄且圆的一本书《大学者》,其中有王元院士的一句话(大意):“最近看陈景润的文章,觉得他的文章有三分之一是不要写的,而我自己的文章有二分之一是不要写的。”看了以后很感动,知道了一个真正的学者是怎样看待学术论文的。退休之后,没有了评职称或年终检查的压力,写文章也没有实在的好处,还真可以不受浮燥的影响,考虑一些深刻的问题,写一两篇真有价值的文章。
 
常听到有年轻学生说,做科研找不到题目。我想讲讲自己的体会。例1:我提出矩阵半张量积后,曾经只是因为一时的兴趣,将它用于逻辑等式的表达和检验。2008年初,在香港一次会议上听一位清华年轻教师的报告,讲到一般布尔网络的不动点极限圈难以计算。布尔网络是逻辑动态系统,我头脑里突然转到半张量积表示。那天晚上,我把他请到我住处,我说:“我给你讲,你看我的理解对不对?”他给了我许多帮助,最后,我对他说:“我可能会找到一般公式。”这就开始了我此后数年关于布尔网络控制的研究。例2:我在2013年ICCA会议上听了新加坡一个年轻人的报告,第一次听说势博弈,和他交流后深感有趣。此后,势博弈成了我主要研究方向之一。除了前面提到的那篇文章,还有在审的关于有限博弈分解的文章。例3:我们所有一位年轻助研对博弈深有研究,为了读懂他的一篇关于对称博弈的文章,我向他请教不下十余次,最后终于弄懂了,现在,对称博弈的群结构和向量空间结构成了我近期研究的一个重点。例4:哈工程有个博士生,用有限自动机做布尔控制网络的能观性,很有创新性。我不懂有限自动机,他的文章很难看懂。但我感到这里有些闪光的东西,我把他请来讲了几天,然后我再去看书和他的文章,终于明白了。现在,他的方法已经成了我近期研究的一个有效工具……
 
假如你真心喜欢你从事的科研工作,你就会像狮子、老虎寻找食物,猎犬寻找猎物一样,对那些相关的科学问题嗅觉敏感;会像年轻男女对异性那样,处处留心,对它们充满好奇和吸引力。我觉得自己最有成就感的时刻,是我读懂了一篇论文,或学会了一种新方法的时候。这时会觉得,我的学问又长了一点,我的人生又充实了一点。假如你觉得科研味同嚼蜡,那就尽快离开罢,这里不适合你。否则,它甚至会让你觉得生不如死。顺便说一句,我遇到的那些年轻的晚辈都是我的老师。其实,今天中国科研的主力就是那些年轻的老师和研究生,他们充满了活力和创新思维。
 
陶哲轩最近有一篇博文:“做数学一定要是天才吗?”很受关注。其实,我还是相信数学需要天才。像证明费尔马大定理的Wiles,证明庞加莱猜想的Perelman,肯定是天才。至于将来解决黎曼猜想,或者哥德巴赫猜想的,肯定也是天才。伽罗华是天才,连他同时代最优秀的数学家都看不懂他的东西。黎曼是天才,他一生共发表15篇论文,每篇都开拓了一个新方向。我认为:数学学科的发展,比任何其他学科都更需要天才脑瓜。华罗庚是数学天才,陶哲轩也是数学天才,他们都反对天才的重要性,这其实是因为他们饱汉不知饿汉饥,或许也是一种谦虚的表现吧。
 
但是,陶哲轩文中的一段话我十分同意。他说:“只要你受过训练,拥有热情,再加上些许才智,一定会有某个数学的方面等着你做出重要的,奠基性的工作。这些也许不是数学里最光彩照人的地方,但却是最健康的部分。”(As long as you have education,interest,and a reasonable amount of talent,there will be some part of mathematics,where you can make a solid and useful contribution. It might not be the most glamorous part of mathematics,but actually this tends to be a healthy thing.) 我相信,一般人(指像我这样智商中等的人),如果投身其中,坚持不懈,还是有希望在一些有意义的数学问题上做出贡献的。
 
什么是“有意义”而又不是“最光彩照人”的数学问题呢?它不是什么数学难题,但却有强烈的工程背景和需求。举个例子说:1994年的诺贝尔经济学奖得主,数学家纳什。他提出著名的纳什均衡,证明了它的存在性。纳什定理的证明,基于不动点原理,懂点泛函分析就能看懂。虽然我在Washington大学修过数学系博士生的“泛函分析”、“近世代数”、“微分流形与黎曼几何”、“代数几何”等近代数学课程,而且成绩全A,但像费马大定理或庞加莱猜想的证明,读懂它们,我想都不敢想。这些才是“最光彩照人”的数学,是对人类智慧的挑战。
 
数学家Milnor(Fields奖与Wolf奖获得者)在评价纳什的工作时说:“纯粹数学家对任何数学工作的评价往往基于他在数学上的深度和广度。按照这种方式看,纳什的获奖工作只是一个巧妙但并不出人意料的对熟知方法的应用。但是,当数学被应用到人类知识的其他分支时,我们必须提出一个完全不同的问题:这个新的工作能让我们对现实世界的理解增加到何等程度?基于这个理由,那么,纳什的工作完全不逊色于一场革命。”我相信不是天才做不了“最光彩照人的数学”,但完全有可能做出类似纳什均衡这样有意义而且对人类社会的贡献比“最光彩照人的数学”毫不逊色的工作。
 
最近,应《控制理论与应用》编辑部的邀请,写了一篇关于逻辑系统代数状态空间方法的综述文章[6],为此查了一些文献。看到自己提出的工具、理论和方法,被国内外这么多学者应用到这么多不同的领域中,感到一种深深的满足:作为一个科研人员,还有什么荣誉或奖赏能比自己的工作得到承认、应用和推广更珍贵的呢?有人说:“飞蛾投火是为了寻找光明”,还有什么比将人生献给探索未知,寻求光明更让人陶醉的了?
 
我不知道我的研究工作还能做多少年,但我相信,如果没有意外,我会在计算机前坐到生命的最后一天。每天早晨,我都会对自己说:“过去的日子已经被上帝收回,而今天,是属于我的最年轻的一天。”卢梭说:“大自然塑造了我,然后把模子打碎了。”其实,每个人都如此,独一无二。易卜生说过:“人的首要天职是什么,答案很简单:做你自己。”我决无意对早晨做操,昨上跳舞的老太太置啄半句,也不会低看白天在马路边下棋或围观的我的同龄人。每个人都有权选择自己的生活方式,只要每天都过得充实就好。
 
我给自己设计了一个墓碑,不要名字。
 
上面是:$A\ltimes B=?$
 
下面是:知道它,就知道他;不知道它,又何必知道他?
 
 
 
程代展,2014年11月15日
 
 
 
参考文献
 
[1] D. Cheng, On finite potential games, Automatica, 50(7): 1793-1801, 2014.
 
[2] Y. Hino, An improved algorithm for detecting potential games, Int. J. Game Theory, 40: 199-205, 2011.
 
[3] D. Monderer, L.S. Shapley, Potential games, Games Econ. Theory, 97: 81-108, 1996.
 
[4] T. Ui, Robust equilibria of potential games, Econometrica, 69: 1373-1380, 2001.
 
[5] J. Hofbauer, G. Sorger, A differential game approach to evolutionary equilibrium selection, Int. Game Theory Rev. 4, 17-31, 2002.
 
[6] 程代展、齐洪胜, 逻辑系统的代数状态空间方法的基础、现状及其应用,《控制理论与应用》, (in press).

昨夜无眠,为了一个学生

昨夜无眠,为了一个学生。
    五年前,他在清华大学数学系四年级。他可以保送直接攻读博士学位,参加了我们所的入学考试后,研究室建议我考虑他。面谈后,我同意了。
    事情开始得非常顺利,他请我担任他大学毕业论文的导师,我给了他一个解矩阵半张量积方程的小题目。讨论了几次之后,他就做下去了。他很快进入角色,做了一些小的结果。他的毕业论文,我修改过。后来他告诉我,得了“优”。我也比较满意,觉得他赢在了起跑线上。
    硕博连读的第一年,他在研究生院上课,接触不多。第二年回所,我很快发现了他的优点。从素质上说,他数学基本功扎实,和他讨论数学问题是一种享受。一些需要细想或计算的问题,交给他就好了。少则数小时,多则一、两天,一定会给你一个“Yes”或“No”的解答。
    他在科研上的敏感性也很难得。例如在讨论布尔网络可控性时,他首先发现了控制传递矩阵的特性,我们一起,很快导致了一个很简洁的能控性公式。这个公式不久后被两个以色列人重新发现。碰巧我是他们文章的审稿人,我告诉他们:一模一样的公式我们已经发表了。这是一个比较深刻的结果,后续引用也很多。没有他,这就不是我们的了。
    他在实验室口碑很好,他负责研究生的一些组织工作,很负责,室领导也很满意。他被认为是室里最用功的学生,白天、黑夜都在实验室干活。虽然家在北京,但周末常不回家,有时回家看看,半天就回来了。
    他几乎是个无可挑剔的好学生,听话出活,对我的要求(现在反省可能有些过份了),从来不说:“No”。我渐渐地被他感动了,将自己的希望寄托在他身上。我跟他说:“我是一个失败的运动员,当我成了教练员,就把全部希望放在了学生身上,但愿他们能实现自己当年的梦想。”
    当博二开始的时候,他的研究成果已经相当多了。为了他的成长,我对他提了个要求:30%时间做研究,70%时间念书。这一年,他主要上了微分几何以及相对论的课。另外,由于自己主要在确定性方向工作,我不希望他在随机方面有缺陷。
    我让他自学“随机过程”,每周报告一次,用的教材是Z. Brzezniak, T Zastawniak, Basic Stochastic Processes。我要他连每一道习题都要讲清楚。到了第二学期,听众只剩我一个人,我们还是一直坚持到讲完。事实证明,这些结果在他后面关于概率布尔网络及混合策略博弈的工作中得到很好的应用。
    我自己一生吃了英语的不少亏,因此,我一再强调他英语一定要过关。从博一开始,我每年都安排他出国开会至少一次。博三,在我的协助和支持下,安排他到英国、美国、新加坡等进行学术访问。上个暑假,他到英国Glasgow访问了两个半月,他明天就要去美国Texas Tech Univ.访问四个月。新加坡的Xie教授答应他什么时候去都可以。
    他有一张令人羡慕的成绩单。他已经发表了十几篇期刊论文、十几篇会议论文(至少一半是国际会议)。还有一本和我及我另一个毕业学生合写的专著:“Introduction to Semi-tensor Product of Matrices and Its Applications”,World Scientific (600 pages)。他的论文包括IEEE TAC的Regular Paper (第一作者),Automatica的Regular Paper (第二作者),Systems and Control Letters (第一作者),中国科学 (第一作者),等等。同行一看就知道这些文章的份量。
    他还有若干在审或待发表的文章。例如,他在Glasgow大学访问时写的一篇文章。他曾要求我参加,我要他把我名字去掉,给我道个谢就行。我就是希望培养他真正独立从事科研的能力。这篇文章投IEEE TAC,最近编辑部来信,作为 Regular Paper,一次就接受了。IEEE TAC是IEEE CSS的旗舰杂志。
    他多次被评为三好学生,获得若干种奖学金,今年得了数学院的院长特别奖。他还得过控制界很有影响的关肇直奖。他才二十五岁!我对他充满期待,也充满信心。他成了我对未来的一个梦!
    我坚持要求,他毕业后到国外做两年博士后。他已经得到英国Glasgow Univ.和瑞典Royal Institute of Technology的博士后邀请(注意,不是“申请获准”,而是“邀请”)但我认为他应当到正在最前沿做最好的研究工作的地方去。半年前我和UCSB大学的一位当红教授联系,他当时口头同意接受他。不久前在日本见到该教授,确定在今年CDC两人见面一谈,算是Interview罢。
    这似乎是一个美丽的故事。然而,矛盾出现在半年前。一天,他突然跟我说,毕业后他想去银行,或者到中学当教师。他还告诉我,他已经考过会计师。我大吃一惊,但以为是年轻人一时头脑发热。几次争辩后,我甚至义正辞严地对他说:“你就死了这条心罢,我是绝对不会答应的。”
    后来,他同意了我这样的建议:先做两年博士后,两年后再做决定。我跟他明确说:“我既不要你跟我做,也不要你做与我有关的题目。但你天生就是做科研的材料,不能自暴自弃。”
    时间过得飞快,上周五,他突然对我说,北京某中学给他Offer,要在本周二(今天)前签约,而他明天就要到美国去了。我一下子急了,和他谈了两个钟头。好话坏话都说尽了。好话是:“你这样做,中国,甚至世界可能会失去一个优秀的科学家。”坏话是:“年轻人要有理想,有抱负,怎么可以向往‘老婆孩子热炕头’的生活?”我告诉他:“你一定会悔的。”可不管我怎么说,他就只重复一条理由:“做研究太累,没兴趣,不想做了。”最后,他答应再好好想一想,大家就不欢而散了。
    周一见了他,就问他想得如何。他说回了一趟河北老家,和父母以及老家亲戚都谈过,他们都支持他。我傻眼了,说他们不了解科研,也不了解你的情况,你应该和教授们谈谈。昨天,室里许多人跟他谈。我还搬兵找到陈老师,心想:“我的话你不听,老院士劝你,总该听罢?”陈老师是个爱才的人,一听这事也急了,立刻答应:“我可以找他。”可惜,陈老师似乎也没能动摇他的决心。
    昨天我们对他是连番轰炸,直到晚上,几位年轻人,还有一位来访的年轻教授,一起请他吃饭。准备在席间再劝劝他。
    昨晚我回到家里,饭后一个人发呆,欲哭无泪。我曾对他说过:“我的底线是:最后的决定权还是你的,我不会强迫你。”那位访问教授背后曾问我:“你明明是为他好,明明知道他的决定是错的,为什么不能强迫一下?”这勾起了我的心病,我告诉她:“因为强迫儿子按我的意志生话,我把他逼上了困境。我不能再……”
    昨天晚上十点多,我实在忍不住,给一位年青同事打电话。他告诉我:他们的“鸿门宴”还在继续,只是仍无进展。现在,也许他正在签约……反省自己,我一直把他当着一个听话的好孩子。总是像父母亲一样强行安排他的一切,很少了解和尊重他的意愿。我对这一切的解释就是:“我是为了你好!”可这够吗?
    现在的我,是又一次“哀莫大于心死”。可谁能告诉我:是我错了,还是他错了?
 
程代展,2012年11月13日

 

我为什么逃离科研
 
 
      在来美国的前一天晚上和程老师吃饭的时候,师兄告诉我们程老师下午发的博客已经上科学网首页了,但当时也只有40多个回复而已,我们也没有在意,毕竟程老师的博文经常上科学网首页。当晚我们并没有继续讨论我工作选择的事情,而是像往常一样随便侃了侃,甚至还讨论了点学术问题。回宿舍以后我还跟几个好友开玩笑的说“哥出名了,上科学网首页了”。但没想到的是,我真的出名了,第二天我下飞机开了手机以后,短信不断。这几天很多朋友、同学、实验室老师、甚至毕业后就一直没有联系过的本科辅导员都纷纷对我表示关心,或支持我的决定,或劝我重回科研道路,不管怎样,我都很感动,在这里先向他们的关心表示感谢。当然也还有几位记者发邮件过来要采访。我本来不想回应,想继续沉默下去的,但是程老师说他认为这个事情的讨论对许多年轻博士生是有好处的。仔细想一想,这也许是我这个科研逃兵在离开前能对科研界做的最后的,其实也是唯一的贡献了。反正也已经出名了,程老师把书名、奖项都列出来了,想肉我的早就肉到了,死猪不怕开水烫了,就发在人人吧。
 
   前面两部分我要先帮程老师和我家里人说几句话,对这些不感兴趣的可以直接从第三部分开始看。
 
一、关于程老师
 
       首先要帮程老师说几句话,因为很多支持我的都说程老师太push了。其实我一直觉得程老师是国内科研界少有的非常nice的导师之一,不但不push,还经常告诫我要多休息,多出去玩玩儿。另外程老师也给我们之间创造很多学术之外的沟通机会,会隔三差五的带我们出去吃饭,和我们几乎是无所不谈。我研一的时候在程老师面前还是非常拘谨的,但没多久就能畅所欲言了。实验室秘书都说程老师的学生都跟他“没大没小”的。只是在和他的交流中我一直不敢说自己以后不想搞科研了,因为我深知程老师对我寄予厚望,我说出来他肯定非常失望的,而又因为这几年和程老师培养出的感情,我不想让他失望。我甚至一直在想就这样坚持搞科研搞下去,但真正到了该抉择的时候,我还是选择了自私的按自己的意愿。
 
二、关于家里的意见
 
       还好我父母都不上科学网、水木这样的网站,不然看到那些说我是因为他们给的压力而放弃科研的猜测后,不知他们会不会鸭梨山大。我父母确实是没钱没权也没啥本事的,不过因为有单位分的房住,他们靠自己不高的工资在北京也是生活无忧的,所以他们也从来没有要求过我赚大钱养活他们,只要我过得开心就好,他们甚至还认为家里如果能出个科学家是件光宗耀祖的事情。我年轻的时候也是向往过赚大钱的,不过渐渐的觉得自己其实更喜欢稳定安逸的生活,钱够花就成,当然能保证稳定安逸的话钱还是多多益善哈。所以如果不是我彻底厌恶了科研的话,我觉得科研这工作挺符合我的要求的,社会地位不低,待遇也足够过比较体面的生活了,关键是极度自由。我光棍节那天回姥姥家(程老师听成了老家,差了个lao,不过这无所谓了)算是开了个会,并不是他们劝我赶紧去挣钱,而是我想问问他们对我选择中学这样一个地位不高,挣钱也不多(不算自己外面接活的话,挣钱真的多不到哪去,被it民工们秒杀,更别提金融界的温拿了。而以我的性格,除非真的缺钱,不然应该不会去接活的),还挺累的职业有没有什么意见。最后大家一致认为我真的厌恶科研的话,坚持干一辈子科研一定不会幸福的,而他们并不在意我的名利地位什么的,中学老师也挺好。
 
三、我为什么逃离科研
 
      其实很简单,唯一的原因就是没兴趣了。没兴趣还算个比较中性的词的话,我其实可以说我已经厌恶科研了,主要原因有两个:
 
       1. 累。但再次强调这不是程老师强迫的,程老师给我安排的大多数任务都没有给定deadline,只是因为我从小被教育成听话的“好”孩子,只要别人给了我任务并且应该是我做的任务,不管我喜不喜欢,都会尽力去完成,不只是科研问题,甚至是帮实验室干杂活,都是完成的既快又好。这样的结果就是导致了程老师以为我喜欢做科研,所以就忍不住不停的给我安排任务。如此恶性循环了下去。后来实验室秘书也说,如果当时我能更加变通的面对程老师安排的任务,给三件就做一件,程老师也不会批评我什么的,而我也不会被自己给自己的压力压垮了。当然比体力累更重要的是心累,体力其实有时候根本就谈不上累,我甚至可以好几天在实验室坐着无所事事的刷着微博逛着人人,甚至干脆出去跟朋友打牌爬山什么的去了,但这时脑子里还一直装着那些想不出来的问题,还有一些该做但实在是很烦,不想去做的任务(比如审一些很水很水很水的文章...),半刻也不得安宁。当我决定退出科研的时候,心里是久违的无比的轻松,而这样的轻松,更加坚定了我的决心;
 
       2. 没能力。这真不是装13。我虽然是有几篇控制界顶级期刊的文章,但顶级期刊的文章不等于是顶级文章。说实话,我还真是觉得我这几篇大文章无论理论上还是应用上都不算真的有用,甚至技术难度上也没啥挑战性,只是相比当今大批的水文,这些算是矬子里拔将军,我也没有为这些文章以及由这些文章而带来的荣誉真正的兴奋过。然后发的那么多其他文章中还有一半以上是程老师被一些国内期刊、会议邀稿而又不好不给面子,临时凑的没啥营养的综述类文章,而且真的是程老师自己主笔的,我只是帮帮忙而已。反正我是觉得这些只能证明我比较勤奋,根本不能说明我有天赋有能力。如果我继续搞科研的话,我能想象出的结果只有两个,要么迫于学校要求发文章的压力沦为灌水机器,虽然还能混得不错,不过天天自己鄙视自己,要么就是坚持不发水文,但又因为能力不足以做出真正有价值的工作而混得很惨。我觉得程老师的博文下面有一条回复对于我的看法是相当正确的:“[682]kanhaoxi 2012-11-17 04:42From what you described, especially "听话出活,对我的要求,从来不说:“No”", this student is clearly not a top student. If he is not even a top student, he will definitely not be a top researcher. In this case, it is better to advise him to get into some other things. Unfortunately, many Chinese professors' definition of top students are different from other people. They usually promote those students similar to this student of yours. This is unfair to truly top students.”
 
       当然也有一些对现在科研界风气的不满,不过这个我了解不深,就不胡说了,说多了被人笑话,还有推卸责任之嫌。
 
四、我为什么选择中学
 
       1. 我觉得我有足够能力应对中学数学的知识。这与我觉得我完全没能力做有价值的科研工作形成了鲜明的对比。不过除了知识能力,教中学更重要的是授课能力。我很清楚我现在的授课能力和优秀教师还有很大差距,但通过了学校的试讲,也在试讲中pk掉了不少北师清华北大的硕士博士们,至少说明了我还是具备基本的授课能力,我也相信授课能力是通过我自己的努力可以提高的。当然除了授课以外,优秀的中学教师还需要很多其他素质,比如基本的师德,对孩子的关心,亲和力等等,但这些我觉得我都还是不错的。
 
       2. 我也很喜欢教会别人知识的那种成就感。我也做过家教,我觉得当几个小时的家教比搞几个小时的科研舒服多了。我今年寒假还帮一个微积分挂了的大一孩子补了两天的微积分,当她告诉我她补考得了90多分的时候,那成就感啊,杠杠的。
 
       3. 生活比较稳定。以后生活中比较麻烦的事情,比如住房、子女入学等都可以解决了(房子不给产权,只是在职就可以住),但是中学老师的工资对一个博士毕业生来说确实不算多。
 
       4. 我真的是没时间找其他工作,找工作的黄金时间我在美国啊。其实我之前真的都准备听程老师话,毕业去做博后了,因为我本来是要10月底就来美国访问的。但签证意外的被check了,于是要晚走半个月。然后没事干,就投了投简历,其实我也只投了4所高中,没有投其他行业,甚至我投的时候我也觉得我一定是赶不上试讲了,其中我在投给人大附的简历中还写道“因为本人11月至3月在美国,如果有幸能有资格通过初选参加试讲,是否可能将试讲安排在3月?”。但没想到有两所学校很快就通知试讲了,其中某个学校的效率意外的高,上午试讲下午群面第二天终面,终面后不让走,等都面完了直接出结果,于是赶上了我能在出国前签约,要不我觉得他们也不会把职位给我留到回国后。这种种意外也算是一种缘分吧,再加上该学校也是所很好的学校,他们的教育改革理念(至少是宣传片上的)我也很欣赏,并且他们的待遇在高中也是很好的,跟家里商量后我就同意了。另外我真的没有考CPA啊,程老师记错了,我怎么会有时间准备CPA.....
 
       当然我也知道当高中老师并不是很轻松的事。比如说很累,不过这点搞过科研的表示呵呵。比如遇到实在不听话的孩子和无理取闹的家长,这种事情比较棘手,我有心理准备,但现在还不知道要怎么处理,以后会从同事那里得到经验的吧。再比如我虽然觉得我通过努力能提高自己的授课能力,但万一再怎么努力也真的不行呢?这个....到时再说吧。
 
 
 
      写了这么多废话,总之就是我确定我对搞科研没兴趣了,而我觉得我对教中学是有兴趣的。我也觉得中学需要引进优秀博士,前提是得保证他们的教学质量,他们会给学生带来更广阔的视野。当然科研界更是亟需人才的,其实哪里都需要优秀的人才的(这是一句废话)。只是我自己肯定不是科研界需要的人才,对科研没有兴趣的人是不可能做出真正有意义的成果的,我希望自己可以是教育界需要的人才吧。就说这么多了。
 
 
原文地址:http://blog.renren.com/blog/86180/882793054
 

LaTeX 技巧

1.求和符号加一撇:\mathop{{\sum}'},参考这里

2.

常用技巧

爱因斯坦名言“一个人的价值,应该看他贡献什么,而不应当看他取得什么。”

1、矩阵的 Frobenius 范数及其求偏导法则

2、关于数学优化算法的权威期刊都有哪些?

1. SIAM Journal on Optimization
2. Mathematical Programming
3. Mathematical Programming Computation
4. Computational Optimization and Applications
5. Optimization Methods and Software
 
作者:Stiefel
链接:https://www.zhihu.com/question/39194485/answer/129350231
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

 

 

学界与工业界的AI研究:有哪些重要不同?

撰文|颜水成(360首席科学家、人工智能研究院院长)

整理|邸利会

 

  

 

我之前在学术界,现在在工业界。现在不少学界的科学家都到公司里面做研发,通常遇到的一个问题是:在工业界从事研发和以前在学界究竟有哪些不同?很多关心研发的人会有这样的疑问。我想从自己的经历出发,谈一下我的体会,希望能提供一些借鉴。

 

去年,我们讲到人工智能有“三要素”:算法、算力和数据。从今年开始,我们把场景加入进来,开始用“四元分析”的方式来理解人工智能。

 

为什么要加入场景?去年大家对人工智能非常热情,包括学校、企业都在讨论。但是,一年过去了,大家在想人工智能到底给我们带来了什么实实在在的价值?其实,加入场景非常重要的原因是人工智能终究是一种技术,人工智能必须要落实到精准的场景,才有它实实在在的价值。

 

学术界追逐精度的极限

 

我们现在来看一下,在学术界是怎么做人工智能。因为人工智能的概念实在太大了,现在深度学习最热,那我们就看下在学术界里研究深度学习,会做一些什么事情。

 

一般情况下,学术界是把问题设立好之后,去思考研究一些新的算法,然后在具体的问题上,力图在精度上达到极限。从深度学习上设计更好的模型结构方面,大家可以看到在过去这些年,像最初的Hinton用最基本的网络结构,到谷歌的GoogleNet,微软的残差网络(ResNet),到今年我们参加比赛所设计的模型,可以看到基础网络结构是推动学术界往前走的核心。但是除了基本的网络结构之外,更大的网络、更深的网络以及不同的网络模型的融合,也是大家追逐精度的常用方法。

 

另一方面,我们要训练这些网络,可能需要更多的计算资源,比如像图形处理器集群(GPU Cluster),比如说我们希望有更便捷的训练平台,比如说像Caffe、MxNet、Tensorflow等等。当然,更重要的是大家在一点点往前推动的同时,积累了很多小的经验,这些经验通过学术报告,通过论文的形式来分享。大家都站在巨人的肩膀上在一步一步往前走。当然,还有怎么样用其它的非标注的数据来提升解决问题的能力。所有的一切都合在一起,在解决具体问题的时候,能够把精度达到极限。

 

学术界很多时候研究的目的,是要有成果论文发在最顶级的学术杂志上,也希望这些算法能够具有普适性,除了能解决自己的问题,其他人也能借鉴,最好能开源,所有的人都可以去使用,这样就能很好的提升自己在这个领域的影响力。

 

刚刚说的像深度学习去解决图像识别的很多问题,大家可以看到在过去的几年,错误在一点一点的降低,这正是大家在追逐精度的极限。

 

没有瑕疵的用户体验如何产生?

 

但是工业界不是这样。工业界要去探索商业,注定要有经济上的考虑,思考盈利模式,那对人工智能的考虑就会不一样。

 

在工业界里待过就会明白,人工智能本身并不是一个产品,不是单纯靠人工智能就能获得利益,必须要通过与自己的业务和场景相结合,才能发挥它的价值,核心算法只是其中的一个模块而已。无论是往前端走,还是往后端走,还是需要很多不同类型的人,才可以做出一个产品。

 

最重要的是,人工智能并不是一个静态的东西。比如说训练出来的模型,要用到某个业务场景里面,业务场景里产生新的数据,这些数据进一步提升人工智能模型的能力,再用到场景里面,这是一个闭环和不断迭代的过程。

 

另一方面,也是很多从学术界到工业界的教授和学者经常很容易犯的一个很严重的错误。就是认为技术在真正推动产品,但其实,用在具体的场景里面,技术只是起到一个非常小的作用,如果说它的贡献大概到30%到40%就不错了。

 

一个成功的产品,还需要产品工程师和非常多的人,大家一起才能做出一个非常完美的用户体验的产品出来。一个核心点就是我们做技术的人,做研究的人,要明白永远没有完美的算法,算法永远是有瑕疵存在的,我们一定要和场景工程师在一起,通过好的产品设计,把这些算法上的瑕疵避免掉,产生没有瑕疵的用户体验。

 

比如说有一个很现实的场景,人脸的检测和定位的技术之后,大家都想做一些非常有趣的增强现实的应用。早期的时候,我们特别享受技术有多么牛,比如早期产品的设计模式,会看一张图能不能把我的脸换成刘德华的脸,即使在脸动的时候,在张嘴闭嘴的时候,看起来都像刘德华。可是,很多时候如果产品的定位是这样子,技术永远都不可能做得非常好,为什么呢?人脸的场景,光照条件或者是姿态不一样,就会产生一种烧伤脸的感觉,不会产生很好的效果。但是,像我们,还有国外的一些创业公司,他们的想法就是没有必要把人脸全都换掉,只要利用人脸定位的技术,可以在脸上加一些花卉,有蝴蝶飞,这样即使人脸定位的技术还不是很完美,还有一些抖动的情况,产生出来的视觉效果,还是可以接受的。这是一个典型的例子,需要算法和产品相互结合才能产生没有瑕疵的用户体验。

 

我最佩服的应该是Snapchat, 他们的技术是做算法的和做工程设计的人在一起,一个一个的效果不停地打磨。他们用的人脸的技术,像分割的技术,像SLAM(simultaneous localization and mapping, 即时定位与地图构建)技术,这些技术都不是完美的。在这种情况下,通过工程师的产品设计,把每一个特效都做的非常有意思,非常酷。

 

此外,除了考虑用户体验,工业界设计一个产品还会考虑其它方面。比如,当前把视觉,语音和相关的技术用在智能硬件上的时候,可能会想,到底这个产品是不是能满足某种高频的刚需?

 

我原来在新加坡每年写很多文章,一年写50、60篇的文章都有可能。那时候有一个很明显的特点,在写文章的时候我们会造一个场景,这个场景从用户需求来说,根本就不存在;从写文章的角度来说是有价值的,从产品的角度来说,不一定有价值。工业界还会考虑一款产品用到的技术有没有成熟?比如说家用机器人,可以端茶送水,可以聊天,这是不可能的,技术上还有一个过程。

 

另外,工业界还会考虑技术成熟了,但有没有壁垒?假设没有技术壁垒的话,今天做一个产品出来,比较前沿的大公司,都有专家团队,你把这个产品做出来立马又失掉了,技术上的壁垒也一定要有。

 

另外一方面,就是学术界想得最少的:我们做一个场景,一定要有变现的模式。没有一个变现的模式,我们的产品出来了,但是今后挣不了钱,也不可能让这个公司维系下去。这些都是工业界和学术界思考的点不一样的地方。

 

用四元分析来看学界和工业界的区别

 

总的来说,学界进行人工智能,深度学习的研究,一直是在追求精度和极限。用四元分析的方法来说就非常有意思,即我们的场景和数据确定了,然后设定一个问题,设定一个数据集,假设有足够多的计算机资源,怎么样设计新的算法,让精度能够达到极限?

 

我们知道有很多的数据集,比如ImageNet,号称人工智能的世界杯;人脸研究界有LFW(Labeled Faces in the Wild,人脸图片的数据库,用来研究不受限的人脸识别问题);在视频领域有美国组织的TRECVID;语音的话有Switchboard。他们共同特点就是:问题和数据都是确定的,用尽量多的计算机资源,去设计不同的算法,最终是希望达到精度的上限。

 

但是我们不得不承认,这里面很多的成果是没有办法商业化的。为什么?在ImageNet上,假设训练了1000多层的网络,把9个或更多网络全部合在一起能达成一个很好的精度,在现实的场景下是不可能用这么大的模型和这么多的资源去做一件事情。所以,很多的成果,是假设将来计算能力达到一定的程度,精度能够达到这个上限。

 

AI研究的另外一个维度是追求用户体验的极限。用四元分析的方法,是把场景和算力固定了。这是什么意思?假设我们要做一个机器人,这个机器人希望它能识别你,这时候场景是确定的。算力确定了是说,这个场景推出的时候,用什么样的芯片和什么样的硬件,其实已经确定了。我们要做的事情是在这样一个确定场景和算力的情况下,怎么样去提升数据和算法,跟具体的应用场景去形成一个闭环,去不断地迭代,去提升它的性能。这跟学术界把场景和数据固定是完全不一样。在这种场景下,可以不停的用收集到的新数据不停提升和优化模型,在数据,算法和场景形成一个闭环。虽然我们能把所有的问题解决,但是在具体的场景下,也有可能逐步地提升它的性能。

 

这时候做的事情很有意思,要做很多数据的清洗、标注。为了把产品的价格降低,比如用一个很差的CPU就能够去做计算,肯定要不停地去优化模型的速度。另一方面,很多时候,满足这种体验的需求会有一些新的问题出来。

 

如果我们仔细想一想,学术界多数做的事情是在思考,在想它的极限在哪,主要用脑;工业界并不是强调用脑,而是用心——就是怎么样能把这个场景做出来,并不一定要有非常高大上的算法,就是要从用户使用产品的维度上,让用户感觉这个产品非常好。

 

学术界和工业界又不是完全割裂的:工业界敢去提某一个产品的设想,是看到了在学术界有一些前沿的成果,可以在工业界来用。同时,工业界也在逐步提炼它的问题,扔给学术界,希望他们去做这种前沿的探索。比如说工业界可以想,三年、五年以后会往哪些方向去推动,他就可以把这些任务推给学术界。

 

现在有很多公司,在中国和在美国纷纷建立AI实验室,其实有两种目标。一方面是长期希望能瞄准将来前沿的领域,做技术的积累;另一方面是要追求产品更好的落地,所以现在很多公司就建起了自己人工智能的实验室。

 

在人工智能深度学习的研究,学术界和工业界的差别还是很大的,同时也相互作用,相互增强。学术界和工业界一起合作,研究和产业相结合,一定会把人工智能带上另外一个阶段。

 

本文系颜水成在最近某论坛的演讲整理稿,经本人确认。

 

关于作者:

颜水成是奇虎/360公司的首席科学家,新加坡国立大学Dean’s Chair副教授。他的研究领域包括机器学习,计算机视觉和多媒体。独自或与人合作撰写了几百篇文章,涉及广泛的研究题目。Google Scholar引用超过20,000次,H指数为66。他同时也是ISI 2014,2015,2016年的高被引研究者。

 

制版编辑: 许逸