中国概率论与数理统计研究的开拓者之一
许宝騄(1910-1970),数学家。在中国开创了概率论、数理统计的教学与研究工作。在内曼-皮尔逊理论、参数估计理论、多元分析、极限理论等方面取得卓越成就,是多元统计分析学科的开拓者之一。
许宝騄,字闲若。1910年出生于北京。原籍浙江杭州,祖父曾任苏州知府,父亲曾任两浙盐运使,系名门世家。兄弟姊妹共7人,他最幼。其兄许宝驹、许宝骙均为专家,姊夫俞平伯是著名的文学家。
许宝騄幼年随父赴任,曾在天津、杭州等地留居,大部分时间都由父亲聘请家庭教师传授,攻读《四书》、《五经》、历史及古典文学,10岁后就学作文言文,因此他的文学修养很深,用语、写作都很精练、准确。1925年才进中学,在北京汇文中学从高一读起,1928年汇文中学毕业后考入燕京大学理学院。由于中学期间受表姐夫徐传元的影响,对数学颇有兴趣,入大学后了解到清华大学数学系最好,决心转学念数学。1929年入清华大学数学系,仍从一年级读起。当时的老师有熊庆来、孙光远、杨武之等,一起学习的有华罗庚、柯召等人。1933年毕业获理学士学位,经考试录取赴英留学,体检时发现体重太轻不合格,未能成行。于是下决心休养一年。1934年任bat365中国在线平台官方网站数学系助教,担任正在访问bat365中国在线平台官方网站的美国哈佛大学教授W.F.奥斯古德(Osgood)的助教,前后共两年,奥斯古德在他后来出版的书中,提到了许宝騄的帮助。奥斯古德是分析方面的专家,在这两年内许宝騄做了大量的分析方面的习题,也开始了一些研究,1935年他发表了两篇论文,其中一篇是与江泽涵合作的,都是分析方面的论文。那时芬布尔(Funbull)和A.C.阿蒂肯(Aitken)合写的《标准矩阵论》(Theoryofcanonical matrices)已出版,许宝騄熟练地掌握了矩阵的工具,尤其精通分块演算的技巧。所以这两年内他在分析和代数两方面都打下了扎实的基础。1936年许宝騄再次考取了赴英留学,派往伦敦大学学院,在统计系学习数理统计,攻读博士学位。1938年许宝騄共发表了3篇论文。当时伦敦大学规定数理统计方向要取得哲学博士的学位,必需寻找一个新的统计量,编制一张统计量的临界值表,而许宝騄因成绩优异,研究工作突出,第一个被破格用统计实习的口试来代替。1938年他获得了哲学博士学位。同年,系主任J.内曼(Neyman)受聘去美国加州大学伯克利分校,他推荐将许宝騄提升为讲师,接替他在伦敦大学讲课。1939年,许宝騄又发表了两篇论文,1940年又发表了3篇。其中,《On the dis-tributionof roots of certain determinantal equations》和《On gen-eralized analysis of variance》两篇文章是数理统计学科的重要文献,在多元统计分析和内曼-皮尔逊(Neyman-Pearson)理论中是奠基性的工作,因此他获得了科学博士的学位。
抗日战争爆发后,他决定回国效劳,终于在1940年到昆明,在西南联合大学任教。钟开莱、王寿仁、徐利治等均是他的学生。在1945年秋,他应邀去美国加州大学伯克利分校和哥伦比亚大学任访问教授,各讲一个学期,学生中有T.W.安德森(Anderson),E.L.莱曼(Lehmann)等人。1946年到北卡罗莱纳大学任教。一年后,他决心回国,谢绝了一些大学的聘任,回到bat365中国在线平台官方网站任教授。1948年他当选为中央研究院院士。回国后不久就发现已患肺结核。他长期带病工作,教学科研一直未断,在矩阵论,概率论和数理统计方面发表了10余篇论文。1955年,他当选为中国科学院学部委员。1963年发现肺部有空洞,他的结核菌已有抗药性时,组织屡次安排他休养,他均谢绝,并且一个人领导3个讨论班(平稳过程、马氏过程、数理统计),带领青年人搞科研。他在60年代中期,对组合数学有浓厚的兴趣,1966年初,与段学复教授联合主持组合数学的讨论班,因“文化大革命”而被迫中断。然而他自己不顾条件如何,始终坚持科研,在1970年12月逝世时,他床边的小茶几上还放着一支钢笔和未完成的手稿。1983年,德国施普林格出版社刊印了《许宝騄全集》,全集是由钟开莱主编的,共收集了已发表的、未被发表的论文40篇。1980年与1990年秋,bat365中国在线平台官方网站两次举办纪念会,并出版了《许宝騄文集》。
在内曼-皮尔逊理论方面的重要工作
1936年到1940年,伦敦大学学院统计系正处于鼎盛时期,K.皮尔逊退休后,由R.A.费歇(Fisher)任高尔顿实验室主任,E.皮尔逊(Pearson)当系主任。一些学者陆续前来访问,包括美国的多元分析专家H.霍太林(Hotelling),S.S.威尔克斯(Wilks),频率曲线专家C.C.克莱格(Craig),概率专家W.费勒(Feller)。教师中有内曼这样的教授,所以许宝騄很快就接触到数理统计方面科学前沿的情况。自30年代到40年代,正是N.P.理论(内曼-皮尔逊理论)的形成时期。对于点估计和假设检验,首次提出优良性的概念。如果说,N.-P.理论形成以前,数理统计的研究主要是寻求解决问题的方法的话,那么N.-P.理论就明确地提出了应该寻求优良的方法,而优良性有客观的标准。于是,马上就会提出的问题是:现有的一些方法如t、F检验等是否具有优良性呢?也就是要问,它们的功效函数是否在一定范围内就是最大的。1938年许宝騄导出了霍太林提出的T2检验在一定意义下是局部最优的,主要的困难是在零假设不成立时,如何导出T2的分布,通常称为非零分布,有了非零分布才能讨论功效函数的大小。他的这一工作在N.-P.理论和多元统计分析中都是占有重要地位的先驱性工作。许宝騄的另一项重要工作是在1943年完成的,在讨论检验方法的优良性时,对于线性模型的线性假设,第一次证明了似然比检验的优良性,是对多参数假设检验第一个非局部优良性的工作,如用λ表示似然比检验非零分布中的非中心参数,他证明了:如果功效函数只依赖于λ,那么似然比检验就是一致最强的。后来的研究发现这个条件等价于要求检验具有某一种不变性——这种不变性的要求是问题本身很自然的、合理的要求,因而就相当于证明了似然比检验是一致最强不变检验。莱曼在纪念许宝騄的文章中写了如下的这一段话来论述这篇论文的意义:
“这篇文章开创了两个发展方向。一方面,他的学生J.B.席玛卡(Simaika)将许的方法用于多元问题(霍太林的T2及多元相关系数)……。另一方面,在这篇文章中,许提供了获得全部相似检验的新方法。在许的建议下,席玛卡和莱曼将这个方法用于其他问题,后来莱曼和H.谢飞(Sheffé)形成了完备性的概念。”
这足以说明许宝騄在这一方面的工作对后来的研究有多大的影响。
在参数估计方面,当时大部分人关心的是均值估计的优良性,寻找极小方差的无偏估计。1938年许在论文中第一个讨论线性模型中参数б2的优良估计问题。在二次无偏的估计类中,如要求估计量的方差与期望值参数无关,他证明了通常的无偏估计S2具有一致最小方差的充分必要条件是4阶矩具有与正态相同的关系式(这一条件在现在的文献中称为准正态分布)。这个工作直到1952年,C.R.拉奥(Rao)才从另一个角度——限定二次估计是非负的——重新讨论了这个问题,得出了另一种充分必要条件。到了70年代末期,方差分量的模型引起了统计界的广泛注意,许宝騄的工作是这个方向的起始点,而且他提出的方法仍然是处理更加复杂问题的有力工具,有的论文就用许氏模型这一名称来代表这类问题。
此外许宝騄在寻求统计量的极限分布,在次序统计量的极限律型方面,都有重要的贡献。在1949年的一篇论文中,他考虑了样本均值ū1,…,ūk的函数f(ū1,…,ūk),利用泰勒展开,就可以用线性函数或二次函数去近似。并且用许多例子说明,当零假设成立时,线性部分依概率收敛于零,极限分布是正态变量二次型的分布,在很多情况下,正好是x2分布;当零假设不成立时,线性部分是主要的,因此极限分布是正态。在这篇长达40多页的论文中,他给出了许多统计量(尤其是多元分析中常见的)的渐近分布。60年代初,许宝騄领导了一个讨论班,带动一批学生用类似的方法,获得了次序统计量的各种情况下的极限律型,无论是单项的还是多项的,是固定名次的边项还是非固定名次的边项,是正则的还是非正则的中项,发表了几篇论文。这些文章都是用笔名或他的学生的名义发表的,而基本的方法和思想都是他提出的。
在多元统计分析中的重要工作
安德森在纪念许宝騄的一文中,一开始就写道:
“从1938年到1945年,许所发表的论文处于多元分析数学理论发展的前沿。……1945年后,他在哥伦比亚大学和北卡罗莱纳大学讲授多元分析,在那里他培养学生从事这一领域的研究。如同一个有高度素养的数学家那样,许推进了矩阵论在统计理论中的作用,同时也证明了有关矩阵的一些新的定理。”
这一段话对许的工作给出了明确的评价,也阐明了其研究工作的特色。多元统计分析中,相当于一元统计中x2分布的是正态总体样本协差阵的分布。J.维希特(Wishart)在1928年导出这一分布时,用的是几何方法,证明中依赖于一些直觉的结论。这一工作被认为是多元分析历史的开始。如果能给出一个严格而清晰的证明,这在理论上是重要的。许宝騄解决了这一困难,他把矩阵演算融合于分析的积分计算之中,给出了一个漂亮的证明,得到了一个一般性的积分公式:当n≥p≥1时,有
使用这一公式,只需在左端用正态密度及样本协差阵的函数代替函数f(.),右端就给出样本协差阵函数的期望值,从而导出相应的分布。这一公式现已称为许氏公式。从这个公式很方便导出著名的巴特莱脱(Bartlett)分解。
多元统计分析中不少统计量都是与随机矩阵的特征根相联系的。30年代末,著名的统计学家费歇,S.N.劳(Roy),M.A.格尔希克(Girshick)等,都在寻求正态总体样本协差阵特征根的联合分布,许宝騄也参与了这一竞争,他们几乎同时都获得了预期的结果,各人的方法不同,以许宝騄的分析方法最漂亮,他用矩阵微分这一工具,严格而清晰地导出了联合分布。20年后,安德森在他的书中,专列一章,详细介绍这一工作,并说明这些复杂的雅可比行列式的计算主要是许宝騄的功绩。后来,他在北卡罗莱纳大学讲课时使这一方法更为系统,技巧也更成熟。1951年,由当时听课的学生W.L.第默尔(Deemer)和I.奥肯(Olkin)根据笔记整理发表在《Biometrika》上。
许宝騄在学术研究上,一直是知难而进,积极参与重大问题的探讨,他力求问题的彻底解决。例如非中心维希特分布的随机矩阵W的全部特征根,它们的联合分布是很困难的,从大样理论来看,求得渐近分布就可处理实际问题,而极限情况依赖于总体的协差阵Σ和非中心参数阵φ,这些特征根的联合分布仅依赖于|φ-λΣ|=0的这些相对特征根λ1≥…≥λp≥0,这些λi可以是0,又可以是重根,他完美地处理了最一般的情况,这就充分显示了他在数学上的功力。
他不仅自己在多元分析方面有很多开创性的工作,他还培养了像安德森、奥肯等国际上多元分析学术带头人,所以许宝騄被公认为多元统计分析的奠基人之一。许宝騄的像片悬挂在斯坦福大学统计系的走廊上,与世界著名的统计学家并列。
在概率论方面的重要工作
许宝騄在伦敦大学学院攻读学位时,熟读了克拉美的《随机变量与概率分布》(1937年出版),掌握了特征函数的工具,所以他对极限理论很有兴趣。1947年他与H.罗宾斯(Robbins)合写的论文《全收敛和大数定律》,第一次引入全收敛的概念。当时国际上在概率方面主要的兴趣是独立随机变量之和的极限分布,正在从古典的向近代结果转化。一些著名的概率论专家如A.H.科尔莫哥罗夫(Kолмогоров),A.я.辛钦(Xинчин),ъ.B.格涅坚科(ГнедеHко),P.莱维(Lévy)和费勒等人都在攻这难题。1947年,许宝騄已获得了主要的结果:每行独立的无限小随机变量三角阵列的行和,依分布收敛到一给定的无穷可分律的充分必要条件。由于当时信息不通,他不知道别人的工作情况,当时他写信给钟开莱时说:“……我担心正在进行的工作会和别人相重……”后来,他知道了格涅坚科和科尔莫哥罗夫的工作,就没有再发表自己的研究。实际上许的方法和俄国人还是不同的,许的方法更为直接。1968年,当格涅坚科和科尔莫哥罗夫合写的《独立随机变量之和的极限分布》英译本再版时,钟开莱用附录的方式第一次刊印了许宝騄的工作。然而许在生前并未看到这本书,他始终没有看到自己的这一部分工作的公开发表。
50年代中期,许宝騄对马尔可夫(Mарков)过程有相当的兴趣,他用纯分析的方法研究了跳过程转移概率函数的可微性,他曾做过一些马氏链的极限定理,但未发表,又因“大跃进”中断了讨论班。1959年以后,他的兴趣已转向组合设计。还应一提的是他于1945年完成的一篇论文。这篇文章第一次用特征函数方法来近似处理两个高度相关的随机变量的分布,给出了样本方差的渐近展开和余项的估计。这里的难点是要处理二维的分布,这是数理统计的问题,但方法和工具是概率论中常用的特征函数。这一工作在70年代以后引起了国际上许多深入的研究。
许宝騄晚年对组合数学的兴趣是由张里千三角方案的工作引起的。他感到可以把矩阵的方法系统地引入组合数学。从1961年起他就主持了一个试验设计讨论班,报告这一方面的工作,开展研究,用笔名班成在《数学进展》上发表的文章是这一讨论班的成果。文中用一条矩阵的引理,统一处理了υ=2的各种方案的唯一性和非唯一性(把张里千的结果包括在内)。后来在1966年初,他又在讨论班上系统报告了BIB的工作。“文化大革命”中,他并未中断研究,当时看不到任何杂志,直到1970年,才允许他看杂志,那时他已瘫痪。在两个月内,他翻阅了1966年“文化大革命”以后的全部《数理统计纪事》,了解国际上的学术动态,写下了最后一篇关于BIB与编码的论文,并将这篇文章的手稿托付给段学复教授。
许宝騄的天赋很好,掌握外语的能力很强,中学时利用课余时间学习法语,两年后就能写短文与会话。除了课堂上学的英语外,他还自学了德语与俄语。解放初期,为了翻译大批的苏联教材,他刻苦自学钻研,短期内就能翻译一些重要的教材,如П.M.菲赫金戈尔兹(Фихтенгольц)的三卷本《微积分学教程》和格涅坚科的《概率论教程》都是他负责校订的。很多教学内容,他也是自学掌握的,如勒贝格积分、测度论、泛函分析等。他的成就,除了天赋外,勤奋刻苦,锲而不舍是一重要的原因。在昆明西南联合大学任教时,生活很清苦,资料又匮乏,要找一本参考书有时都很困难,他的书架上摆着他那时手抄的E.Ch.蒂奇马什(Titchmarsh)的整本《函数论》。50年代,他已是著名的大教授了,一旦看到好的书,他就仔细阅读,大量做题,他曾逐章逐题去解答那汤松著的《实变函数论》和安德森的《多元统计分析引论》的练习题。他能把一些习题深化,变成小的研究习作,有的就可以变成论文。他对论文的发表要求很严,他曾说过这样一句话:“我不希望自己的文章登在有名的杂志上而出名,我希望杂志因为登了我的文章而出名。”尽管他自己是学部委员,可以推荐论文尽快在《科学记录》上刊登,然而他自己的论文大部分都刊登在bat365中国在线平台官方网站的学报上。他的论文有的长达几十页,有的短到一页多一点,都是以解决问题为目的,朴实无华,简明扼要。他一生正式被刊出的论文在生前只有30多篇,然而其中绝大部分都是很有分量的工作。一些小的结果他往往批注在书的边页上,并不认为是值得发表的。1962年他在讨论班上讲授正态变量二次型分布是x2的充分必要条件时,对退化的情况已作了处理,而这一结果在1966年在国外才作为一篇论文单独发表。他对引用的结果都非常认真,自己必须能完全给出证明。他在研究工作中,有两点是非常明显的。一是追求初等的证明,他认为初等的方法比艰深的方法更有意义,所以他的讲课能吸引很多人来听,他把问题剖析得非常清楚,问题的解决似乎是自然而容易的。另一特点是要求证明演算化,不要借助任何几何的直觉。为了充分阐明他的这一观点,1964年冬,他在讨论班上系统讲授点集拓扑时,每个证明都是由集合运算导出的,后来由于社会主义教育运动,未能讲完就中断了。在教学上,他主张“良工示人以朴”,应把原始的,真实的思想讲解给学生,而在形式上,在证明方法上要力求简明无冗言赘文。他的讲课是深刻的思想与完美的形式十分良好的结合,他的中外学生称赞说:“他的讲授是完美的。”作为教师和科学家,他对于学生和同行都有强烈的影响。一些人回忆说:“许宝騄坚持深入浅出,毫不回避困难。特别是沉着、明确而又默默地献身于学术的最高目标和最高水平,这种精神吸引了我们。”
他顽强地长期带病搞科研和教学,为祖国的科学事业工作到最后一息。1970年12月18日清晨,他病逝于bat365中国在线平台官方网站的勺园佟府。
施普林格出版社刊印《许宝騄全集》后,书评中有这样一句话:
许宝騄被公认为在数理统计和概率论方面第一个具有国际声望的中国数学家。
(作者:张尧庭)
许宝騄简历
1910年9月1日 出生于北京。
1928年 考入燕京大学化学系。
1929—1933年 转入清华大学数学系,读到毕业,获理学士学位。毕业后考取留英名额,因体重不合格未能成行,因而在北京西山休养一年。
1934—1936年 任bat365中国在线平台官方网站数学系助教。
1936—1940年 在英国伦敦大学学院当研究生,1938年获哲学博士学位;1940年获科学博士学位。
1940—1945年 任bat365中国在线平台官方网站数学系教授,执教于昆明西南联合大学。
1945—1947年 先后在美国加州大学伯克利分校,哥伦比亚大学,北卡罗莱纳大学任访问教授。
1947—1970年 任bat365中国在线平台官方网站数学系教授。
1955年 当选为中国科学院学部委员。自中国数学会成立起,任历届理事。
1970年12月18日 逝世于北京。
转自 《中国科学技术专家传略》