Eufisky - The lost book

常用技巧

1、矩阵的 Frobenius 范数及其求偏导法则

 

 

学界与工业界的AI研究:有哪些重要不同?

撰文|颜水成(360首席科学家、人工智能研究院院长)

整理|邸利会

 

  

 

我之前在学术界,现在在工业界。现在不少学界的科学家都到公司里面做研发,通常遇到的一个问题是:在工业界从事研发和以前在学界究竟有哪些不同?很多关心研发的人会有这样的疑问。我想从自己的经历出发,谈一下我的体会,希望能提供一些借鉴。

 

去年,我们讲到人工智能有“三要素”:算法、算力和数据。从今年开始,我们把场景加入进来,开始用“四元分析”的方式来理解人工智能。

 

为什么要加入场景?去年大家对人工智能非常热情,包括学校、企业都在讨论。但是,一年过去了,大家在想人工智能到底给我们带来了什么实实在在的价值?其实,加入场景非常重要的原因是人工智能终究是一种技术,人工智能必须要落实到精准的场景,才有它实实在在的价值。

 

学术界追逐精度的极限

 

我们现在来看一下,在学术界是怎么做人工智能。因为人工智能的概念实在太大了,现在深度学习最热,那我们就看下在学术界里研究深度学习,会做一些什么事情。

 

一般情况下,学术界是把问题设立好之后,去思考研究一些新的算法,然后在具体的问题上,力图在精度上达到极限。从深度学习上设计更好的模型结构方面,大家可以看到在过去这些年,像最初的Hinton用最基本的网络结构,到谷歌的GoogleNet,微软的残差网络(ResNet),到今年我们参加比赛所设计的模型,可以看到基础网络结构是推动学术界往前走的核心。但是除了基本的网络结构之外,更大的网络、更深的网络以及不同的网络模型的融合,也是大家追逐精度的常用方法。

 

另一方面,我们要训练这些网络,可能需要更多的计算资源,比如像图形处理器集群(GPU Cluster),比如说我们希望有更便捷的训练平台,比如说像Caffe、MxNet、Tensorflow等等。当然,更重要的是大家在一点点往前推动的同时,积累了很多小的经验,这些经验通过学术报告,通过论文的形式来分享。大家都站在巨人的肩膀上在一步一步往前走。当然,还有怎么样用其它的非标注的数据来提升解决问题的能力。所有的一切都合在一起,在解决具体问题的时候,能够把精度达到极限。

 

学术界很多时候研究的目的,是要有成果论文发在最顶级的学术杂志上,也希望这些算法能够具有普适性,除了能解决自己的问题,其他人也能借鉴,最好能开源,所有的人都可以去使用,这样就能很好的提升自己在这个领域的影响力。

 

刚刚说的像深度学习去解决图像识别的很多问题,大家可以看到在过去的几年,错误在一点一点的降低,这正是大家在追逐精度的极限。

 

没有瑕疵的用户体验如何产生?

 

但是工业界不是这样。工业界要去探索商业,注定要有经济上的考虑,思考盈利模式,那对人工智能的考虑就会不一样。

 

在工业界里待过就会明白,人工智能本身并不是一个产品,不是单纯靠人工智能就能获得利益,必须要通过与自己的业务和场景相结合,才能发挥它的价值,核心算法只是其中的一个模块而已。无论是往前端走,还是往后端走,还是需要很多不同类型的人,才可以做出一个产品。

 

最重要的是,人工智能并不是一个静态的东西。比如说训练出来的模型,要用到某个业务场景里面,业务场景里产生新的数据,这些数据进一步提升人工智能模型的能力,再用到场景里面,这是一个闭环和不断迭代的过程。

 

另一方面,也是很多从学术界到工业界的教授和学者经常很容易犯的一个很严重的错误。就是认为技术在真正推动产品,但其实,用在具体的场景里面,技术只是起到一个非常小的作用,如果说它的贡献大概到30%到40%就不错了。

 

一个成功的产品,还需要产品工程师和非常多的人,大家一起才能做出一个非常完美的用户体验的产品出来。一个核心点就是我们做技术的人,做研究的人,要明白永远没有完美的算法,算法永远是有瑕疵存在的,我们一定要和场景工程师在一起,通过好的产品设计,把这些算法上的瑕疵避免掉,产生没有瑕疵的用户体验。

 

比如说有一个很现实的场景,人脸的检测和定位的技术之后,大家都想做一些非常有趣的增强现实的应用。早期的时候,我们特别享受技术有多么牛,比如早期产品的设计模式,会看一张图能不能把我的脸换成刘德华的脸,即使在脸动的时候,在张嘴闭嘴的时候,看起来都像刘德华。可是,很多时候如果产品的定位是这样子,技术永远都不可能做得非常好,为什么呢?人脸的场景,光照条件或者是姿态不一样,就会产生一种烧伤脸的感觉,不会产生很好的效果。但是,像我们,还有国外的一些创业公司,他们的想法就是没有必要把人脸全都换掉,只要利用人脸定位的技术,可以在脸上加一些花卉,有蝴蝶飞,这样即使人脸定位的技术还不是很完美,还有一些抖动的情况,产生出来的视觉效果,还是可以接受的。这是一个典型的例子,需要算法和产品相互结合才能产生没有瑕疵的用户体验。

 

我最佩服的应该是Snapchat, 他们的技术是做算法的和做工程设计的人在一起,一个一个的效果不停地打磨。他们用的人脸的技术,像分割的技术,像SLAM(simultaneous localization and mapping, 即时定位与地图构建)技术,这些技术都不是完美的。在这种情况下,通过工程师的产品设计,把每一个特效都做的非常有意思,非常酷。

 

此外,除了考虑用户体验,工业界设计一个产品还会考虑其它方面。比如,当前把视觉,语音和相关的技术用在智能硬件上的时候,可能会想,到底这个产品是不是能满足某种高频的刚需?

 

我原来在新加坡每年写很多文章,一年写50、60篇的文章都有可能。那时候有一个很明显的特点,在写文章的时候我们会造一个场景,这个场景从用户需求来说,根本就不存在;从写文章的角度来说是有价值的,从产品的角度来说,不一定有价值。工业界还会考虑一款产品用到的技术有没有成熟?比如说家用机器人,可以端茶送水,可以聊天,这是不可能的,技术上还有一个过程。

 

另外,工业界还会考虑技术成熟了,但有没有壁垒?假设没有技术壁垒的话,今天做一个产品出来,比较前沿的大公司,都有专家团队,你把这个产品做出来立马又失掉了,技术上的壁垒也一定要有。

 

另外一方面,就是学术界想得最少的:我们做一个场景,一定要有变现的模式。没有一个变现的模式,我们的产品出来了,但是今后挣不了钱,也不可能让这个公司维系下去。这些都是工业界和学术界思考的点不一样的地方。

 

用四元分析来看学界和工业界的区别

 

总的来说,学界进行人工智能,深度学习的研究,一直是在追求精度和极限。用四元分析的方法来说就非常有意思,即我们的场景和数据确定了,然后设定一个问题,设定一个数据集,假设有足够多的计算机资源,怎么样设计新的算法,让精度能够达到极限?

 

我们知道有很多的数据集,比如ImageNet,号称人工智能的世界杯;人脸研究界有LFW(Labeled Faces in the Wild,人脸图片的数据库,用来研究不受限的人脸识别问题);在视频领域有美国组织的TRECVID;语音的话有Switchboard。他们共同特点就是:问题和数据都是确定的,用尽量多的计算机资源,去设计不同的算法,最终是希望达到精度的上限。

 

但是我们不得不承认,这里面很多的成果是没有办法商业化的。为什么?在ImageNet上,假设训练了1000多层的网络,把9个或更多网络全部合在一起能达成一个很好的精度,在现实的场景下是不可能用这么大的模型和这么多的资源去做一件事情。所以,很多的成果,是假设将来计算能力达到一定的程度,精度能够达到这个上限。

 

AI研究的另外一个维度是追求用户体验的极限。用四元分析的方法,是把场景和算力固定了。这是什么意思?假设我们要做一个机器人,这个机器人希望它能识别你,这时候场景是确定的。算力确定了是说,这个场景推出的时候,用什么样的芯片和什么样的硬件,其实已经确定了。我们要做的事情是在这样一个确定场景和算力的情况下,怎么样去提升数据和算法,跟具体的应用场景去形成一个闭环,去不断地迭代,去提升它的性能。这跟学术界把场景和数据固定是完全不一样。在这种场景下,可以不停的用收集到的新数据不停提升和优化模型,在数据,算法和场景形成一个闭环。虽然我们能把所有的问题解决,但是在具体的场景下,也有可能逐步地提升它的性能。

 

这时候做的事情很有意思,要做很多数据的清洗、标注。为了把产品的价格降低,比如用一个很差的CPU就能够去做计算,肯定要不停地去优化模型的速度。另一方面,很多时候,满足这种体验的需求会有一些新的问题出来。

 

如果我们仔细想一想,学术界多数做的事情是在思考,在想它的极限在哪,主要用脑;工业界并不是强调用脑,而是用心——就是怎么样能把这个场景做出来,并不一定要有非常高大上的算法,就是要从用户使用产品的维度上,让用户感觉这个产品非常好。

 

学术界和工业界又不是完全割裂的:工业界敢去提某一个产品的设想,是看到了在学术界有一些前沿的成果,可以在工业界来用。同时,工业界也在逐步提炼它的问题,扔给学术界,希望他们去做这种前沿的探索。比如说工业界可以想,三年、五年以后会往哪些方向去推动,他就可以把这些任务推给学术界。

 

现在有很多公司,在中国和在美国纷纷建立AI实验室,其实有两种目标。一方面是长期希望能瞄准将来前沿的领域,做技术的积累;另一方面是要追求产品更好的落地,所以现在很多公司就建起了自己人工智能的实验室。

 

在人工智能深度学习的研究,学术界和工业界的差别还是很大的,同时也相互作用,相互增强。学术界和工业界一起合作,研究和产业相结合,一定会把人工智能带上另外一个阶段。

 

本文系颜水成在最近某论坛的演讲整理稿,经本人确认。

 

关于作者:

颜水成是奇虎/360公司的首席科学家,新加坡国立大学Dean’s Chair副教授。他的研究领域包括机器学习,计算机视觉和多媒体。独自或与人合作撰写了几百篇文章,涉及广泛的研究题目。Google Scholar引用超过20,000次,H指数为66。他同时也是ISI 2014,2015,2016年的高被引研究者。

 

制版编辑: 许逸

 

2018年考研试题

证明积分不等式:
 
\[\frac{1}{5}<\int_0^1\frac{xe^xdx}{\sqrt{x^2-x+25}}<\frac{2}{\sqrt{99}}.\]
 
证明  注意到
\[x^2-x+25=\left(x-\frac{1}{2}\right)^2+\frac{99}{4}>\frac{99}{4}, a.e. x\in [0,1],\]
从而
\[\int_0^1\frac{xe^xdx}{\sqrt{x^2-x+25}}<\frac{2}{\sqrt{99}}\int_0^1xe^xdx=\frac{2}{\sqrt{99}}.\]
另一方面, 分部积分, 得到
\[\int_0^1\frac{xe^xdx}{\sqrt{x^2-x+25}}=\frac{(x-1)e^x}{\sqrt{x^2-x+25}}\Big|_0^1+\int_0^1\frac{(x-1)(x-\frac{1}{2})e^x}{\sqrt{(x^2-x+25)^3}}dx=\frac{1}{5}+\int_0^1\frac{(x-1)(x-\frac{1}{2})e^x}{\sqrt{(x^2-x+25)^3}}dx.\]
\[f(x)=\frac{x-\frac{1}{2}}{\sqrt{(x^2-x+25)^3}},g(x)=(x-1)e^x,\]
\[f'(x)=\frac{-2x^2+2x+\frac{97}{4}}{\sqrt{(x^2-x+25)^5}}>0,\forall x\in [0,1],\int_0^1 f(x)dx=0, g'(x)=xe^x,\]
因此$f,g$在$[0,1]$上严格递增. 根据Chebyshev 积分不等式,
\[\int_0^1\frac{(x-1)(x-\frac{1}{2})e^x}{\sqrt{(x^2-x+25)^3}}dx=\int_0^1f(x)g(x)dx>\int_0^1 f(x)dx\int_0^1g(x)dx=0.\]
\[\int_0^1\frac{xe^xdx}{\sqrt{x^2-x+25}}>\frac{1}{5}.\]
最后得到
\[\frac{1}{5}<\int_0^1\frac{xe^xdx}{\sqrt{x^2-x+25}}<\frac{2}{\sqrt{99}}.\]

2018年武汉大学653数学分析
 
一(30分).1.计算极限$$\lim_{n\rightarrow\infty}\sum_{k=n^2}^{(n+1)^2}\frac1{\sqrt k}.$$
    2.计算极限$$\lim_{n\rightarrow\infty}\frac{\int_0^\mathrm\pi\sin^nx\cos^6x\operatorname dx}{\int_0^\mathrm\pi\sin^nx\operatorname dx}$$
    3.已知$x_{n+1}=\ln\left(1+x_n\right)$,且$x_1>0$,计算$$\lim_{n\rightarrow\infty}nx_n$$
 
二.设$f(x),f_1(x)$在$[a,b]$区间上连续,$f_{n+1}(x)=f(x)+\int_a^x\sin\{f_n(t)\}\operatorname dt$,证明:$\{f_n\}$在$[a,b]$一致收敛.
 
 
三.设$$f(x)=\left\{\begin{array}{lc}e^{-\frac1{x^2}}&,\;x\neq0\\0&,\;x=0\end{array}\right.$$证明$f(x)$在$x=0$处任意阶导数存在.
 
 
四.已知$(x_1,x_2,x_3)\in{R}^3$,其中$u=\frac1{\left|x\right|},\left|x\right|=\sqrt{x_1^2+x_2^2+x_3^2}$,计算
$$\oint\limits_S\frac{\partial^2 u}{\partial x_i\partial x_j}{\rm d}S,i,j=1,2,3$$,其中$S:x_1^2+x_2^2+x_3^2=R^2$
 
五.讨论求解方程$f(x)$牛顿切线法.1.推导牛顿切线法迭代公式;
                                                   2.在适当的条件下,证明牛顿切线法收敛
 
六(20分).求极限$$\lim_{n\rightarrow\infty}(nA-\sum_{k=1}^nf(\frac kn))=B$$存在时,$A,B$的值。
 
七.设$u_i=u_i(x_1,x_2),i=1,2$,且关于每个变量为周期1的连续可微函数,求$$\iint\limits_{0\leq x_1,x_2\leq1}det(\delta_{ij}+\frac{\partial u_i}{\partial x_j})dx_1dx_2,$$其中$det(\delta_{ij}+\frac{\partial u_i}{\partial x_j})$是映射$x\mapsto(x_1+u_1,x_2+u_2)$的雅克比行列式.
 
八(40分).设$f(x)$在$[a,b]$上$Riemann$可积,$\varphi(x)$是周期为$T$的连续函数,证明:
        1.存在阶梯函数$g_\varepsilon(x)$使得$$\int_a^b\left|f(x)-g_\varepsilon(x)\right|\operatorname dx<\frac\varepsilon2$$
        2.计算$$\lim_{n\rightarrow\infty}\int_a^b\varphi(nx)\operatorname dx$$
        3.证明$$\lim_{n\rightarrow\infty}\int_a^bf(x)\varphi(nx)\operatorname dx=\frac1T\int_0^T\varphi(x)\operatorname dx\int_a^bf(x)\operatorname dx$$
        4.计算$$\lim_{n\rightarrow\infty}\frac1{\ln n}\int_0^T\frac{\varphi(nx)}xdx,其中函数\frac{\varphi(nx)}x收敛$$

试题(1b):证明\[\lim_{n\to +\infty}\left(\int_0^1\frac{\sin x^n}{x^n}dx\right)^n=\prod_{k=1}^{+\infty}\exp{\left(\frac{(-1)^k}{2k(2k+1)!}\right)}\]
 
作代换$x^n=y$
\[\int_0^1\frac{\sin x^n}{x^n}dx=\frac{1}{n}\int_0^1\frac{\sin y}{y^{2-\frac{1}{n}}}dy\]
\[\int_0^1 y^{\frac{1}{n}-2}\sum_{k=0}^{+\infty}\frac{(-1)^k}{(2k+1)!}y^{2k+1}dy=\int_0^1 y^{\frac{1}{n}-1}dy+\int_0^1\sum_{k=1}^{+\infty}\frac{(-1)^k}{(2k+1)!}y^{2k-1+\frac{1}{n}}dy\]
容易得到
\[\int_0^1 y^{\frac{1}{n}-1}dy=n,\left|\frac{(-1)^k}{(2k+1)!}y^{2k-1+\frac{1}{n}}\right|\le \frac{1}{(2k+1)!}\]
由优级数判别法后一项中的函数项级数一致收敛,可以逐项积分,上式
\[=n+\sum_{k=1}^{+\infty}\frac{(-1)^k}{(2k+1)!}\int_0^1 y^{2k-1+\frac{1}{n}}dy=n+\sum_{k=1}^{+\infty}\frac{(-1)^k}{(2k+1)!}\frac{1}{2k+\frac{1}{n}}\]
最终我们得到
\[\int_0^1\frac{\sin x^n}{x^n}dx=1+\frac{1}{n}\sum_{k=1}^{+\infty}\frac{(-1)^k}{(2k+1)!}\frac{1}{2k+\frac{1}{n}}\]
取对数,要证明的表达式化为
\[\lim_{n\to+\infty}n\ln \left(1+\frac{1}{n}\sum_{k=1}^{+\infty}\frac{(-1)^k}{(2k+1)!}\frac{1}{2k+\frac{1}{n}}\right)=\sum_{k=1}^{+\infty}\left(\frac{(-1)^k}{2k(2k+1)!}\right)\]
\[\left|\sum_{k=1}^{+\infty}\frac{(-1)^k}{(2k+1)!}\frac{1}{2k+\frac{1}{n}}\right|\le \sum_{k=1}^{+\infty}\frac{1}{(2k+1)!}<+\infty\]
\[\lim_{n\to+\infty}\frac{1}{n}\sum_{k=1}^{+\infty}\frac{(-1)^k}{(2k+1)!}\frac{1}{2k+\frac{1}{n}}=0\]
\[\lim_{n\to+\infty}n\ln \left(1+\frac{1}{n}\sum_{k=1}^{+\infty}\frac{(-1)^k}{(2k+1)!}\frac{1}{2k+\frac{1}{n}}\right)=\lim_{n\to+\infty}\sum_{k=1}^{+\infty}\frac{(-1)^k}{(2k+1)!}\frac{1}{2k+\frac{1}{n}}\]
现在我们希望极限与级数和交换顺序,考虑$[0,1]$上的函数项级数
\[f(x)=\sum_{k=1}^{+\infty}\frac{(-1)^k}{(2k+1)!}\frac{1}{2k+x}\]
仍然由优级数判别法一致收敛,故由$\mathrm{Heine}$定理原式
\[=\lim_{n\to +\infty}f(\frac{1}{n})=f(0)=\sum_{k=1}^{+\infty}\frac{(-1)^k}{(2k+1)!}\frac{1}{2k}\]
作者: TangSong    时间: 昨天 02:00
 
试题(1c):证明
 
\[\lim_{n\to +\infty}\frac{1}{n}\sum_{k=1}^n\ln(1+\frac{k^2-k}{n^2})=\ln 2-2+\frac{\pi}{2}\]
注意到下面式子中第一项是一个$\mathrm{Riemann}$和我们有
\[\lim_{n\to +\infty}\frac{1}{n}\sum_{k=1}^n\ln(1+\frac{k^2}{n^2})=\int_0^1\ln(1+x^2)dx=x\ln(1+x^2)\left|_0^1\right.-\int_0^1\frac{2x^2}{1+x^2}dx=\ln 2-2+\frac{\pi}{2}\]
我们只需要再证明
\[\lim_{n\to +\infty}\frac{1}{n}\sum_{k=1}^n\ln(1+\frac{k^2-k}{n^2})=\lim_{n\to +\infty}\frac{1}{n}\sum_{k=1}^n\ln(1+\frac{k^2}{n^2})\]
利用不等式
\[x,y\ge 0,\left|\ln(1+x)-\ln(1+y)\right|=\left|\frac{x-y}{1+\xi}\right|\le|x-y|\]
\[\left|\frac{1}{n}\sum_{k=1}^n\ln(1+\frac{k^2-k}{n^2})-\frac{1}{n}\sum_{k=1}^n\ln(1+\frac{k^2}{n^2})\right|\le \frac{1}{n}\sum_{k=1}^n\left|\ln(1+\frac{k^2-k}{n^2})-\ln(1+\frac{k^2}{n^2})\right|\]
\[\le \frac{1}{n}\sum_{k=1}^n\frac{k}{n^2}=\frac{n+1}{2n^2}\to 0\]
作者: TangSong    时间: 昨天 02:54
试题(8)
$f(x)$在$[1,+\infty)$上二次可导,$\forall x\in [1,+\infty),f(x)>0,f''(x)\le 0,f(+\infty)=+\infty$
证明
\[\lim_{s\to 0^+}\sum_{n=1}^{+\infty}\frac{(-1)^n}{f^s(n)}\]
存在并求之.
 
由二阶导数非正,$f'(x)$在$[1,+\infty)$单减,容易看出$f'$恒正.事实上若有某个$x_0,f'(x_0)\le 0$则由单调性
\[\forall x\ge x_0,f'(x)\le f'(x_0)\le 0,f(x)\le f(x_0)\]与$f(+\infty)=+\infty$矛盾.因此$f$在$[1,+\infty)$严增.
我们将收敛性的证明与求值放在一起进行.
\[S_{2n}(s)=\sum_{k=1}^n \left(\frac{1}{f^s(2k)}-\frac{1}{f^s(2k-1)}\right)\]
注意和式中每个括号都是负的且级数通项趋于$0$,只需要证明对固定的$s>0,S_{2n}(s)$有下界则
\[\lim_{n\to +\infty}S_{2n}(s)\]存在且等于
\[\sum_{n=1}^{+\infty}\frac{(-1)^n}{f^s(n)}\]
由$\mathrm{Lagrange}$中值定理,
\[\frac{1}{f^s(2k)}-\frac{1}{f^s(2k-1)}=\frac{-sf'(\xi)}{f^{s+1}(\xi)},\xi\in (2k-1,2k)\]
注意$f$单增而$f'$单减我们有
\[\frac{-sf'(2k-1)}{f^{s+1}(2k-1)}\le\frac{1}{f^s(2k)}-\frac{1}{f^s(2k-1)}\le \frac{-sf'(2k)}{f^{s+1}(2k)}\]
\[\sum_{k=1}^n\frac{-sf'(2k-1)}{f^{s+1}(2k-1)}\le S_{2n}(s)\le \sum_{k=1}^n\frac{-sf'(2k)}{f^{s+1}(2k)}\]
利用面积原理的思想来估计左右两端.
由单调性$k\ge 2$时
\[\frac{f'(2k-1)}{f^{s+1}(2k-1)}\le \frac{1}{2}\int_{2k-3}^{2k-1} \frac{f'(t)}{f^{s+1}(t)}dt\]
\[\sum_{k=2}^{+\infty}\frac{f'(2k-1)}{f^{s+1}(2k-1)}\le\frac{1}{2}\int_{1}^{+\infty} \frac{f'(t)}{f^{s+1}(t)}dt=\frac{1}{2}\frac{-1}{sf^s(t)}\left|_{t=1}^{t=+\infty}\right.=\frac{1}{2sf^s(1)}\]
 
$S_{2n}(s)$有下界故极限存在.再次利用面积原理
$k\ge 1$时
\[\frac{f'(2k)}{f^{s+1}(2k)}\ge \frac{1}{2}\int_{2k}^{2k+2} \frac{f'(t)}{f^{s+1}(t)}dt\]
\[\sum_{k=1}^{+\infty}\frac{f'(2k)}{f^{s+1}(2k)}\ge\frac{1}{2}\int_{2}^{+\infty} \frac{f'(t)}{f^{s+1}(t)}dt=\frac{1}{2}\frac{-1}{sf^s(t)}\left|_{t=2}^{t=+\infty}\right.=\frac{1}{2sf^s(2)}\]
 
\[-s\left(\frac{f'(1)}{f^{s+1}(1)}+\frac{1}{2sf^s(1)}\right)\le \lim_{n\to +\infty}S_{2n}(s)\le -s\frac{1}{2sf^s(2)}\]
由前面说明就有
\[-s\left(\frac{f'(1)}{f^{s+1}(1)}+\frac{1}{2sf^s(1)}\right)\le \sum_{n=1}^{+\infty}\frac{(-1)^n}{f^s(n)}\le -s\frac{1}{2sf^s(2)}\]
而上式左右两端在$s\to 0^+$时极限都是$-\frac{1}{2}$故
\[\lim_{s\to 0^+}\sum_{n=1}^{+\infty}\frac{(-1)^n}{f^s(n)}=-\frac{1}{2}\] 

中科院2018研究生入学考试 数学分析+高等代数
数学分析部分
 
01. (15pt) 计算极限
\[\lim_{x\to\infty}\left(\sin\frac1x+\cos\frac1x\right)^{x}\text{.}\]
02. (15pt) 计算极限
\[\lim_{x\to 0} \left(\frac{4+\mathrm{e}^{\frac1x}}{2+\mathrm{e}^{\frac4x}}+\frac{\sin x}{|x|} \right)\text{.}\]
03. (15pt) 判断 (并证明) 函数 $f(x,y)=\sqrt{|{xy}|}$ 在点 $(0,0)$ 处的可微性.
 
04. (15pt) 求三个实常数 $a,b,c$,使得下式成立
\[\lim_{x\to 0}\frac1{\tan x -ax}\int_b^x\frac{s^2}{\sqrt{1-s^2}}\,\mathrm{d}s =c\text{.}\]
05. (15pt) 计算不定积分
\[\int\frac{\mathrm{d}x}{\sin^6 x+\cos^6 x}\text{.}\]
06. (15pt) 设函数 $f(x)$ 在 $[-1,1]$ 上二次连续可微,$f(0)=0$,证明:
\[
\left|\int_{-1}^1 f(x)\,\mathrm{d}x\right|\leq\frac{M}{3},\quad \text{其中 }M=\max_{x\in[-1,1]}\left|f''(x)\right|\text{.}
\]
07. (15pt) 求曲线 $y=\dfrac12x^2$ 上的点,使得曲线在该点处的法线被曲线所截得的线段长度最短.
 
08. (15pt) 设 $x>0$,证明
\[\sqrt{x+1}-\sqrt{x}=\frac1{2\sqrt{x+\theta}}\text{,}\]其中 $\theta=\theta(x)>0$,并且 $\lim\limits_{x\to 0}\theta(x)=\dfrac 14$.
 
09. (15pt) 设
\[u_n(x)=\frac{(-1)^n}{(n^2-n+1)^x}\quad (n\geq 0)\text{,}\]求函数 $f(x)=\sum\limits_{n=0}^{\infty}u_n(x)$ 的绝对收敛、条件收敛以及发散的区域.
 
10. (15pt) 证明
\[\frac15<\int_0^1\frac{x\mathrm{e}^x}{\sqrt{x^2-x+25}}\,\mathrm{d}x<\frac{2\sqrt{11}}{33}\text{.}\]
 
高等代数部分
 
一、(20pt) 设 $p(x),q(x),r(x)$ 都是数域 $\mathbb{k}$ 上的正次数多项式,而且 $p(x)$ 与 $q(x)$ 互素,$\mathrm{deg}(r(x))<\mathrm{deg}(p(x))+\mathrm{deg}(q(x))$.证明:存在数域 $\mathbb{k}$ 上的多项式 $u(x),v(x)$,满足 $\mathrm{deg}(u(x))<\mathrm{deg}(p(x)),\,\mathrm{deg}(v(x))<\mathrm{deg}(q(x))$,使得
\[\frac{r(x)}{p(x)q(x)}=\frac{u(x)}{p(x)}+\frac{v(x)}{q(x)}\text{.}\]
二、(20pt) 设 $n$ 阶方阵 $M_n=\left(|i-j|\right)_{1\leq i,j \leq n}$,令 $D_n=\mathrm{det}(M_n)$ ($M_n$ 的行列式).
  (1) 计算 $D_4$;
  (2) 证明 $D_n$ 满足递推关系式 $D_n=-4D_{n-1}-4D_{n-2}$;
  (3) 求 $n$ 阶方阵 $A_n=\left(\left|\frac1i-\frac1j\right|^{\llap{\phantom{b}}}\right)_{1\leq i,j \leq n}$ 的行列式 $\mathrm{det}(A_n)$.
 
三、(20pt) 设 $A,B$ 均是 $n$ 阶方阵,满足 $AB=0$.证明
  (1) $\mathrm{rank}(A)+\mathrm{rank}(B) \leq n$;
  (2) 对于方阵 $A$ 和正整数 $k\,(\mathrm{rank}(A) \leq k \leq n)$,必存在方阵 $B$,使得
\[\mathrm{rank}(A)+\mathrm{rank}(B)=k\text{.}\]
四、(20pt) 通过正交变换将下面的实二次型化成标准型:
\[q(x_1,x_2,x_3)=5x_1^2+5x_2^2+5x_3^2-2x_1x_2-2x_2x_3-2x_1x_3\text{.}\]
五、(20pt) 设 $A$ 和 $B$ 是两个 $n$ 阶实矩阵,并且 $A$ 是对称正定矩阵,$B$ 是反对称矩阵.证明:$A+B$ 是可逆矩阵.
 
六、(20pt) 设 $A$ 是 $n$ 阶复数矩阵,且 $A=\left(\begin{array}{l} A_1\\ A_2\end{array}\right)$,令
\[V_1=\left\{\,x\in\mathbb{C}^n\,\middle|\,A_1 x=0\,\right\},\quad V_1=\left\{\,x\in\mathbb{C}^n\,\middle|\,A_2 x=0\,\right\}\text{,}
\]证明:矩阵 $A$ 可逆的充分必要条件是向量空间 $\mathbb{C}^n$ 能够表示成子空间 $V_1$ 与 $V_2$ 的直和:$\mathbb{C}^n=V_1 \oplus V_2$.
 
七、(15pt) 证明:$8$ 个满足 $A^3=0$ 的 $5$ 阶复数矩阵中必有两个相似.
 
八、(15pt) $\mathbb{R}$ 上所有 $n\,(n\geq 2)$ 阶方阵构成的线性空间 $V=\mathbb{R}^{n \times n}$ 上的线性变换 $f:\, V \to V$ 定义为
\[f(A)=A+A'\quad \forall A\in V\text{,}\]其中 $A'$ 为 $A$ 的转置.求 $f$ 的特征值、特征子空间、极小多项式.

第九题的解答
 
 
9.  设 $B_R=\{(x,y): x^2+y^2< R^2\},u\in C^2( B_R)\cap C(\overline {B_R})$ .
 
1) 若$\Delta u\geqslant 0$, 证明
\[\max_{(x,y)\in\overline {B_R}} u(x,y)= \max_{(x,y) \in \partial B_R} u(x,y).\]
 
证明 对任意$\varepsilon>0$, 令$v_\varepsilon
(x,y)=u(x,y)+\varepsilon (x^2+y^2)$, 则
\[\Delta v_\varepsilon (x,y)=\Delta u(x,y)+4\varepsilon\geqslant 4\varepsilon.\]
由此用反证法易证
\[\max_{(x,y)\in\overline {B_R}} v_\varepsilon (x,y)= \max_{(x,y) \in \partial B_R} v_\varepsilon(x,y).\]
令$\varepsilon\to 0^+$, 即得
\[\max_{(x,y)\in\overline {B_R}} u(x,y)= \max_{(x,y) \in \partial B_R} u(x,y).\]
 
 
2).  若$\Delta u(x,y)=0$, 则
\[\frac{d}{dr}\left(\frac{1}{2\pi r}\int_{\partial B_r}u(x,y)ds\right)=0, 0\leqslant r\leqslant R.\]
 
 
证  注意到
\[\frac{1}{2\pi r}\int_{\partial B_r}u(x,y)ds=\frac{1}{2\pi}\int_0^{2\pi}u(r\cos\theta,r\sin\theta)d\theta=
\int_{\partial B_1}u(rx,ry)ds.\]从而根据Gauss公式, 得到
 
\begin{align*}\frac{d}{dr}\left(\frac{1}{2\pi r}\int_{\partial
B_r}u(x,y)ds\right)&=\frac{1}{2\pi}\int_{\partial B_1}(u_x(rx,ry)x+u_y(rx,ry)y)ds\\
&=\frac{1}{2\pi}\int_{\partial B_1} \frac{\partial
u(rx,ry)}{\partial
\nu}ds\\
&=\frac{1}{2\pi}\iint\limits_{\overline B_1}\Delta
u(rx,ry)dxdy\\
&=0.\end{align*}
3).  证明 若$\Delta u(x,y)=0$, 则
\[u(0,0)=\frac{1}{2\pi r}\int_{\partial B_r}u(x,y)ds.\]
 
证 根据2), 得到
\[\frac{1}{2\pi r}\int_{\partial B_r}u(x,y)ds=\lim_{r\to 0^+}\frac{1}{2\pi r}\int_{\partial B_r}u(x,y)ds=u(0,0).\]

2017-2018学年北京大学高等代数实验班期末试题2018.1.9
2018.1.9 上午8:30--10:30\\

安金鹏

据悉今年使用的教材是 K. Hoffman, R. Kunze: Linear Algebra

反响好我再发出期中试卷

一、设矩阵$A\in \mathbb{R}^{4\times 4}$的矩阵元均为$1$或$-1$, 求$\det A$的最大值.

二、设$V$是所有从有限域$F_p$到自身的映射构成的$F_p$-线性空间. 定义$T, U\in L(V)$为
$$ T(f)(t)=f(-t), \ \  U(f)(t)=f(t+1)-f(t), \ \ \forall \ f\in V, t\in F_p.$$
求$\det T$和$\det U$.

三、设$V$是有限维$F$-空间, $W$是$V$的子空间, $T\in L(V)$满足$T(W)\subset W$. 定义$T_W\in L(W)$和$T_{V/W}\in L(V/W)$为
$$T_W(\alpha)=T(\alpha), \alpha\in W,$$
$$T_{V/W}(\alpha+W)=T(\alpha)+W, \alpha\in V.$$
证明$\det T=\det T_W \det T_{V/W}$.

四、设$A\in F^{n\times n}$, $V$和$W$是$F^n$的子空间. 证明下述等价:

(a) 对任意的$a\in V-\{0\}$, 存在$\beta\in W$使得$\alpha A\beta^t\neq 0$.

(b) 对任意的$\gamma\in F^n$, 存在$\beta\in W$使得对任意的$\alpha\in V$有$\alpha V\beta^t=\alpha\gamma^t$.

五、设$F$是无限域. 证明对多项式代数$F[x]$的任意有限维子空间$V$, 存在$F[x]$的理想$M$满足
$$V\cap M=\{0\}, \ \ \ V+M=F[x].$$

 

“火腿三明治定理”是什么?

中华民族是一个懂得谦让、不拘小节的民族。正是在这种民族思想的熏陶下,才出现了孔融让梨这种传送千年的佳话。与中华民族的谦让和大气不同,西方国家的朋友却相对严谨。他们更加追求获得公平的机会,不管是男女权利的平等还是法律面前人人平等,都很好地展现了西方国家民众对于公平的追求,这种追求甚至也延伸到了我国民众最不挂怀的事物的平均上。
 
在西方国家中,要说到最常见的事物,三明治绝对能占据一席之地。因此,这种美食的平均分配也成为了外国人重点关注和解决的问题。你别说,外国人还真发明了解决平分三明治的科学定理,而且这个定理的名字真的就叫做“火腿三明治定理”(ham sandwich theorem),由此可见外国人对于追求平等和喜欢吃三明治的程度。
 
这个著名而有意思的”火腿三明治定理”(ham sandwich theorem)的诞生可不是信口开河胡诌的,而是经过专业人士的严谨科学论证得出的结果。得出这一理论的是数学家亚瑟斯通(Arthur Stone)和约翰图基(John Tukey)在 1942 年得出的,而且是测度论中的经典理论。
 
该定理是:任意给定一个火腿三明治,总有一刀能把它切开,使得火腿、奶酪和面包片恰好都被分成两等份。
 
当然,作为一个可定定理,著名的“火腿三明治定理”(ham sandwich theorem)绝不仅仅用来解决平分三明治的问题。该理论产生之后,又被进行了进一步延伸,即如果在n维空间中有n个物体,那么总存在一个n-1维的超平面,它能把每个物体都分成“体积”相等的两份。这些物体可以是任何形状,还可以是不连通的(比如面包片),甚至可以是一些奇形怪状的点集,只要满足点集可测就行了。
 
由此也可以看出,那些看起来十分有趣或者简单的科学理论,很有可能是借助复杂的理论获得的,也有可能被拓展成为复杂和高深的理论。当然,对于那些吃货来说,只要这个理论能成功地帮助他们平分火腿三明治中的火腿、奶酪和面包片就行了。
 
 
http://vip8.wall.49109.com/v2/web/index.php?c=site&a=entry&eid=113

醉鬼能回家,但喝醉的鸟儿可能永远回不了家!

A drunk man will find his way home, but a drunk bird may get lost forever.  —— Kakutani
醉鬼总能找到回家的路;但是喝醉了的鸟儿可能永远回不了家。 —— 角谷静夫
 
 
 
 
今天我们要谈的是一个概率论中的重要结论:Z^d上的随机游走当d≥3时是非常返的,而当d=1,2时是常返的。
 
Z^d在这里表示由d 维欧氏空间中全体整点(即坐标全为整数的点)构成的集合。想象有一只青蛙以秒为时间单位在Z^d上做随机游走,那么它将按如下规则运动:在初始时刻(记为第0秒),青蛙位于原点;在每一秒钟,青蛙都会等概率地跳到某一个与它上一秒所在位置相邻的整点。由于Z^d上的每个整点都有2d个邻居,因此这个概率也就是1/(2d)(见下图)。
 
我们这里介绍的随机游走看似一个简单的数学模型,其实它的应用十分广泛。最常见的例子有物理学中布朗运动,金融市场中股票价格波动等等。
 
那么我们的问题就是,既然青蛙一开始位于原点,那是否总存在一个(随机)时刻T,使得第T秒时青蛙又回到原点呢?如果是,那么我们就称这样随机游走是“常返”的,否则就称是“非常返”的。
 
 
 
事实上,我们总可以假设存在一个介于0和1之间的实数p,它就是青蛙回到原点的概率。仔细想想,其实p的存在性本身也是不平凡的,因为我们知道古典概率论中,事件的概率只涉及到有限个变量,而这里回到原点的行为却与青蛙在无穷时间内的行为有关。当然,在公理化概率论中,通过建立起合适的概率空间,我们可以说明这样的p是存在的。这样,我们通过引入p,判断常返性就转化为判断p是否等于1的问题了,因为“总能回到原点”用概率论的语言来说就是“以概率1回到原点”。
 
下面我们来看随机游走另一个有趣的性质:马氏性。我们注意到,对于任意给定的时刻,比如第100秒,第100秒后的青蛙的位置只取决于第100秒时青蛙的位置,而前100秒的时间里,青蛙如何跳到这一位置方式无关。这就是所谓的“马氏性”,即给定现在,未来和过去独立。随机游走还具有“强马氏性”。所谓“强马氏性”,是指可以把前述的“第100秒”换成任意“只取决于历史的随机时间”(这样的时间又叫停时)。比如我们定义T成为青蛙第一次回到原点的时刻,那么T就是一个停时,并且关于T的强马氏性可以这么理解为:在随机时间T之后发生的事情,与在随机时间T之间发生的事情无关,因为我们知道在第T秒,青蛙又回到原点了,所以在时间T后开始的随机游走与一开始从原点出发的随机游走将遵循同样的规律。
 
如果要解释什么叫“只取决于历史”,不妨看一个买卖股票的例子。比如说你今天想卖出一只股票,你当然希望可以在一天当中最高价的时候卖。但很遗憾,除了碰运气,这是不可能做到的,因为除非一天已经结束了,没人能知道股价什么时候位于最高点。相反,如果你的策略是,“如果股票价格位于过去12个小时内的最高点就卖出股票”,那这就是一个可行的策略。后面这个策略中的交易时间就是一个“只取决于历史”的随机时间,也就是停时,而前者“一天当中的最高价”则不是停时。
 
如果你没看懂上面一大串关于马氏链和停时的描述,没关系,你一定也可以直观地理解以下结论。如果从原点出发的青蛙以概率p会回到原点,那么青蛙一定会以概率p^2(p^n表示p的n次方,下文相同)回到原点两次,这是因为,青蛙回到原点两次=青蛙回到原点1次+青蛙从原点出发再回到原点1次。由强马氏性,拆分后的第二个事件的(条件)概率也是p;因此,青蛙回到原点两次的概率就是p^2。同理,青蛙会以概率p^3回到原点3次,以概率p^4回到原点4次,等等。如果我们把青蛙回到原点的总次数记为N,那么上面的计算表明P(N≥k) = p^k,也就是说N是一个服从几何分布的随机变量。当p=1时,上述论证依然成立,只不过我们得到的N是一个取值恒为+∞的随机变量。
 
于是,根据几何分布的期望公式,我们得到了N的期望为EN = 1/(1-p);同样地,当p=1时,该式理解为EN=+∞。因此,EN是有限还是无穷,就刻画了随机游走是否常返。
 
我们还可以从另一个角度来计算EN。令X(n)为第n秒青蛙所在的位置,而an是取值0和1的随机变量,其中a(n)=1当且仅当X(n)=0,即a(n)=1当且仅当第n秒青蛙位于原点。根据定义我们得到N是全体a(n)的和,也就是N=a(1) + a(2) +…+ a(n) +… 这是显然的,因为整个数列(a(n))中有多少个1,就代表青蛙返回了多少次原点。
 
当我们对以上无穷和式取期望,并根据期望的线性性,交换无穷求和与求期望的顺序(这里能够换序是因为涉及的项an都是非负的,因此满足换序的条件),我们得到
 
EN = E(a(1) + a(2) +…+ a(n) +…) = E a(1)  + E a(2) +...+E a(n) +...
 
等等,E a(n)  是什么呢?根据定义,E a(n) = P(X(n)= 0),正是第n秒青蛙恰好位于原点的概率!计算这个概率就是一个组合问题了,而判断常返性则变成了一个判断无穷级数敛散性的问题。
 
记A(n)= E a(n) = P(X(n)= 0)。下面我们的目标就是对A(n)进行估计,并由此判断无穷级数∑A(n)是否收敛。
 
在一维(d=1)时,如何计算A(n)呢?注意到每一秒钟青蛙必须向左跳或者向后跳。因此在第n秒回到原点的必要条件就是n为偶数。而当n为偶数时,青蛙必须恰好有n/2的时间向左跳,有n/2的时间向右跳,才能在第n秒回到原点。我们知道每秒钟青蛙向左和向右的概率都是1/2,那么利用组合数公式,我们就得到
 
 
对于阶乘,斯特林公式给出了渐近公式:m! ∼(m/e)^n·sqrt(2πn) (sqrt表示开二次根号,下同)。代入A(n)的表达式,我们得到A(n)∼1/n·sqrt(2/π)这个渐近关系当然只限于n为偶数)。微积分中熟知的结论是p级数∑1/n^p收敛当且仅当p>1,否则发散。于是我们得到∑A(n)在d=1时发散,也就是说一维随机游走是常返的。
 
如果我们在高维时采用类似的方法,就能得到A(n) ∼ c· n^(-d/2),其中c是与d有关的一个常数。同样再借助p级数的知识,就能得到当且仅当d/2 > 1时,也就是d ≥3时,随机游走不常返;相反,d=1,2时,随机游走常返。
 
为了避免复杂的组合数估计,我们也可以从另一个简单的事实中看出A(n)的阶就是n^(-d/2)。如果我们令y(n)=X(n)-X(n-1)为第n秒时青蛙的位移,容易看出所有y(n)都是独立同分布的随机单位向量。由中心极限定理,Z(n) :=X(n)/sqrt(n) = (y(1) + y(2) + … y(n))/sqrt(n)将趋向于一个d维正态分布Z。那X(n)=0意味着什么呢?由于X(n)只能取整点,那么X(n)= 0表明Z(n)的取值大约位于原点附近一个边长为的1/sqrt(n)小正方体中。根据中心极限定理,Z(n)的取值落于这个小正方体中的概率与Z是差不多的,而对于后者,这样的概率恰恰就约等于小正方体的体积,(1/sqrt(n))^d(注意到是d维空间),乘以原点处Z的密度函数大小,一个非零的常数。这样我们就很容易得到了A(n) ∼ c· n^(-d/2)这个结论。
 
如果要把这个随机游走的小结论用于生活中,我们也许会为再也不用担心认不得路而感到欣慰,因为二维随机游走是常返的,就算是不认识路随便乱走,也总能到达任何想去的地方!当然这句话既对也错;对的地方在于,由常返性,确实总存在一个时间T,在平面上随机游走的你也能走到任意想去的地方;错的地方在于,更进一步的理论表明,这个随机时间T是一个期望为无穷的随机变量,也就是从平均的意义上说,你永远也到不了目的地!
 
作者:小米

拉格朗日乘数法

咏怀古迹五首·其一
杜甫
 
支离东北风尘际,漂泊西南天地间。
三峡楼台淹日月,五溪衣服共云山。
羯胡事主终无赖,词客哀时且未还。
庾信平生最萧瑟,暮年诗赋动江关。
 
 一个好的外科医生不应该总是在进行补救式的英雄行为,而是应该预测和预防这些不必要的行为。
 
还记得扁鹊三兄弟的故事吗?
 
根据典记,魏文王曾求教于名医扁鹊:「你们家兄弟三人,都精于医术,谁是医术最好的呢?」
 
扁鹊:「大哥最好,二哥差些,我是三人中最差的一个。」
 
魏王不解地说:「为什么呢?请你详细解释下。」 
 
扁鹊说:
 
「大哥治病,是在病情发作之前,那时候病人自己还不觉得有病,但大哥就下药铲除了病根,使他的医术难以被人认可,所以没有名气,只是在我们家中被推崇备至;
 
我的二哥治病,是在病初起之时,症状尚不十分明显,病人也没有觉得痛苦,二哥就能药到病除,使乡里人都认为二哥只是治小病很灵;
 
我治病,都是在病情十分严重之时,病人痛苦万分,病人家属心急如焚。此时,他们看到我在经脉上穿刺,用针放血,或在患处敷以毒药以毒攻毒,或动大手术直指病灶,使重病人病情得到缓解或很快治愈,所以我名闻天下。」
 
魏王大悟。
 
拉格朗日乘数法(Lagrange multiplier)有很直观的几何意义。举个2维的例子来说明:假设有自变量x和y,给定约束条件g(x,y)=c,要求f(x,y)在约束g下的极值。我们可以画出f的等高线图,如下图。此时,约束g=c由于只有一个自由度,因此也是图中的一条曲线(红色曲线所示)。显然地,当约束曲线g=c与某一条等高线f=d1相切时,函数f取得极值。两曲线相切等价于两曲线在切点处拥有共线的法向量。因此可得函数f(x,y)与g(x,y)在切点处的梯度(gradient)成正比。于是我们便可以列出方程组求解切点的坐标(x,y),进而得到函数f的极值。
(相切的时候碰到最高的等高线)
作者:卢健龙
链接:https://www.zhihu.com/question/38586401/answer/105273125
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

相亲问题与倒向归纳法

问题假设你是一位大龄男士,准备参加 100 场相亲(别介意具体数字)。你打算依次与每个女士 i 约会,然后根据印象给她打一个分数 X_iX_i 的值介于 [0,1] 之间。如果你对女士 i 很满意,那么就和她结婚,否则就放弃她,参加下一场相亲,当然拒绝了人家可就没有回头的机会了。如果你拒绝了前 99 位女士,那么不论第 100 次相亲结果如何你都只能和最后这位女士结婚。在相亲之前,你对这些女士的情况一无所知,所以姑且假定她们的分数 X_i 都是 [0,1] 上均匀分布的独立的随机变量。问题是:应该采取怎样的相亲策略,才能娶到你最中意的女士?

再费点笔墨解释下。每次相亲结束以后,你可以选择和当前的女士结婚,或者继续见下一位女士,这依赖于你已经相亲的结果:如果你挑挑拣拣到了 90 号女士还拿不定注意,最后发现 “天啊,我快要变剩男了!” 那很可能接下来你就会放低择偶标准,遇到一个还凑合的就结婚了,即使她比你前面拒绝过的很多女士都有不如。当然也不排除你对第一位女士就一见钟情的可能,因此你最终选择的女士的编号 \tau 是一个随机变量,你要做的就是让你的未来太太的期望分数 \mathbb{E}X_\tau 尽可能的高。

那么应该采取怎样的策略为好呢?就像买东西讨价还价时总有一个心理价位一样,应该设定一个心理的期望值,如果遇到的女士的分数大于等于这个值,那就和她结婚;否则就继续下一位女士。这个思路很合理,但是问题是,期望值应该设定为多少呢?

在概率论里面我们学过如下关于顺序统计量的经典结论:设 X_1,\cdots,X_N 是 [0,1] 上独立同分布的均匀随机变量,则 Y=\max\limits_{1\leq i\leq N}X_i 的期望是 \frac{N}{N+1}。在我们的场景中 N=100,所以如果你把 100 次相亲全部进行完,得分最高的女士的期望值理论上应该是 \frac{100}{101},于是你应该把心理门槛设置在 \frac{100}{101},是这样吗?

答案是 NO!首先门槛值应该是一个随着相亲的进行而逐渐降低的数列,这才符合实际的情形:如果前面太挑剔,为了不当剩男你后面的标准就会放低。其次我们会用倒向归纳法计算出最优策略下初始的门槛值并不是最中意的女士的期望值 \frac{100}{101},实际上它更接近于得分第二高的女士的期望值 \frac{99}{101}。这也和现实相符:和你结婚往往不是你最中意的那一个,这就是为什么有那么多婚外情的故事。(The story of the other woman)

倒向归纳法

相亲问题是应用倒向归纳法的一个典型例子。

我们从最后的情形开始分析,假设只剩下一位女士可选,那么你只能去和她结婚,而她的期望值是 1/2,我们记作 a_1=1/2

假设还剩下两位女士可选呢?这种情况下应该先和其中一个相亲,如果她的分数大于等于 1/2,那就应该和她结婚(后者的期望只有 1/2,很可能不如她),而小于 1/2 的话则去和第二位女士相亲(后者的期望是 1/2,所以我没道理现在娶一个分数小于 1/2 的)。而第一位女士分数大于等于 1/2 的概率是 1/2,在大于等于 1/2 的条件下她的分数服从 [1/2,1] 上的均匀分布,期望值是 3/4。所以你以 1/2 的概率娶到一个期望值为 3/4 的女士,以 1/2 的概率娶到一个期望值为 1/2 的女士。因此有两位女士可选时这个策略的期望分数为

a_2=\frac{1}{2}\cdot\frac{3}{4}+\frac{1}{2}\cdot\frac{1}{2}=\frac{5}{8}.

 

同理,假设还剩下 i 位女士的时候你的心理期望值是 a_i, 我们来导出 a_i 和 a_{i+1} 之间的递推关系:首先和其中一位女士相亲,如果她的分数大于等于 a_i 那么就和她结婚,否则就拒绝她(因为后面 i 个人的心理期望是 a_i,我没道理现在娶一个分数小于 a_i 的)。前一种情形的期望是 \frac{1+a_i}{2} 但是发生的概率是 1-a_i,后一种情形的期望是 a_i 发生的概率也是 a_i,因此

a_{i+1}=(1-a_i)(\frac{1+a_i}{2})+a_i\cdot a_i=\frac{1+a_i^2}{2}.

结合初值 a_1=\frac{1}{2} 就可以算出整个序列来,因此我们的相亲策略应该是:

 

如果当前女士(假设编号为 i)的得分大于等于 a_{101-i},那么就和她结婚;否则就继续去见下一位女士。这里序列 \{a_i\} 由 a_1=1/2a_{i+1}=\frac{1+a_i^2}{2} 给出。

在这个策略下,你最终娶到的女士得分期望是 a_{100}

序列 \{a_n\} 的通项公式是求不出来的,只能用计算机来算,这种序列叫做所谓的 Quadratic Map。不过可以估计出 a_{N} 的值小于最优女士的期望值 \frac{N}{N+1} 而且更接近于次优女士的期望值 \frac{N-1}{N+1},这印证了之前说过的:和你结婚的往往不是你最中意的那个。

请注意,虽然我们已经设计出了一个不错的策略,但这个策略到底是不是最优的呢?我们还没有严格证明。而且就算这个策略是最优的,是否只有这一种最优策略呢?没准还有其它最优策略能让你更省时省心地娶到好太太呢!要严格的解释这些,就要用到鞅的理论。

FBI Warning: 接下来的内容要用到概率论中鞅的知识,这通常属于数学专业研究生阶段的内容。

转换为鞅的语言

问题:设 N 是一个给定的正整数,\{\mathcal{F}_n\}_{n=0}^N 是某概率空间上的递增的 \sigma- 域流,\{X_n\}_{n=0}^N 是一列可积的随机变量且 X_k\in\mathcal{F}_k。设 \mathcal{M} 是所有满足 0\leq\tau\leq N 的停时 \tau 组成的集合。我们想求出值函数

V= \sup_{\tau\in\mathcal{M}} \mathbb{E}X_\tau
以及使得这个最大值取到的停时 \tau

 

定义 \{X_n\} 的 Snell 包络

S_n=\left\{\begin{array}{ll}X_N&n=N\\\max\{X_n,\mathbb{E}[S_{n+1}|\mathcal{F}_n]\}& n=N-1,\ldots,0.\end{array}\right.

这里的 S_n 是从 N 开始倒向递归定义的。注意 S_n 关于 \mathcal{F}_n 可测。

 

S_n 的直观意义很好理解,就是在时刻 n 对最佳收益的估计:如果过程在当前时刻结束,那么收益就是 X_n;否则继续前进到下一个时刻 n+1,其期望收益是 \mathbb{E}[S_{n+1}|\mathcal{F}_n](注意这里的条件期望不可少,一般来说 \{X_n\} 之间不是独立的,根据前 n 个时刻获得的信息不同,你在 n+1 时刻对最佳收益的估计也可能不同),二者取最大值即为 n 时刻对最佳收益的估计。

设 \tau=\inf\,\{n:\, S_n=X_n\},则 \tau 是停时。注意由于 S_N=X_N,因此 \tau 的定义合理且 0\leq\tau\leq N\tau 的直观意义就是我们应该采取的最优停止策略:每个时刻,用当前的 X_n 与未来的期望收益 \mathbb{E}[S_{n+1}|\mathcal{F}_n] 比较,见好就收。

定理 1\{S_n\} 是控制 \{X_n\} 的最小上鞅。

证明:由 S_n 的定义直接可见 S_n\geq X_n 以及 \{S_n\} 是上鞅。设 \{Y_n\} 是另一个上鞅且满足 Y_n\geq X_n,我们要证明必有 Y_n\geq S_n。这只要从最后一项 n=N 开始看即可。由定义 Y_N\geq X_N=S_N,这一项没问题。假设 Y_n\geq S_n,两边对 \mathcal{F}_{n-1} 取条件期望可得

Y_{n-1}\geq \mathbb{E}[Y_n|\mathcal{F}_{n-1}] \geq \mathbb{E}[S_n|\mathcal{F}_{n-1}].

其中第一个不等号是因为 \{Y_n\} 是一个上鞅。再结合 Y_{n-1}\geq X_{n-1} 便有 Y_{n-1}\geq S_{n-1},这样递推下来就有 Y_n\geq S_n 对所有 n=N,N-1,\ldots,0 成立。证毕。

 

那么怎么证明 \tau 确实是最优的停止策略呢?想法是这样的:设 T 是任意停时,我们要证明 \mathbb{E}X_\tau\geq \mathbb{E}X_T,为此我们利用 \{S_n\} 和 \{X_n\} 的关系,给式子中间塞进去两项,搭一座桥:

\mathbb{E}X_\tau = \mathbb{E}S_\tau \geq \mathbb{E}S_T\geq \mathbb{E}X_T.

注意第一个等号是根据 \tau 的定义,最后一个不等号是根据定理 1。所以我们只要证明中间的不等号 \mathbb{E}S_\tau\geq \mathbb{E}S_T 即可。

 

我们已经知道 \{S_n\} 是一个上鞅,那么自然不管什么停时 T,统统都有 \mathbb{E}S_T\leq \mathbb{E}S_0。但是关于 \tau 我们可以说的更多:

定理 2\{S_{n\wedge\tau}\} 是一个鞅。

证明

S_{(n+1)\wedge\tau}-S_{n\wedge\tau}=1_{\{\tau>n\}}(S_{n+1}-S_n).

 

对上式右边求条件期望,

\mathbb{E}[1_{\{\tau>n\}}(S_{n+1}-S_n)|\mathcal{F}_n]=1_{\{\tau>n\}}\mathbb{E}[(S_{n+1}-S_n)|\mathcal{F}_n]=0.

 

这是因为如果 \tau>n 的话那么由 \tau 的定义 S_n=\mathbb{E}[S_{n+1}|\mathcal{F}_n]

既然如此,那么就有 \mathbb{E}S_\tau=\mathbb{E}S_0,这样就证明了 \tau 的最优性:

定理 3:设 \mathcal{M} 是所有满足 0\leq T\leq N 的停时 T 组成的集合,则 \tau 是其中最优的:

\mathbb{E}S_0=\mathbb{E}X_\tau=\sup_{T\in\mathcal{M}}\mathbb{E}X_T.

 

至此我们就从数学上严格的论证了为什么前面相亲问题中我们设计的策略是最优的。

如果你回顾一下上面的分析就会发现,我们实际上使用了 \tau 的两个性质:S_\tau=X_\tau和 \{S_{n\wedge\tau}\} 是鞅。这两个性质就保证了 \tau 是最优的停时。那么这是不是说明还有其它最优的策略呢?

定理 4\nu\in\mathcal{M} 是最优停时的充要条件是: 1. S_\nu=X_\nu。 2. \{S_{n\wedge\nu}\} 是鞅。

定理的必要性告诉我们前面采用的 “见好就收” 策略是所有最优停时中最小的:设 \nu 是任一最优停时,则 \tau\leq\nu(回顾一下 \tau 的定义)。换句话说,我们之前设计的相亲策略是所有最优策略中时间成本最低的!

我们还可以给出最优停止策略中 “最大” 的一个来:

定理 5:设 S_n=M_n+A_n 是 \{S_n\} 的 Doob - Meyer 分解,其中 \{M_n\} 是鞅,A_n 是可料递增过程,定义

\tau_\max = \begin{cases}N & A_N=0,\\ \inf\{n\ |\ A_{n+1}>0\} & A_N>0.\end{cases}
则 \tau_\max 是所有最优停时中最大的。

 

定理 4,5 的证明都不难,这里就省略了。

参考文献

Risk-Neutral Valuation: Pricing and Hedging of Financial Derivatives. By Nicholas H. Bingham, Rüdiger Kiesel.

Hurwitz 平方和定理

Hurwitz 平方和定理是有限群表示论的一个精彩应用,本文是若干年前读书时的笔记。
 
Hurwitz 平方和定理
我们都熟悉复数的乘法:如果 z_1=x_1+y_1i,z_2=x_2+y_2i 是两个复数,则 |z_1z_2|=|z_1|\cdot|z_2|,也就是
(x_1^2+y_1^2)(x_2^2+y_2^2)=(x_1x_2-y_1y_2)^2+(x_1y_2+x_2y_1)^2.
1748 年 Euler 发现了如下的 4 平方和等式:
(x_1^2+x_2^2+x_3^2+x_4^2)(y_1^2+y_2^2+y_3^2+y_4^2)=z_1^2+z_2^2+z_3^2+z_4^2.
其中
\begin{align*}&z_1=x_1y_1-x_2y_2-x_3y_3-x_4y_4,\\&z_2=x_1y_2+x_2y_1+x_3y_4-x_4y_3,\\&z_3=x_1y_3+x_3y_1-x_2y_4+x_4y_2,\\&z_4=x_1y_4+x_4y_1+x_2y_3-x_3y_2.\end{align*}
4 平方和等式说的是在 Hamilton 四元数体中范数仍然是乘性的。1848 年 Caley 发现了八元数,从而导出了类似的 8 平方和等式,当然具体写出来会很复杂,这里就按下不表了。
 
一般地,如果能在 n 维欧式空间 \mathbb{R}^n 上定义向量之间的乘法:
\mathbb{R^n}\times\mathbb{R^n}\rightarrow\mathbb{R^n}:(v,w)\rightarrow v\times w
使得 v\times w 对 v,w 都是线性的,而且乘积的范数等于范数的乘积:|v\times w|=|v|\cdot |w|(这里 |\cdot| 是通常的欧式范数),则我们就得到了一个 n 平方和等式。
 
在接下来的 50 年里,人们一直致力于寻找可能的 16 平方和等式,但是都失败了,于是开始怀疑是否没有这样的等式成立。终于在 1898 年 Hurwitz 证明了这样的结论:
 
Hurwitz 平方和定理:设 x=(x_1,\ldots,x_n), y=(y_1,\dots,y_n) 为 \mathbb{R}^n 中的向量。如果存在关于 x,y 的双线性函数 z_1(x,y),\ldots,z_n(x,y) 使得等式
(x_1^2+\cdots+x_n^2)(y_1^2+\cdots+y_n^2)=z_1^2+\cdots+z_n^2
恒成立, 那么 n=1,2,4,8。
正如前面说过的,Huiwitz 平方和定理说的是在实数域 \mathbb{R},复数域 \mathbb{C},四元数 \mathbb{H} 和八元数 \mathbb{O} 中,元素的(欧式)范数和向量的乘法是相容的,而在其它维数的 \mathbb{R}^n 上是不可能定义与欧式范数相容的向量乘法的。
 
Hurwitz 本人的证明是纯线性代数的,线性代数的证明较为初等,不过步骤略长。1943 年 Eckmann 用有限群表示论的方法给了一个漂亮的证明,本文就来介绍这个证明。
 
将问题转化为矩阵方程
 
设 z=(z_1,\ldots,z_n),则 z 关于 y 是线性的,因此存在 n 阶矩阵 A 满足 z=yA,当然矩阵 A 和 x 有关。于是 Hurwitz 定理中的等式变成
(x_1^2+x_2^2+\cdots+x_n^2)yy'=yAA'y'.
由于 y 是不定元,因此
AA'=(x_1^2+\cdots+x_n^2)I_n.
进一步,由于 A 关于 x 也是线性的,因此设 A=A_1x_1+\cdots+A_nx_n,则
AA'=\sum_{i=1}^nA_iA_i'x_i^2+\sum_{1\leq i<j\leq n}(A_iA_j'+A_jA_i')x_ix_j.
从而我们得到一组矩阵方程
A_iA_i'=I_n,\quad A_iA_j'+A_jA_i'=0 \quad \text{for}\ i\ne j.
进一步可以把 A_n 归一化为单位矩阵:令 Q_i=A_iA_n^{-1},于是 Q_1,\ldots,Q_{n-1} 满足
Q_i'=-Q_i,\quad Q_i^2=-I_n,\quad Q_iQ_j=-Q_jQ_i\quad\text{for}\ i\ne j.
显然 n 必须是偶数(奇数阶反对称矩阵行列式都是 0),而 n=2 的时候结论是成立的,所以下面我们都假定 n>2,于是 n 的可能值为 4,6,8,\ldots
 
用群表示论的工具得出矛盾
 
考虑这样一个抽象群 G,它由元素 a,g_1,\ldots,g_{n-1} 生成,且
a^2=1,\quad g_i^2=a,\quad g_ig_j=ag_jg_i\ \text{when}\ i\ne j.
这个群的结构很好分析:
 
|G|=2^n,每个元素形如 a^{e_0}g_1^{e_1}\cdots g_{n-1}^{e_{n-1}},其中 e_i\in\{0,1\}。
G 的中心 Z(G)=\{1,a,g_1g_2\cdots g_{n-1},ag_1g_2\cdots g_{n-1}\}。
G 的换位子群 [G,G]=\{1,a\},从而 G 有 2^{n-1} 个线性表示。
G 的任何非平凡共轭类都只有两个元素 \{g,ag\},从而 G 有 2^{n-1}+2 个共轭类,其不可约复表示的个数也是 2^{n-1}+2。
于是我们知道 G 有 2^{n-1} 个一次表示,还有 2 个次数大于 1 的表示,设它俩的次数分别是 f_1,f_2,根据不可约表示次数的平方和等于 G 的阶,得到方程
f_1^2+f_2^2 =2^{n-1}.
再利用不可约表示的次数整除 G 的阶,知道 f_1 和 f_2 都是 2 的幂,这只有一种可能,就是
f_1=f_2=2^{\frac{n}{2}-1}.
 
现在 Hurwitz 矩阵方程给出了 G 的一个 n 维表示,这个表示可以分解为若干不可约表示的直和,我们断言其中不含有一次表示,从而只能是若干个 2^{\frac{n}{2}-1} 次表示的直和:这是因为元素 a 在这个表示下是 n 阶矩阵 -I_n,从而其在任何不变子空间上的作用都是乘以 -1。但是任何一次表示都把 a\in [G,G] 映射为 1,矛盾!
 
于是 2^{\frac{n}{2}-1}\big| n,设 n=2^r\cdot s,其中 s 为奇数,则 \frac{n}{2}-1\leq r,从而
2^r\leq n\leq 2r+2.
注意 n 是偶数,所以只能是 n=4,6,8,这就完成了 Hurwitz 定理的证明。

连分数理论

1.

向老师的题目

计算积分
\[\int_0^1{\frac{1}{1+a^2x^2}\left[\left(1-\frac{x}{2}\right)\ln\frac{1+x}{1-x}+\frac{\pi^2x^2}{4}\right]^{-1}\textrm{d}x}.\]

解.先作换元$x\to\tanh x$,可得

\begin{align*}&\hspace{0.5cm}\int_0^1{\frac{1}{1+a^2x^2}\left[\left(1-\frac{x}{2}\right)\ln\frac{1+x}{1-x}+\frac{\pi^2x^2}{4}\right]^{-1}\textrm{d}x}\\&=\int_0^{\infty}{\frac{1}{1+a^2\tanh  ^2x}\left(\frac{\coth ^2x-1}{\left(\coth x-x\right)^2+\frac{\pi^2x^2}{4}}\right)\textrm{d}x}\\&=\frac{1}{2}\int_{-\infty}^{\infty}{\frac{1}{1+a^2\tanh  ^2x}\left(\frac{\coth ^2x-1}{\left(\coth x-x\right)^2+\frac{\pi^2x^2}{4}}\right)\textrm{d}x}\end{align*}
于是我们考虑函数$$\displaystyle{f\left(z\right)=\frac{1}{1+a^2\coth ^2z}\cdot\frac{\tanh  ^2z-1}{\tanh  z-z}}$$ 的如下围道积分
注意到$\displaystyle{f\left(z\right)=\frac{1}{1+a^2\coth ^2z}\cdot\frac{\tanh  ^2z-1}{\tanh  z-z}}$ 的极点为$z=0$,$\displaystyle{z=\pm\frac{\pi}{2}\mathrm{i}}$ (这两个极点在围道边界上),以及$1+a^2\coth ^2z=0$的根$\displaystyle{z=\pm\mathrm{i}\cdot\mathrm{arccoth}\left(\frac{\mathrm{i}}{a}\right)=\pm\mathrm{i}\cdot\arctan(a)}$, 因此根据留数定理有
\begin{align*}&\int_{ - \infty  - \frac{\pi }{2}{\rm{i}}}^{\infty  - \frac{\pi }{2}{\rm{i}}} {f\left( z \right){\rm{d}}z}  - \int_{ - \infty  + \frac{\pi }{2}{\rm{i}}}^{\infty  + \frac{\pi }{2}{\rm{i}}} {f\left( z \right){\rm{d}}z} \\&= 2\pi {\rm{i}}\left( {{\rm{Res}}\left[ {f\left( z \right),z = 0} \right] + \left( {{\rm{Res}}\left[ {f\left( z \right),{\rm{i}} \cdot \arctan \left( a \right)} \right] + {\rm{Res}}\left[ {f\left( z \right),z =  - {\rm{i}} \cdot \arctan \left( a \right)} \right]} \right)} \right)\\&+ \pi {\rm{i}}\left( {{\rm{Res}}\left[ {f\left( z \right),z = \frac{\pi }{2}{\rm{i}}} \right] + {\rm{Res}}\left[ {f\left( z \right),z =  - \frac{\pi }{2}{\rm{i}}} \right]} \right)\\&= 2\pi {\rm{i}}\left( {\frac{3}{{{a^2}}} - \frac{a}{{2\left( {a - \arctan \left( a \right)} \right)}} - \frac{a}{{2\left( {a - \arctan \left( a \right)} \right)}}} \right) + \pi {\rm{i}}\left( {1 + 1} \right)\\&= 2\pi {\rm{i}}\left( {\frac{3}{{{a^2}}} - \frac{{\arctan \left( a \right)}}{{a - \arctan \left( a \right)}}} \right).\end{align*}
注意到$\displaystyle{\tanh  \left(z\pm\frac{\pi}{2}\textrm{i}\right)=\coth z,\coth \left(z\pm\frac{\pi}{2}\textrm{i}\right)=\tanh  z}$,于是
\begin{align*}&\int_{-\infty -\frac{\pi}{2}\textrm{i}}^{\infty -\frac{\pi}{2}\textrm{i}}{f\left(z\right)\textrm{d}z}-\int_{-\infty +\frac{\pi}{2}\textrm{i}}^{\infty +\frac{\pi}{2}\textrm{i}}{f\left(z\right)\textrm{d}z}=\int_{-\infty}^{\infty}{f\left(x-\frac{\pi}{2}\textrm{i}\right)\textrm{d}x}-\int_{-\infty}^{\infty}{f\left(x+\frac{\pi}{2}\textrm{i}\right)\textrm{d}x}\\&=\int_{-\infty}^{\infty}{\frac{1}{1+a^2\tanh  ^2x}\cdot\frac{\coth ^2x-1}{\coth x-\left(x-\frac{\pi}{2}\textrm{i}\right)^2}\textrm{d}x}-\int_{-\infty}^{\infty}{\frac{1}{1+a^2\tanh  ^2x}\cdot\frac{\coth ^2x-1}{\coth x-\left(x+\frac{\pi}{2}\textrm{i}\right)^2}\textrm{d}x}\\&=-\pi\textrm{i}\int_{-\infty}^{\infty}{\frac{1}{1+a^2\tanh  ^2x}\cdot\frac{\coth ^2x-1}{\left(\coth x-x\right)^2+\frac{\pi^2}{4}}\textrm{d}x}=2\pi\textrm{i}\left(\frac{3}{a^2}-\frac{\arctan\left(a\right)}{a-\arctan\left(a\right)}\right).\end{align*}
因此
\begin{align*}\int_0^{\infty}{\frac{1}{1+a^2\tanh  ^2x}\cdot\frac{\coth ^2x-1}{\left(\coth x-x\right)^2+\frac{\pi^2}{4}}\textrm{d}x}&=\frac{1}{2}\int_{-\infty}^{\infty}{\frac{1}{1+a^2\tanh  ^2x}\cdot\frac{\coth ^2x-1}{\left(\coth x-x\right)^2+\frac{\pi^2}{4}}\textrm{d}x}\\&=\frac{\arctan\left(a\right)}{a-\arctan\left(a\right)}-\frac{3}{a^2}\end{align*}
 
在开始本文之前,积分镇楼
\[\int_0^1{x^{20}\left[ \left( 1-\frac{x}{2}\ln \frac{1+x}{1-x} \right) ^2+\frac{\pi ^2x^2}{4} \right] ^{-1}\text{d}x}=\frac{5588512716806912356}{374010621408251953125}\]
下面的这些问题其实最开始来自1998年的美国数学月刊征解题
结果1998年的期刊没有答案,1999年以后的期刊又无处可寻,于是我就自己想办法解决这几个题目.我想了好久,突然想到我在前面某一期公众号上解决过类似的问题,于是灵感来了,解决了这几个征解题的同时还导出了几个额外的式子.

设$\displaystyle{\mathrm{Si}(x)=\int_0^x\frac{\sin t}t\mathrm dt}$表示正弦积分函数,求和

\[\sum_{n=1}^\infty\frac{\mathrm{Si}(n\pi)}{n^3}\]

解.[原创]

首先利用分部积分得
\begin{align*}\text{Si}\left( n\pi \right) &=\int_0^{n\pi}{\frac{\sin t}{t}\text{d}t}=\int_0^{\pi}{\frac{\sin nx}{x}\text{d}x}=\int_0^{\pi}{\sin nx\text{d}\left( \ln x \right)}=-n\int_0^{\pi}{\cos nx\ln x\text{d}x}\\&=-n\int_0^{\pi}{\cos nx\text{d}\left( x\ln x-x \right)}=n\left[ \left( -1 \right) ^{n-1}\left( \pi \ln \pi -\pi \right) -n\int_0^{\pi}{\sin nx\left( x\ln x-x \right) \text{d}x} \right]\end{align*}
于是我们可得
\[\sum_{n=1}^{\infty}{\frac{\text{Si}(n\pi)}{n^3}}=\sum_{n=1}^{\infty}{\frac{\left( -1 \right) ^{n-1}}{n^2}\left( \pi \ln \pi -\pi \right)}-\sum_{n=1}^{\infty}{\frac{1}{n}\int_0^{\pi}{\sin nx\left( x\ln x-x \right) \text{d}x}}\]
而$\displaystyle{\sum_{n=1}^\infty\frac{(-1)^{n-1}}{n^2}=\frac{\pi^2}{12}}$,把后一部分式子再分部积分得
\begin{align*}\sum_{n=1}^{\infty}{\frac{1}{n}\int_0^{\pi}{\sin nx\left( x\ln x-x \right) \text{d}x}}&=\sum_{n=1}^{\infty}{\frac{1}{n}\int_0^{\pi}{\sin nx\text{d}\left( \frac{1}{2}x^2\ln x-\frac{3}{4}x^2 \right)}}\\&=\sum_{n=1}^{\infty}{\int_0^{\pi}{\left( \frac{3}{4}x^2-\frac{1}{2}x^2\ln x \right) \cos nx\text{d}x}}.\end{align*}
现在考虑函数\[f\left( x \right) = \left\{ {\begin{array}{*{20}{c}}{\frac{3}{4}{x^2} - \frac{1}{2}{x^2}\ln x,}&{x \in \left( {0,\pi } \right]}\\{0,}&{x = 0}\end{array}} \right..\]作偶对称以后再作$2\pi$周期延拓,则$f(x)$的Fourier余弦级数为
\[\widetilde{f}\left( x \right) =\frac{a_0}{2}+\sum_{n=1}^{\infty}{a_n\cos nx}\]
其中$\displaystyle{a_n=\frac{2}{\pi}\int_0^{\pi}{f\left( x \right) \cos nx\text{d}x}=\frac{2}{\pi}\int_0^{\pi}{\left( \frac{3}{4}x^2-\frac{1}{2}x^2\ln x \right) \cos nx\text{d}x}}$,根据Fourier级数收敛定理可知
\[\frac{a_0}{2}+\sum_{n=1}^{\infty}{a_n}=f(0)=0\]
而$\displaystyle{a_0=\frac2\pi\int_0^{\pi}{\left( \frac{3}{4}x^2-\frac{1}{2}x^2\ln x \right) \text{d}x}=\frac{11}{18}\pi ^2-\frac{1}{3}\pi ^2\ln \pi}$,因此
\[\sum_{n=1}^{\infty}{\int_0^{\pi}{\left( \frac{3}{4}x^2-\frac{1}{2}x^2\ln x \right) \text{d}x}}=\frac{\pi}{2}\sum_{n=1}^{\infty}{a_n}=-\frac{\pi}{4}a_0=\frac{\pi ^3}{12}\ln \pi -\frac{11}{72}\pi ^3\]
于是最后得到
\[\sum_{n=1}^{\infty}{\frac{\text{Si}\left( n\pi \right)}{n^3}}=\frac{\pi ^2}{12}\left( \pi \ln \pi -\pi \right) -\left( \frac{\pi ^3}{12}\ln \pi -\frac{11}{72}\pi ^3 \right) =\frac{5\pi ^3}{72}\]
同样道理我们还能得到
\[\sum_{n=1}^{\infty}{\left( -1 \right) ^n\frac{\text{Si}\left( n\pi \right)}{n^3}}=-\frac{\pi ^2}{6}\left( \pi \ln \pi -\pi \right) -\left( \frac{2\pi ^3}{9}-\frac{\pi ^3}{6}\ln \pi \right) =-\frac{\pi ^3}{18}\]
只不过这时需要利用$\displaystyle{\sum_{n=1}^{\infty}{\frac{1}{n^2}}=\frac{\pi ^2}{6}}$和$\displaystyle{\frac{a_0}{2}+\sum_{n=1}^{\infty}{\left( -1 \right) ^na_n}=f\left( \pi \right) }$即可.在第一步分部积分中我们利用$\ln x$的Fourier展开可得$\displaystyle{\sum_{n=1}^{\infty}{\frac{\left( -1 \right) ^{n-1}\text{Si}\left( n\pi \right)}{n}}=\frac{\pi}{2}}$.

设$\displaystyle{\mathrm{Si}(x)=\int_0^x\frac{\sin t}t\mathrm dt}$表示正弦积分函数,求和

\[\sum_{n=1}^{\infty}{\left( \frac{\text{Si}\left( n\pi \right)}{n} \right) ^2}\]

解.同上,先分部积分得

\[\text{Si}\left( n\pi \right) =-n\int_0^{\pi}{\cos nx\ln x\text{d}x}\]
于是得到
\[\sum_{n=1}^{\infty}{\left( \frac{\text{Si}\left( n\pi \right)}{n} \right) ^2}=\sum_{n=1}^{\infty}{\left( \int_0^{\pi}{\cos nx\ln x\text{d}x} \right) ^2}\]
考虑函数$f(x)=\ln x,x\in(0,\pi)$,作偶函数延拓和$\pi$周期延拓得到的余弦级数为
\[\widetilde{f}\left( x \right) =\frac{a_0}{2}+\sum_{n=1}^{\infty}{a_n\cos nx}\]
其中$\displaystyle{a_n=\frac{2}{\pi}\int_0^{\pi}{\cos nx\ln x\text{d}x}},a_0=2\ln\pi-2$,由Parseval定理得
\[\frac{a_{0}^{2}}{2}+\sum_{n=1}^{\infty}{a_{n}^{2}}=\frac{2}{\pi}\int_0^{\pi}{f^2\left( x \right) \text{d}x}=\frac{2}{\pi}\int_0^{\pi}{\ln ^2x\text{d}x}=4-4\ln \pi +2\ln ^2\pi\]
因此我们最后得到
\[\sum_{n=1}^{\infty}{\left( \frac{\text{Si}\left( n\pi \right)}{n} \right) ^2}=\sum_{n=1}^{\infty}{\left( \int_0^{\pi}{\cos nx\ln x\text{d}x} \right) ^2}=\frac{\pi^2}2\]

好吧,算到这里,虽然解决了这三个美国数学月刊征解题,但是干脆再无聊点,下面我们算两个五次方的级数,其实套路都一样,但是计算量增加很多.

\[\sum_{n=1}^{\infty}{\frac{\text{Si}\left( n\pi \right)}{n^5}}=\frac{269}{43200}\pi ^5,\sum_{n=1}^{\infty}{\frac{\left( -1 \right) ^{n-1}\text{Si}\left( n\pi \right)}{n^5}}=\frac{4}{675}\pi ^5\]

从\begin{align*}\text{Si}\left( n\pi \right) &=\int_0^{n\pi}{\frac{\sin t}{t}\text{d}t}=\int_0^{\pi}{\frac{\sin nx}{x}\text{d}x}=\int_0^{\pi}{\sin nx\text{d}\left( \ln x \right)}=-n\int_0^{\pi}{\cos nx\ln x\text{d}x}\\&=-n\int_0^{\pi}{\cos nx\text{d}\left( x\ln x-x \right)}=n\left[ \left( -1 \right) ^{n-1}\left( \pi \ln \pi -\pi \right) -n\int_0^{\pi}{\sin nx\left( x\ln x-x \right) \text{d}x} \right]\end{align*}

出发,可得
\[\sum_{n=1}^{\infty}{\frac{\text{Si}(n\pi)}{n^5}}=\sum_{n=1}^{\infty}{\frac{\left( -1 \right) ^{n-1}}{n^4}\left( \pi \ln \pi -\pi \right)}-\sum_{n=1}^{\infty}{\frac{1}{n^3}\int_0^{\pi}{\sin nx\left( x\ln x-x \right) \text{d}x}}\]
而$\displaystyle{\sum_{n=1}^\infty\frac{(-1)^{n-1}}{n^4}=\frac{7\pi^4}{720}}$(利用$\zeta(4)$即可),把后一部分式子再分部积分得
\begin{align*}\sum_{n=1}^{\infty}{\frac{1}{n^3}\int_0^{\pi}{\sin nx\left( x\ln x-x \right) \text{d}x}}&=\sum_{n=1}^{\infty}{\frac{1}{n^3}\int_0^{\pi}{\sin nx\text{d}\left( \frac{1}{2}x^2\ln x-\frac{3}{4}x^2 \right)}}\\&=\sum_{n=1}^{\infty}\frac1{n^2}{\int_0^{\pi}{\left( \frac{3}{4}x^2-\frac{1}{2}x^2\ln x \right) \cos nx\text{d}x}}\\&=\sum_{n=1}^{\infty}{\frac{1}{n^2}\int_0^{\pi}{\cos nx\text{d}\left( \frac{11}{36}x^3-\frac{1}{6}x^3\ln x \right)}}\\&=\left( \frac{11}{36}\pi ^3-\frac{\pi ^3}{6}\ln \pi \right) \sum_{n=1}^{\infty}{\frac{\left( -1 \right) ^n}{n^2}}+\sum_{n=1}^{\infty}{\frac{1}{n}\int_0^{\pi}{\left( \frac{11}{36}x^3-\frac{x^3}{6}\ln x \right) \sin nx\text{d}x}}\\&=-\left( \frac{11}{36}\pi ^3-\frac{\pi ^3}{6}\ln \pi \right) \frac{\pi ^2}{12}+\sum_{n=1}^{\infty}{\frac{1}{n}\int_0^{\pi}{\left( \frac{11}{36}x^3-\frac{x^3}{6}\ln x \right) \sin nx\text{d}x}}.\end{align*}
\begin{align*}\sum_{n=1}^{\infty}{\frac{1}{n}\int_0^{\pi}{\left( \frac{11}{36}x^3-\frac{x^3}{6}\ln x \right) \sin nx\text{d}x}}&=\sum_{n=1}^{\infty}{\frac{1}{n}\int_0^{\pi}{\sin nx\text{d}\left( \frac{25}{288}x^4-\frac{1}{24}x^4\ln x \right)}}\\&=\sum_{n=1}^{\infty}{\int_0^{\pi}{\left( \frac{25}{288}x^4-\frac{1}{24}x^4\ln x \right) \cos nx\text{d}x}}.\end{align*}
下面考虑函数\[f\left( x \right) = \left\{ {\begin{array}{*{20}{c}}{\frac{{25}}{{288}}{x^4} - \frac{1}{{24}}{x^4}\ln x,}&{x \in \left( {0,\pi } \right]}\\{0,}&{x = 0}\end{array}} \right.\]及其余弦级数可得\[\frac{a_0}{2}+\sum_{n=1}^{\infty}{a_n}=f\left( 0 \right) =0\]
其中$\displaystyle{a_n=\frac{2}{\pi}\int_0^{\pi}{\left( \frac{25}{288}x^4-\frac{1}{24}x^4\ln x \right) \cos nx\text{d}x},a_0=\frac{\pi ^4\left( 137-60\ln \pi \right)}{3600}}$,于是$\displaystyle{\sum_{n=1}^{\infty}{a_n}=-\frac{a_0}{2}=-\frac{\pi ^4\left( 137-60\ln \pi \right)}{7200}}$,因此我们最后得到
\[\sum_{n=1}^{\infty}{\frac{\text{Si}\left( n\pi \right)}{n^5}}=\frac{7\pi ^4}{720}\left( \pi \ln \pi -\pi \right) +\frac{\pi ^2}{12}\left( \frac{11\pi ^3}{36}-\frac{\pi ^3}{6}\ln \pi \right) -\frac{\pi}{2}\cdot \frac{\pi ^4\left( 137-60\ln \pi \right)}{7200}=\frac{269}{43200}\pi ^5\]
第二个级数同理.

最后再算一个级数

\[\sum_{n=1}^{\infty}{\frac{\text{Si}^2\left( n\pi \right)}{n^4}}=\frac{\pi ^4}{27}\]

解.首先

\[\frac{\text{Si}\left( n\pi \right)}{n^2}=\frac{\left( -1 \right) ^{n-1}}{n}\left( \pi \ln \pi -\pi \right) -\int_0^{\pi}{\sin nx\left( x\ln x-x \right) \text{d}x}\]
把上式两边乘以$\sin nx$求和,利用Fourier级数的收敛定理得
\begin{align*}\sum_{n=1}^{\infty}{\frac{\text{Si}\left( n\pi \right)}{n^2}\sin nx}&=\left( \pi \ln \pi -\pi \right) \sum_{n=1}^{\infty}{\frac{\left( -1 \right) ^{n-1}}{n}\sin nx}-\sum_{n=1}^{\infty}{\sin nx\int_0^{\pi}{\sin nx\left( x\ln x-x \right) \text{d}x}}\\&=\frac{\left( \pi \ln \pi -\pi \right) x}{2}-\frac{\pi \left( x\ln x-x \right)}{2}.\end{align*}
最后利用Paserval定理得
\[\sum_{n=1}^{\infty}{\frac{\text{Si}^2\left( n\pi \right)}{n^4}}=\frac{2}{\pi}\int_0^{\pi}{\left( \frac{\left( \pi \ln \pi -\pi \right) x}{2}-\frac{\pi \left( x\ln x-x \right)}{2} \right) ^2\text{d}x}=\frac{\pi ^4}{27}\]

注:从这里,其实我们发现了对任意整数$k$,$\displaystyle{\sum_{n=1}^{\infty}{\frac{\text{Si}\left( n\pi \right)}{n^{2k-1}}}(k>1),\sum_{n=1}^{\infty}{\left( -1 \right) ^{n-1}\frac{\text{Si}\left( n\pi \right)}{n^{2k-1}}},\sum_{n=1}^{\infty}{\frac{\text{Si}^2\left( n\pi \right)}{n^{2k}}}}$都可以算出来,只是当次数增加时,这个计算量会越来越大,所以再往上算的话估计只有欧拉和拉马努金这种人去了,不知道这个结果是否可以用类似伯努利数的方法给出通项呢?我也解决不了.

 
最后再做一点额外补充:我把这些题目放到了数学贴吧,某位吧友也提出了一个不错的方法,就是利用下面的Fourier级数
比如
\begin{align*}\sum_{n=1}^{\infty}{\frac{\text{Si}\left( n\pi \right)}{n^3}}&=\sum_{n=1}^{\infty}{\frac{1}{n^3}\int_0^{\pi}{\frac{\sin nx}{x}\text{d}x}}=\sum_{n=1}^{\infty}{\frac{1}{n^3}\int_0^{\pi}{\sin nx\text{d}x}\int_0^{+\infty}{\text{e}^{-xy}\text{d}y}}\\&=\int_0^{+\infty}{\text{d}y}\int_0^{\pi}{\text{e}^{-xy}}\frac{x^3-3\pi x^2+2\pi ^2x}{12}\text{d}y=\frac{5}{72}\pi ^3.\end{align*}
类似的也可以处理,只不过这些Fourier级数光算出来计算量已经不得了了,如果提高到五次或者更高次,计算量更大了,不过对于有平方的式子,恐怕还只能利用Parseval定理了.好了,本期的问题就到这里了,下一期暂时没想好写什么QAQ.