机器学习 - Eufisky - The lost book

2018年考研试题

证明积分不等式:
 
\[\frac{1}{5}<\int_0^1\frac{xe^xdx}{\sqrt{x^2-x+25}}<\frac{2}{\sqrt{99}}.\]
 
证明  注意到
\[x^2-x+25=\left(x-\frac{1}{2}\right)^2+\frac{99}{4}>\frac{99}{4}, a.e. x\in [0,1],\]
从而
\[\int_0^1\frac{xe^xdx}{\sqrt{x^2-x+25}}<\frac{2}{\sqrt{99}}\int_0^1xe^xdx=\frac{2}{\sqrt{99}}.\]
另一方面, 分部积分, 得到
\[\int_0^1\frac{xe^xdx}{\sqrt{x^2-x+25}}=\frac{(x-1)e^x}{\sqrt{x^2-x+25}}\Big|_0^1+\int_0^1\frac{(x-1)(x-\frac{1}{2})e^x}{\sqrt{(x^2-x+25)^3}}dx=\frac{1}{5}+\int_0^1\frac{(x-1)(x-\frac{1}{2})e^x}{\sqrt{(x^2-x+25)^3}}dx.\]
\[f(x)=\frac{x-\frac{1}{2}}{\sqrt{(x^2-x+25)^3}},g(x)=(x-1)e^x,\]
\[f'(x)=\frac{-2x^2+2x+\frac{97}{4}}{\sqrt{(x^2-x+25)^5}}>0,\forall x\in [0,1],\int_0^1 f(x)dx=0, g'(x)=xe^x,\]
因此$f,g$在$[0,1]$上严格递增. 根据Chebyshev 积分不等式,
\[\int_0^1\frac{(x-1)(x-\frac{1}{2})e^x}{\sqrt{(x^2-x+25)^3}}dx=\int_0^1f(x)g(x)dx>\int_0^1 f(x)dx\int_0^1g(x)dx=0.\]
\[\int_0^1\frac{xe^xdx}{\sqrt{x^2-x+25}}>\frac{1}{5}.\]
最后得到
\[\frac{1}{5}<\int_0^1\frac{xe^xdx}{\sqrt{x^2-x+25}}<\frac{2}{\sqrt{99}}.\]

2018年武汉大学653数学分析
 
一(30分).1.计算极限$$\lim_{n\rightarrow\infty}\sum_{k=n^2}^{(n+1)^2}\frac1{\sqrt k}.$$
    2.计算极限$$\lim_{n\rightarrow\infty}\frac{\int_0^\mathrm\pi\sin^nx\cos^6x\operatorname dx}{\int_0^\mathrm\pi\sin^nx\operatorname dx}$$
    3.已知$x_{n+1}=\ln\left(1+x_n\right)$,且$x_1>0$,计算$$\lim_{n\rightarrow\infty}nx_n$$
 
二.设$f(x),f_1(x)$在$[a,b]$区间上连续,$f_{n+1}(x)=f(x)+\int_a^x\sin\{f_n(t)\}\operatorname dt$,证明:$\{f_n\}$在$[a,b]$一致收敛.
 
 
三.设$$f(x)=\left\{\begin{array}{lc}e^{-\frac1{x^2}}&,\;x\neq0\\0&,\;x=0\end{array}\right.$$证明$f(x)$在$x=0$处任意阶导数存在.
 
 
四.已知$(x_1,x_2,x_3)\in{R}^3$,其中$u=\frac1{\left|x\right|},\left|x\right|=\sqrt{x_1^2+x_2^2+x_3^2}$,计算
$$\oint\limits_S\frac{\partial^2 u}{\partial x_i\partial x_j}{\rm d}S,i,j=1,2,3$$,其中$S:x_1^2+x_2^2+x_3^2=R^2$
 
五.讨论求解方程$f(x)$牛顿切线法.1.推导牛顿切线法迭代公式;
                                                   2.在适当的条件下,证明牛顿切线法收敛
 
六(20分).求极限$$\lim_{n\rightarrow\infty}(nA-\sum_{k=1}^nf(\frac kn))=B$$存在时,$A,B$的值。
 
七.设$u_i=u_i(x_1,x_2),i=1,2$,且关于每个变量为周期1的连续可微函数,求$$\iint\limits_{0\leq x_1,x_2\leq1}det(\delta_{ij}+\frac{\partial u_i}{\partial x_j})dx_1dx_2,$$其中$det(\delta_{ij}+\frac{\partial u_i}{\partial x_j})$是映射$x\mapsto(x_1+u_1,x_2+u_2)$的雅克比行列式.
 
八(40分).设$f(x)$在$[a,b]$上$Riemann$可积,$\varphi(x)$是周期为$T$的连续函数,证明:
        1.存在阶梯函数$g_\varepsilon(x)$使得$$\int_a^b\left|f(x)-g_\varepsilon(x)\right|\operatorname dx<\frac\varepsilon2$$
        2.计算$$\lim_{n\rightarrow\infty}\int_a^b\varphi(nx)\operatorname dx$$
        3.证明$$\lim_{n\rightarrow\infty}\int_a^bf(x)\varphi(nx)\operatorname dx=\frac1T\int_0^T\varphi(x)\operatorname dx\int_a^bf(x)\operatorname dx$$
        4.计算$$\lim_{n\rightarrow\infty}\frac1{\ln n}\int_0^T\frac{\varphi(nx)}xdx,其中函数\frac{\varphi(nx)}x收敛$$

试题(1b):证明\[\lim_{n\to +\infty}\left(\int_0^1\frac{\sin x^n}{x^n}dx\right)^n=\prod_{k=1}^{+\infty}\exp{\left(\frac{(-1)^k}{2k(2k+1)!}\right)}\]
 
作代换$x^n=y$
\[\int_0^1\frac{\sin x^n}{x^n}dx=\frac{1}{n}\int_0^1\frac{\sin y}{y^{2-\frac{1}{n}}}dy\]
\[\int_0^1 y^{\frac{1}{n}-2}\sum_{k=0}^{+\infty}\frac{(-1)^k}{(2k+1)!}y^{2k+1}dy=\int_0^1 y^{\frac{1}{n}-1}dy+\int_0^1\sum_{k=1}^{+\infty}\frac{(-1)^k}{(2k+1)!}y^{2k-1+\frac{1}{n}}dy\]
容易得到
\[\int_0^1 y^{\frac{1}{n}-1}dy=n,\left|\frac{(-1)^k}{(2k+1)!}y^{2k-1+\frac{1}{n}}\right|\le \frac{1}{(2k+1)!}\]
由优级数判别法后一项中的函数项级数一致收敛,可以逐项积分,上式
\[=n+\sum_{k=1}^{+\infty}\frac{(-1)^k}{(2k+1)!}\int_0^1 y^{2k-1+\frac{1}{n}}dy=n+\sum_{k=1}^{+\infty}\frac{(-1)^k}{(2k+1)!}\frac{1}{2k+\frac{1}{n}}\]
最终我们得到
\[\int_0^1\frac{\sin x^n}{x^n}dx=1+\frac{1}{n}\sum_{k=1}^{+\infty}\frac{(-1)^k}{(2k+1)!}\frac{1}{2k+\frac{1}{n}}\]
取对数,要证明的表达式化为
\[\lim_{n\to+\infty}n\ln \left(1+\frac{1}{n}\sum_{k=1}^{+\infty}\frac{(-1)^k}{(2k+1)!}\frac{1}{2k+\frac{1}{n}}\right)=\sum_{k=1}^{+\infty}\left(\frac{(-1)^k}{2k(2k+1)!}\right)\]
\[\left|\sum_{k=1}^{+\infty}\frac{(-1)^k}{(2k+1)!}\frac{1}{2k+\frac{1}{n}}\right|\le \sum_{k=1}^{+\infty}\frac{1}{(2k+1)!}<+\infty\]
\[\lim_{n\to+\infty}\frac{1}{n}\sum_{k=1}^{+\infty}\frac{(-1)^k}{(2k+1)!}\frac{1}{2k+\frac{1}{n}}=0\]
\[\lim_{n\to+\infty}n\ln \left(1+\frac{1}{n}\sum_{k=1}^{+\infty}\frac{(-1)^k}{(2k+1)!}\frac{1}{2k+\frac{1}{n}}\right)=\lim_{n\to+\infty}\sum_{k=1}^{+\infty}\frac{(-1)^k}{(2k+1)!}\frac{1}{2k+\frac{1}{n}}\]
现在我们希望极限与级数和交换顺序,考虑$[0,1]$上的函数项级数
\[f(x)=\sum_{k=1}^{+\infty}\frac{(-1)^k}{(2k+1)!}\frac{1}{2k+x}\]
仍然由优级数判别法一致收敛,故由$\mathrm{Heine}$定理原式
\[=\lim_{n\to +\infty}f(\frac{1}{n})=f(0)=\sum_{k=1}^{+\infty}\frac{(-1)^k}{(2k+1)!}\frac{1}{2k}\]
作者: TangSong    时间: 昨天 02:00
 
试题(1c):证明
 
\[\lim_{n\to +\infty}\frac{1}{n}\sum_{k=1}^n\ln(1+\frac{k^2-k}{n^2})=\ln 2-2+\frac{\pi}{2}\]
注意到下面式子中第一项是一个$\mathrm{Riemann}$和我们有
\[\lim_{n\to +\infty}\frac{1}{n}\sum_{k=1}^n\ln(1+\frac{k^2}{n^2})=\int_0^1\ln(1+x^2)dx=x\ln(1+x^2)\left|_0^1\right.-\int_0^1\frac{2x^2}{1+x^2}dx=\ln 2-2+\frac{\pi}{2}\]
我们只需要再证明
\[\lim_{n\to +\infty}\frac{1}{n}\sum_{k=1}^n\ln(1+\frac{k^2-k}{n^2})=\lim_{n\to +\infty}\frac{1}{n}\sum_{k=1}^n\ln(1+\frac{k^2}{n^2})\]
利用不等式
\[x,y\ge 0,\left|\ln(1+x)-\ln(1+y)\right|=\left|\frac{x-y}{1+\xi}\right|\le|x-y|\]
\[\left|\frac{1}{n}\sum_{k=1}^n\ln(1+\frac{k^2-k}{n^2})-\frac{1}{n}\sum_{k=1}^n\ln(1+\frac{k^2}{n^2})\right|\le \frac{1}{n}\sum_{k=1}^n\left|\ln(1+\frac{k^2-k}{n^2})-\ln(1+\frac{k^2}{n^2})\right|\]
\[\le \frac{1}{n}\sum_{k=1}^n\frac{k}{n^2}=\frac{n+1}{2n^2}\to 0\]
作者: TangSong    时间: 昨天 02:54
试题(8)
$f(x)$在$[1,+\infty)$上二次可导,$\forall x\in [1,+\infty),f(x)>0,f''(x)\le 0,f(+\infty)=+\infty$
证明
\[\lim_{s\to 0^+}\sum_{n=1}^{+\infty}\frac{(-1)^n}{f^s(n)}\]
存在并求之.
 
由二阶导数非正,$f'(x)$在$[1,+\infty)$单减,容易看出$f'$恒正.事实上若有某个$x_0,f'(x_0)\le 0$则由单调性
\[\forall x\ge x_0,f'(x)\le f'(x_0)\le 0,f(x)\le f(x_0)\]与$f(+\infty)=+\infty$矛盾.因此$f$在$[1,+\infty)$严增.
我们将收敛性的证明与求值放在一起进行.
\[S_{2n}(s)=\sum_{k=1}^n \left(\frac{1}{f^s(2k)}-\frac{1}{f^s(2k-1)}\right)\]
注意和式中每个括号都是负的且级数通项趋于$0$,只需要证明对固定的$s>0,S_{2n}(s)$有下界则
\[\lim_{n\to +\infty}S_{2n}(s)\]存在且等于
\[\sum_{n=1}^{+\infty}\frac{(-1)^n}{f^s(n)}\]
由$\mathrm{Lagrange}$中值定理,
\[\frac{1}{f^s(2k)}-\frac{1}{f^s(2k-1)}=\frac{-sf'(\xi)}{f^{s+1}(\xi)},\xi\in (2k-1,2k)\]
注意$f$单增而$f'$单减我们有
\[\frac{-sf'(2k-1)}{f^{s+1}(2k-1)}\le\frac{1}{f^s(2k)}-\frac{1}{f^s(2k-1)}\le \frac{-sf'(2k)}{f^{s+1}(2k)}\]
\[\sum_{k=1}^n\frac{-sf'(2k-1)}{f^{s+1}(2k-1)}\le S_{2n}(s)\le \sum_{k=1}^n\frac{-sf'(2k)}{f^{s+1}(2k)}\]
利用面积原理的思想来估计左右两端.
由单调性$k\ge 2$时
\[\frac{f'(2k-1)}{f^{s+1}(2k-1)}\le \frac{1}{2}\int_{2k-3}^{2k-1} \frac{f'(t)}{f^{s+1}(t)}dt\]
\[\sum_{k=2}^{+\infty}\frac{f'(2k-1)}{f^{s+1}(2k-1)}\le\frac{1}{2}\int_{1}^{+\infty} \frac{f'(t)}{f^{s+1}(t)}dt=\frac{1}{2}\frac{-1}{sf^s(t)}\left|_{t=1}^{t=+\infty}\right.=\frac{1}{2sf^s(1)}\]
 
$S_{2n}(s)$有下界故极限存在.再次利用面积原理
$k\ge 1$时
\[\frac{f'(2k)}{f^{s+1}(2k)}\ge \frac{1}{2}\int_{2k}^{2k+2} \frac{f'(t)}{f^{s+1}(t)}dt\]
\[\sum_{k=1}^{+\infty}\frac{f'(2k)}{f^{s+1}(2k)}\ge\frac{1}{2}\int_{2}^{+\infty} \frac{f'(t)}{f^{s+1}(t)}dt=\frac{1}{2}\frac{-1}{sf^s(t)}\left|_{t=2}^{t=+\infty}\right.=\frac{1}{2sf^s(2)}\]
 
\[-s\left(\frac{f'(1)}{f^{s+1}(1)}+\frac{1}{2sf^s(1)}\right)\le \lim_{n\to +\infty}S_{2n}(s)\le -s\frac{1}{2sf^s(2)}\]
由前面说明就有
\[-s\left(\frac{f'(1)}{f^{s+1}(1)}+\frac{1}{2sf^s(1)}\right)\le \sum_{n=1}^{+\infty}\frac{(-1)^n}{f^s(n)}\le -s\frac{1}{2sf^s(2)}\]
而上式左右两端在$s\to 0^+$时极限都是$-\frac{1}{2}$故
\[\lim_{s\to 0^+}\sum_{n=1}^{+\infty}\frac{(-1)^n}{f^s(n)}=-\frac{1}{2}\] 

中科院2018研究生入学考试 数学分析+高等代数
数学分析部分
 
01. (15pt) 计算极限
\[\lim_{x\to\infty}\left(\sin\frac1x+\cos\frac1x\right)^{x}\text{.}\]
02. (15pt) 计算极限
\[\lim_{x\to 0} \left(\frac{4+\mathrm{e}^{\frac1x}}{2+\mathrm{e}^{\frac4x}}+\frac{\sin x}{|x|} \right)\text{.}\]
03. (15pt) 判断 (并证明) 函数 $f(x,y)=\sqrt{|{xy}|}$ 在点 $(0,0)$ 处的可微性.
 
04. (15pt) 求三个实常数 $a,b,c$,使得下式成立
\[\lim_{x\to 0}\frac1{\tan x -ax}\int_b^x\frac{s^2}{\sqrt{1-s^2}}\,\mathrm{d}s =c\text{.}\]
05. (15pt) 计算不定积分
\[\int\frac{\mathrm{d}x}{\sin^6 x+\cos^6 x}\text{.}\]
06. (15pt) 设函数 $f(x)$ 在 $[-1,1]$ 上二次连续可微,$f(0)=0$,证明:
\[
\left|\int_{-1}^1 f(x)\,\mathrm{d}x\right|\leq\frac{M}{3},\quad \text{其中 }M=\max_{x\in[-1,1]}\left|f''(x)\right|\text{.}
\]
07. (15pt) 求曲线 $y=\dfrac12x^2$ 上的点,使得曲线在该点处的法线被曲线所截得的线段长度最短.
 
08. (15pt) 设 $x>0$,证明
\[\sqrt{x+1}-\sqrt{x}=\frac1{2\sqrt{x+\theta}}\text{,}\]其中 $\theta=\theta(x)>0$,并且 $\lim\limits_{x\to 0}\theta(x)=\dfrac 14$.
 
09. (15pt) 设
\[u_n(x)=\frac{(-1)^n}{(n^2-n+1)^x}\quad (n\geq 0)\text{,}\]求函数 $f(x)=\sum\limits_{n=0}^{\infty}u_n(x)$ 的绝对收敛、条件收敛以及发散的区域.
 
10. (15pt) 证明
\[\frac15<\int_0^1\frac{x\mathrm{e}^x}{\sqrt{x^2-x+25}}\,\mathrm{d}x<\frac{2\sqrt{11}}{33}\text{.}\]
 
高等代数部分
 
一、(20pt) 设 $p(x),q(x),r(x)$ 都是数域 $\mathbb{k}$ 上的正次数多项式,而且 $p(x)$ 与 $q(x)$ 互素,$\mathrm{deg}(r(x))<\mathrm{deg}(p(x))+\mathrm{deg}(q(x))$.证明:存在数域 $\mathbb{k}$ 上的多项式 $u(x),v(x)$,满足 $\mathrm{deg}(u(x))<\mathrm{deg}(p(x)),\,\mathrm{deg}(v(x))<\mathrm{deg}(q(x))$,使得
\[\frac{r(x)}{p(x)q(x)}=\frac{u(x)}{p(x)}+\frac{v(x)}{q(x)}\text{.}\]
二、(20pt) 设 $n$ 阶方阵 $M_n=\left(|i-j|\right)_{1\leq i,j \leq n}$,令 $D_n=\mathrm{det}(M_n)$ ($M_n$ 的行列式).
  (1) 计算 $D_4$;
  (2) 证明 $D_n$ 满足递推关系式 $D_n=-4D_{n-1}-4D_{n-2}$;
  (3) 求 $n$ 阶方阵 $A_n=\left(\left|\frac1i-\frac1j\right|^{\llap{\phantom{b}}}\right)_{1\leq i,j \leq n}$ 的行列式 $\mathrm{det}(A_n)$.
 
三、(20pt) 设 $A,B$ 均是 $n$ 阶方阵,满足 $AB=0$.证明
  (1) $\mathrm{rank}(A)+\mathrm{rank}(B) \leq n$;
  (2) 对于方阵 $A$ 和正整数 $k\,(\mathrm{rank}(A) \leq k \leq n)$,必存在方阵 $B$,使得
\[\mathrm{rank}(A)+\mathrm{rank}(B)=k\text{.}\]
四、(20pt) 通过正交变换将下面的实二次型化成标准型:
\[q(x_1,x_2,x_3)=5x_1^2+5x_2^2+5x_3^2-2x_1x_2-2x_2x_3-2x_1x_3\text{.}\]
五、(20pt) 设 $A$ 和 $B$ 是两个 $n$ 阶实矩阵,并且 $A$ 是对称正定矩阵,$B$ 是反对称矩阵.证明:$A+B$ 是可逆矩阵.
 
六、(20pt) 设 $A$ 是 $n$ 阶复数矩阵,且 $A=\left(\begin{array}{l} A_1\\ A_2\end{array}\right)$,令
\[V_1=\left\{\,x\in\mathbb{C}^n\,\middle|\,A_1 x=0\,\right\},\quad V_1=\left\{\,x\in\mathbb{C}^n\,\middle|\,A_2 x=0\,\right\}\text{,}
\]证明:矩阵 $A$ 可逆的充分必要条件是向量空间 $\mathbb{C}^n$ 能够表示成子空间 $V_1$ 与 $V_2$ 的直和:$\mathbb{C}^n=V_1 \oplus V_2$.
 
七、(15pt) 证明:$8$ 个满足 $A^3=0$ 的 $5$ 阶复数矩阵中必有两个相似.
 
八、(15pt) $\mathbb{R}$ 上所有 $n\,(n\geq 2)$ 阶方阵构成的线性空间 $V=\mathbb{R}^{n \times n}$ 上的线性变换 $f:\, V \to V$ 定义为
\[f(A)=A+A'\quad \forall A\in V\text{,}\]其中 $A'$ 为 $A$ 的转置.求 $f$ 的特征值、特征子空间、极小多项式.

第九题的解答
 
 
9.  设 $B_R=\{(x,y): x^2+y^2< R^2\},u\in C^2( B_R)\cap C(\overline {B_R})$ .
 
1) 若$\Delta u\geqslant 0$, 证明
\[\max_{(x,y)\in\overline {B_R}} u(x,y)= \max_{(x,y) \in \partial B_R} u(x,y).\]
 
证明 对任意$\varepsilon>0$, 令$v_\varepsilon
(x,y)=u(x,y)+\varepsilon (x^2+y^2)$, 则
\[\Delta v_\varepsilon (x,y)=\Delta u(x,y)+4\varepsilon\geqslant 4\varepsilon.\]
由此用反证法易证
\[\max_{(x,y)\in\overline {B_R}} v_\varepsilon (x,y)= \max_{(x,y) \in \partial B_R} v_\varepsilon(x,y).\]
令$\varepsilon\to 0^+$, 即得
\[\max_{(x,y)\in\overline {B_R}} u(x,y)= \max_{(x,y) \in \partial B_R} u(x,y).\]
 
 
2).  若$\Delta u(x,y)=0$, 则
\[\frac{d}{dr}\left(\frac{1}{2\pi r}\int_{\partial B_r}u(x,y)ds\right)=0, 0\leqslant r\leqslant R.\]
 
 
证  注意到
\[\frac{1}{2\pi r}\int_{\partial B_r}u(x,y)ds=\frac{1}{2\pi}\int_0^{2\pi}u(r\cos\theta,r\sin\theta)d\theta=
\int_{\partial B_1}u(rx,ry)ds.\]从而根据Gauss公式, 得到
 
\begin{align*}\frac{d}{dr}\left(\frac{1}{2\pi r}\int_{\partial
B_r}u(x,y)ds\right)&=\frac{1}{2\pi}\int_{\partial B_1}(u_x(rx,ry)x+u_y(rx,ry)y)ds\\
&=\frac{1}{2\pi}\int_{\partial B_1} \frac{\partial
u(rx,ry)}{\partial
\nu}ds\\
&=\frac{1}{2\pi}\iint\limits_{\overline B_1}\Delta
u(rx,ry)dxdy\\
&=0.\end{align*}
3).  证明 若$\Delta u(x,y)=0$, 则
\[u(0,0)=\frac{1}{2\pi r}\int_{\partial B_r}u(x,y)ds.\]
 
证 根据2), 得到
\[\frac{1}{2\pi r}\int_{\partial B_r}u(x,y)ds=\lim_{r\to 0^+}\frac{1}{2\pi r}\int_{\partial B_r}u(x,y)ds=u(0,0).\]

2017-2018学年北京大学高等代数实验班期末试题2018.1.9
2018.1.9 上午8:30--10:30\\

安金鹏

据悉今年使用的教材是 K. Hoffman, R. Kunze: Linear Algebra

反响好我再发出期中试卷

一、设矩阵$A\in \mathbb{R}^{4\times 4}$的矩阵元均为$1$或$-1$, 求$\det A$的最大值.

二、设$V$是所有从有限域$F_p$到自身的映射构成的$F_p$-线性空间. 定义$T, U\in L(V)$为
$$ T(f)(t)=f(-t), \ \  U(f)(t)=f(t+1)-f(t), \ \ \forall \ f\in V, t\in F_p.$$
求$\det T$和$\det U$.

三、设$V$是有限维$F$-空间, $W$是$V$的子空间, $T\in L(V)$满足$T(W)\subset W$. 定义$T_W\in L(W)$和$T_{V/W}\in L(V/W)$为
$$T_W(\alpha)=T(\alpha), \alpha\in W,$$
$$T_{V/W}(\alpha+W)=T(\alpha)+W, \alpha\in V.$$
证明$\det T=\det T_W \det T_{V/W}$.

四、设$A\in F^{n\times n}$, $V$和$W$是$F^n$的子空间. 证明下述等价:

(a) 对任意的$a\in V-\{0\}$, 存在$\beta\in W$使得$\alpha A\beta^t\neq 0$.

(b) 对任意的$\gamma\in F^n$, 存在$\beta\in W$使得对任意的$\alpha\in V$有$\alpha V\beta^t=\alpha\gamma^t$.

五、设$F$是无限域. 证明对多项式代数$F[x]$的任意有限维子空间$V$, 存在$F[x]$的理想$M$满足
$$V\cap M=\{0\}, \ \ \ V+M=F[x].$$

 

醉鬼能回家,但喝醉的鸟儿可能永远回不了家!

A drunk man will find his way home, but a drunk bird may get lost forever.  —— Kakutani
醉鬼总能找到回家的路;但是喝醉了的鸟儿可能永远回不了家。 —— 角谷静夫
 
 
 
 
今天我们要谈的是一个概率论中的重要结论:Z^d上的随机游走当d≥3时是非常返的,而当d=1,2时是常返的。
 
Z^d在这里表示由d 维欧氏空间中全体整点(即坐标全为整数的点)构成的集合。想象有一只青蛙以秒为时间单位在Z^d上做随机游走,那么它将按如下规则运动:在初始时刻(记为第0秒),青蛙位于原点;在每一秒钟,青蛙都会等概率地跳到某一个与它上一秒所在位置相邻的整点。由于Z^d上的每个整点都有2d个邻居,因此这个概率也就是1/(2d)(见下图)。
 
我们这里介绍的随机游走看似一个简单的数学模型,其实它的应用十分广泛。最常见的例子有物理学中布朗运动,金融市场中股票价格波动等等。
 
那么我们的问题就是,既然青蛙一开始位于原点,那是否总存在一个(随机)时刻T,使得第T秒时青蛙又回到原点呢?如果是,那么我们就称这样随机游走是“常返”的,否则就称是“非常返”的。
 
 
 
事实上,我们总可以假设存在一个介于0和1之间的实数p,它就是青蛙回到原点的概率。仔细想想,其实p的存在性本身也是不平凡的,因为我们知道古典概率论中,事件的概率只涉及到有限个变量,而这里回到原点的行为却与青蛙在无穷时间内的行为有关。当然,在公理化概率论中,通过建立起合适的概率空间,我们可以说明这样的p是存在的。这样,我们通过引入p,判断常返性就转化为判断p是否等于1的问题了,因为“总能回到原点”用概率论的语言来说就是“以概率1回到原点”。
 
下面我们来看随机游走另一个有趣的性质:马氏性。我们注意到,对于任意给定的时刻,比如第100秒,第100秒后的青蛙的位置只取决于第100秒时青蛙的位置,而前100秒的时间里,青蛙如何跳到这一位置方式无关。这就是所谓的“马氏性”,即给定现在,未来和过去独立。随机游走还具有“强马氏性”。所谓“强马氏性”,是指可以把前述的“第100秒”换成任意“只取决于历史的随机时间”(这样的时间又叫停时)。比如我们定义T成为青蛙第一次回到原点的时刻,那么T就是一个停时,并且关于T的强马氏性可以这么理解为:在随机时间T之后发生的事情,与在随机时间T之间发生的事情无关,因为我们知道在第T秒,青蛙又回到原点了,所以在时间T后开始的随机游走与一开始从原点出发的随机游走将遵循同样的规律。
 
如果要解释什么叫“只取决于历史”,不妨看一个买卖股票的例子。比如说你今天想卖出一只股票,你当然希望可以在一天当中最高价的时候卖。但很遗憾,除了碰运气,这是不可能做到的,因为除非一天已经结束了,没人能知道股价什么时候位于最高点。相反,如果你的策略是,“如果股票价格位于过去12个小时内的最高点就卖出股票”,那这就是一个可行的策略。后面这个策略中的交易时间就是一个“只取决于历史”的随机时间,也就是停时,而前者“一天当中的最高价”则不是停时。
 
如果你没看懂上面一大串关于马氏链和停时的描述,没关系,你一定也可以直观地理解以下结论。如果从原点出发的青蛙以概率p会回到原点,那么青蛙一定会以概率p^2(p^n表示p的n次方,下文相同)回到原点两次,这是因为,青蛙回到原点两次=青蛙回到原点1次+青蛙从原点出发再回到原点1次。由强马氏性,拆分后的第二个事件的(条件)概率也是p;因此,青蛙回到原点两次的概率就是p^2。同理,青蛙会以概率p^3回到原点3次,以概率p^4回到原点4次,等等。如果我们把青蛙回到原点的总次数记为N,那么上面的计算表明P(N≥k) = p^k,也就是说N是一个服从几何分布的随机变量。当p=1时,上述论证依然成立,只不过我们得到的N是一个取值恒为+∞的随机变量。
 
于是,根据几何分布的期望公式,我们得到了N的期望为EN = 1/(1-p);同样地,当p=1时,该式理解为EN=+∞。因此,EN是有限还是无穷,就刻画了随机游走是否常返。
 
我们还可以从另一个角度来计算EN。令X(n)为第n秒青蛙所在的位置,而an是取值0和1的随机变量,其中a(n)=1当且仅当X(n)=0,即a(n)=1当且仅当第n秒青蛙位于原点。根据定义我们得到N是全体a(n)的和,也就是N=a(1) + a(2) +…+ a(n) +… 这是显然的,因为整个数列(a(n))中有多少个1,就代表青蛙返回了多少次原点。
 
当我们对以上无穷和式取期望,并根据期望的线性性,交换无穷求和与求期望的顺序(这里能够换序是因为涉及的项an都是非负的,因此满足换序的条件),我们得到
 
EN = E(a(1) + a(2) +…+ a(n) +…) = E a(1)  + E a(2) +...+E a(n) +...
 
等等,E a(n)  是什么呢?根据定义,E a(n) = P(X(n)= 0),正是第n秒青蛙恰好位于原点的概率!计算这个概率就是一个组合问题了,而判断常返性则变成了一个判断无穷级数敛散性的问题。
 
记A(n)= E a(n) = P(X(n)= 0)。下面我们的目标就是对A(n)进行估计,并由此判断无穷级数∑A(n)是否收敛。
 
在一维(d=1)时,如何计算A(n)呢?注意到每一秒钟青蛙必须向左跳或者向后跳。因此在第n秒回到原点的必要条件就是n为偶数。而当n为偶数时,青蛙必须恰好有n/2的时间向左跳,有n/2的时间向右跳,才能在第n秒回到原点。我们知道每秒钟青蛙向左和向右的概率都是1/2,那么利用组合数公式,我们就得到
 
 
对于阶乘,斯特林公式给出了渐近公式:m! ∼(m/e)^n·sqrt(2πn) (sqrt表示开二次根号,下同)。代入A(n)的表达式,我们得到A(n)∼1/n·sqrt(2/π)这个渐近关系当然只限于n为偶数)。微积分中熟知的结论是p级数∑1/n^p收敛当且仅当p>1,否则发散。于是我们得到∑A(n)在d=1时发散,也就是说一维随机游走是常返的。
 
如果我们在高维时采用类似的方法,就能得到A(n) ∼ c· n^(-d/2),其中c是与d有关的一个常数。同样再借助p级数的知识,就能得到当且仅当d/2 > 1时,也就是d ≥3时,随机游走不常返;相反,d=1,2时,随机游走常返。
 
为了避免复杂的组合数估计,我们也可以从另一个简单的事实中看出A(n)的阶就是n^(-d/2)。如果我们令y(n)=X(n)-X(n-1)为第n秒时青蛙的位移,容易看出所有y(n)都是独立同分布的随机单位向量。由中心极限定理,Z(n) :=X(n)/sqrt(n) = (y(1) + y(2) + … y(n))/sqrt(n)将趋向于一个d维正态分布Z。那X(n)=0意味着什么呢?由于X(n)只能取整点,那么X(n)= 0表明Z(n)的取值大约位于原点附近一个边长为的1/sqrt(n)小正方体中。根据中心极限定理,Z(n)的取值落于这个小正方体中的概率与Z是差不多的,而对于后者,这样的概率恰恰就约等于小正方体的体积,(1/sqrt(n))^d(注意到是d维空间),乘以原点处Z的密度函数大小,一个非零的常数。这样我们就很容易得到了A(n) ∼ c· n^(-d/2)这个结论。
 
如果要把这个随机游走的小结论用于生活中,我们也许会为再也不用担心认不得路而感到欣慰,因为二维随机游走是常返的,就算是不认识路随便乱走,也总能到达任何想去的地方!当然这句话既对也错;对的地方在于,由常返性,确实总存在一个时间T,在平面上随机游走的你也能走到任意想去的地方;错的地方在于,更进一步的理论表明,这个随机时间T是一个期望为无穷的随机变量,也就是从平均的意义上说,你永远也到不了目的地!
 
作者:小米

拉格朗日乘数法

咏怀古迹五首·其一
杜甫
 
支离东北风尘际,漂泊西南天地间。
三峡楼台淹日月,五溪衣服共云山。
羯胡事主终无赖,词客哀时且未还。
庾信平生最萧瑟,暮年诗赋动江关。
 
 一个好的外科医生不应该总是在进行补救式的英雄行为,而是应该预测和预防这些不必要的行为。
 
还记得扁鹊三兄弟的故事吗?
 
根据典记,魏文王曾求教于名医扁鹊:「你们家兄弟三人,都精于医术,谁是医术最好的呢?」
 
扁鹊:「大哥最好,二哥差些,我是三人中最差的一个。」
 
魏王不解地说:「为什么呢?请你详细解释下。」 
 
扁鹊说:
 
「大哥治病,是在病情发作之前,那时候病人自己还不觉得有病,但大哥就下药铲除了病根,使他的医术难以被人认可,所以没有名气,只是在我们家中被推崇备至;
 
我的二哥治病,是在病初起之时,症状尚不十分明显,病人也没有觉得痛苦,二哥就能药到病除,使乡里人都认为二哥只是治小病很灵;
 
我治病,都是在病情十分严重之时,病人痛苦万分,病人家属心急如焚。此时,他们看到我在经脉上穿刺,用针放血,或在患处敷以毒药以毒攻毒,或动大手术直指病灶,使重病人病情得到缓解或很快治愈,所以我名闻天下。」
 
魏王大悟。
 
拉格朗日乘数法(Lagrange multiplier)有很直观的几何意义。举个2维的例子来说明:假设有自变量x和y,给定约束条件g(x,y)=c,要求f(x,y)在约束g下的极值。我们可以画出f的等高线图,如下图。此时,约束g=c由于只有一个自由度,因此也是图中的一条曲线(红色曲线所示)。显然地,当约束曲线g=c与某一条等高线f=d1相切时,函数f取得极值。两曲线相切等价于两曲线在切点处拥有共线的法向量。因此可得函数f(x,y)与g(x,y)在切点处的梯度(gradient)成正比。于是我们便可以列出方程组求解切点的坐标(x,y),进而得到函数f的极值。
(相切的时候碰到最高的等高线)
作者:卢健龙
链接:https://www.zhihu.com/question/38586401/answer/105273125
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

连分数理论

1.

如何开启深度学习之旅?这三大类125篇论文为你导航(附资源下载)

选自Github

作者:songrotek

机器之心编译

参与:晏奇、黄小天

如果你现在还是个深度学习的新手,那么你问的第一个问题可能是「我应该从哪篇文章开始读呢?」在 Github 上,songrotek 准备了一套深度学习阅读清单,而且这份清单在随时更新。至于文中提到的 PDF,读者们可点击阅读原文下载机器之心打包的论文,或点开下面的项目地址下载自己喜欢的学习材料。

项目地址:https://github.com/songrotek/Deep-Learning-Papers-Reading-Roadmap

这份清单依照下述 4 条原则建立:

·         从整体轮廓到细节

·         从过去到当代

·         从一般到具体领域

·         聚焦当下最先进技术

你会发现很多非常新但很值得一读的论文。这份清单我会持续更新。

1、深度学习的历史与基础知识

1.0 书籍

[0] Bengio, Yoshua, Ian J. Goodfellow, and Aaron Courville. 深度学习(Deep learning), An MIT Press book. (2015). (这是深度学习领域的圣经,你可以在读此书的同时阅读下面的论文)。

1.1 调查类:

[1] LeCun, Yann, Yoshua Bengio, and Geoffrey Hinton. 深度学习 (Deep learning), Nature 521.7553 (2015): 436-444. (深度学习三位大牛对各种学习模型的评价)

1.2 深度信念网络(DBN)(深度学习前夜的里程碑)

[2] Hinton, Geoffrey E., Simon Osindero, and Yee-Whye Teh. 一个关于深度信念网络的快速学习算法(A fast learning algorithm for deep belief nets), (深度学习的前夜)

[3] Hinton, Geoffrey E., and Ruslan R. Salakhutdinov. 使用神经网络降低数据的维度(Reducing the dimensionality of data with neural networks), (里程碑式的论文,展示了深度学习的可靠性)

1.3 ImageNet 的演化(深度学习从这里开始)

[4] Krizhevsky, Alex, Ilya Sutskever, and Geoffrey E. Hinton. 使用深度卷积神经网络进行 ImageNet 分类任务(Imagenet classification with deep convolutional neural networks)(AlexNet, 深度学习的突破)

[5] Simonyan, Karen, and Andrew Zisserman. 针对大尺度图像识别工作的的超深卷积网络(Very deep convolutional networks for large-scale image recognition) (VGGNet, 神经网络开始变得非常深!)

[6] Szegedy, Christian, et al. 更深的卷积(Going deeper with convolutions)(GoogLeNet)

[7] He, Kaiming, et al. 图像识别的深度残差学习(Deep residual learning for image recognition)(ResNet,超级超级深的深度网络!CVPR--IEEE 国际计算机视觉与模式识别会议-- 最佳论文)

1.4 语音识别的演化

[8] Hinton, Geoffrey, et al. 语音识别中深度神经网络的声学建模(Deep neural networks for acoustic modeling in speech recognition: The shared views of four research groups)(语音识别中的突破)

[9] Graves, Alex, Abdel-rahman Mohamed, and Geoffrey Hinton. 用深度循环神经网络进行语音识别(Speech recognition with deep recurrent neural networks)(RNN)

[10] Graves, Alex, and Navdeep Jaitly. 面向端到端语音识别的循环神经网络(Towards End-To-End Speech Recognition with Recurrent Neural Networks)

[11] Sak, Haşim, et al. 语音识别中快且精准的循环神经网络声学模型(Fast and accurate recurrent neural network acoustic models for speech recognition)(谷歌语音识别系统)

[12] Amodei, Dario, et al. Deep speech 2:英语和汉语的端到端语音识别(Deep speech 2: End-to-end speech recognition in english and mandarin)(百度语音识别系统)

[13] W. Xiong, J. Droppo, X. Huang, F. Seide, M. Seltzer, A. Stolcke, D. Yu, G. Zweig,在对话语音识别中实现人类平等(Achieving Human Parity in Conversational Speech Recognition) (最先进的语音识别技术,微软)

当你读完了上面给出的论文,你会对深度学习历史有一个基本的了解,深度学习建模的基本架构(包括了 CNN,RNN,LSTM)以及深度学习如何可以被应用于图像和语音识别问题。下面的论文会让你对深度学习方法,不同应用领域中的深度学习技术和其局限有深度认识。我建议你可以基于自己的兴趣和研究方向选择下面这些论文。

2 深度学习方法

2.1 模型

[14] Hinton, Geoffrey E., et al. 通过避免特征检测器的共适应来改善神经网络(Improving neural networks by preventing co-adaptation of feature detectors)(Dropout)

[15] Srivastava, Nitish, et al. Dropout:一种避免神经网络过度拟合的简单方法(Dropout: a simple way to prevent neural networks from overfitting)

[16] Ioffe, Sergey, and Christian Szegedy. Batch normalization:通过减少内部协变量加速深度网络训练(Batch normalization: Accelerating deep network training by reducing internal covariate shift)(2015 年一篇杰出论文)

[17] Ba, Jimmy Lei, Jamie Ryan Kiros, and Geoffrey E. Hinton.层归一化(Layer normalization)(批归一化的升级版)

[18] Courbariaux, Matthieu, et al. 二值神经网络:训练神经网络的权重和激活约束到正 1 或者负 1(Binarized Neural Networks: Training Neural Networks with Weights and Activations Constrained to+ 1 or−1)(新模型,快)

[19] Jaderberg, Max, et al. 使用合成梯度的解耦神经接口(Decoupled neural interfaces using synthetic gradients)(训练方法的发明,令人惊叹的文章)

[20] Chen, Tianqi, Ian Goodfellow, and Jonathon Shlens. Net2net:通过知识迁移加速学习(Net2net: Accelerating learning via knowledge transfer) (修改之前的训练网络以减少训练)

[21] Wei, Tao, et al. 网络形态(Network Morphism)(修改之前的训练网络以减少训练 epoch)

2.2 优化

[22] Sutskever, Ilya, et al. 有关深度学习中初始化与动量因子的研究(On the importance of initialization and momentum in deep learning) (动量因子优化器)

[23] Kingma, Diederik, and Jimmy Ba. Adam:随机优化的一种方法(Adam: A method for stochastic optimization)(可能是现在用的最多的一种方法)

[24] Andrychowicz, Marcin, et al. 通过梯度下降学习梯度下降(Learning to learn by gradient descent by gradient descent) (神经优化器,令人称奇的工作)

[25] Han, Song, Huizi Mao, and William J. Dally. 深度压缩:通过剪枝、量子化训练和霍夫曼代码压缩深度神经网络(Deep compression: Compressing deep neural network with pruning, trained quantization and huffman coding) (ICLR 最佳论文,来自 DeePhi 科技初创公司,加速 NN 运行的新方向)

[26] Iandola, Forrest N., et al. SqueezeNet:带有 50x 更少参数和小于 1MB 模型大小的 AlexNet-层级精确度(SqueezeNet: AlexNet-level accuracy with 50x fewer parameters and< 1MB model size.) (优化 NN 的另一个新方向,来自 DeePhi 科技初创公司)

2.3 无监督学习/深度生成模型

[27] Le, Quoc V. 通过大规模无监督学习构建高级特征(Building high-level features using large scale unsupervised learning.) (里程碑,吴恩达,谷歌大脑,猫)

[28] Kingma, Diederik P., and Max Welling. 自动编码变异贝叶斯(Auto-encoding variational bayes.) (VAE)

[29] Goodfellow, Ian, et al. 生成对抗网络(Generative adversarial nets.)(GAN, 超酷的想法)

[30] Radford, Alec, Luke Metz, and Soumith Chintala. 带有深度卷曲生成对抗网络的无监督特征学习(Unsupervised representation learning with deep convolutional generative adversarial networks.)(DCGAN)

[31] Gregor, Karol, et al. DRAW:一个用于图像生成的循环神经网络(DRAW: A recurrent neural network for image generation.) (值得注意的 VAE,杰出的工作)

[32] Oord, Aaron van den, Nal Kalchbrenner, and Koray Kavukcuoglu. 像素循环神经网络(Pixel recurrent neural networks.)(像素 RNN)

[33] Oord, Aaron van den, et al. 使用像素 CNN 解码器有条件地生成图像(Conditional image generation with PixelCNN decoders.) (像素 CNN)

2.4 RNN/序列到序列模型

[34] Graves, Alex. 带有循环神经网络的生成序列(Generating sequences with recurrent neural networks.)(LSTM, 非常好的生成结果,展示了 RNN 的力量)

[35] Cho, Kyunghyun, et al. 使用 RNN 编码器-解码器学习词组表征用于统计机器翻译(Learning phrase representations using RNN encoder-decoder for statistical machine translation.) (第一个序列到序列论文)

[36] Sutskever, Ilya, Oriol Vinyals, and Quoc V. Le. 运用神经网路的序列到序列学习(Sequence to sequence learning with neural networks.」)(杰出的工作)

[37] Bahdanau, Dzmitry, KyungHyun Cho, and Yoshua Bengio. 通过共同学习来匹配和翻译神经机器翻译(Neural Machine Translation by Jointly Learning to Align and Translate.)

[38] Vinyals, Oriol, and Quoc Le. 一个神经对话模型(A neural conversational model.)(聊天机器人上的序列到序列)

2.5 神经图灵机

[39] Graves, Alex, Greg Wayne, and Ivo Danihelka. 神经图灵机器(Neural turing machines.)arXiv preprint arXiv:1410.5401 (2014). (未来计算机的基本原型)

[40] Zaremba, Wojciech, and Ilya Sutskever. 强化学习神经图灵机(Reinforcement learning neural Turing machines.)

[41] Weston, Jason, Sumit Chopra, and Antoine Bordes. 记忆网络(Memory networks.)

[42] Sukhbaatar, Sainbayar, Jason Weston, and Rob Fergus. 端到端记忆网络(End-to-end memory networks.)

[43] Vinyals, Oriol, Meire Fortunato, and Navdeep Jaitly. 指示器网络(Pointer networks.)

[44] Graves, Alex, et al. 使用带有动力外部内存的神经网络的混合计算(Hybrid computing using a neural network with dynamic external memory.)(里程碑,结合上述论文的思想)

2.6 深度强化学习

[45] Mnih, Volodymyr, et al. 使用深度强化学习玩 atari 游戏(Playing atari with deep reinforcement learning.) (第一篇以深度强化学习命名的论文)

[46] Mnih, Volodymyr, et al. 通过深度强化学习达到人类水准的控制(Human-level control through deep reinforcement learning.) (里程碑)

[47] Wang, Ziyu, Nando de Freitas, and Marc Lanctot. 用于深度强化学习的决斗网络架构(Dueling network architectures for deep reinforcement learning.) (ICLR 最佳论文,伟大的想法 )

[48] Mnih, Volodymyr, et al. 用于深度强化学习的异步方法(Asynchronous methods for deep reinforcement learning.) (当前最先进的方法)

[49] Lillicrap, Timothy P., et al. 运用深度强化学习进行持续控制(Continuous control with deep reinforcement learning.) (DDPG)

[50] Gu, Shixiang, et al. 带有模型加速的持续深层 Q-学习(Continuous Deep Q-Learning with Model-based Acceleration.)

[51] Schulman, John, et al. 信赖域策略优化(Trust region policy optimization.) (TRPO)

[52] Silver, David, et al. 使用深度神经网络和树搜索掌握围棋游戏(Mastering the game of Go with deep neural networks and tree search.) (阿尔法狗)

2.7 深度迁移学习/终身学习/尤其对于 RL

[53] Bengio, Yoshua. 表征无监督和迁移学习的深度学习(Deep Learning of Representations for Unsupervised and Transfer Learning.) (一个教程)

[54] Silver, Daniel L., Qiang Yang, and Lianghao Li. 终身机器学习系统:超越学习算法(Lifelong Machine Learning Systems: Beyond Learning Algorithms.) (一个关于终生学习的简要讨论)

[55] Hinton, Geoffrey, Oriol Vinyals, and Jeff Dean. 提取神经网络中的知识(Distilling the knowledge in a neural network.) (教父的工作)

[56] Rusu, Andrei A., et al. 策略提取(Policy distillation.) (RL 领域)

[57] Parisotto, Emilio, Jimmy Lei Ba, and Ruslan Salakhutdinov. 演员模仿:深度多任务和迁移强化学习(Actor-mimic: Deep multitask and transfer reinforcement learning.) (RL 领域)

[58] Rusu, Andrei A., et al. 渐进神经网络(Progressive neural networks.)(杰出的工作,一项全新的工作)

2.8 一次性深度学习

[59] Lake, Brenden M., Ruslan Salakhutdinov, and Joshua B. Tenenbaum. 通过概率程序归纳达到人类水准的概念学习(Human-level concept learning through probabilistic program induction.)(不是深度学习,但是值得阅读)

[60] Koch, Gregory, Richard Zemel, and Ruslan Salakhutdinov. 用于一次图像识别的孪生神经网络(Siamese Neural Networks for One-shot Image Recognition.)

[61] Santoro, Adam, et al. 用记忆增强神经网络进行一次性学习(One-shot Learning with Memory-Augmented Neural Networks ) (一个一次性学习的基本步骤)

[62] Vinyals, Oriol, et al. 用于一次性学习的匹配网络(Matching Networks for One Shot Learning.)

[63] Hariharan, Bharath, and Ross Girshick. 少量视觉物体识别(Low-shot visual object recognition.)(走向大数据的一步)

3 应用

3.1 NLP(自然语言处理)

[1] Antoine Bordes, et al. 开放文本语义分析的词和意义表征的联合学习(Joint Learning of Words and Meaning Representations for Open-Text Semantic Parsing.)

[2] Mikolov, et al. 词和短语及其组合性的分布式表征(Distributed representations of words and phrases and their compositionality.) (word2vec)

[3] Sutskever, et al. 运用神经网络的序列到序列学习(Sequence to sequence learning with neural networks.)

[4] Ankit Kumar, et al. 问我一切:动态记忆网络用于自然语言处理(Ask Me Anything: Dynamic Memory Networks for Natural Language Processing.)

[5] Yoon Kim, et al. 角色意识的神经语言模型(Character-Aware Neural Language Models.)

[6] Jason Weston, et al. 走向人工智能-完成问题回答:一组前提玩具任务(Towards AI-Complete Question Answering: A Set of Prerequisite Toy Tasks.) (bAbI 任务)

[7] Karl Moritz Hermann, et al. 教机器阅读和理解(Teaching Machines to Read and Comprehend.)(CNN/每日邮件完形风格问题)

[8] Alexis Conneau, et al. 非常深度卷曲网络用于自然语言处理(Very Deep Convolutional Networks for Natural Language Processing.) (在文本分类中当前最好的)

[9] Armand Joulin, et al. 诡计包用于有效文本分类(Bag of Tricks for Efficient Text Classification.)(比最好的差一点,但快很多)

3.2 目标检测

[1] Szegedy, Christian, Alexander Toshev, and Dumitru Erhan. 深度神经网路用于目标检测(Deep neural networks for object detection.)

[2] Girshick, Ross, et al. 富特征层级用于精确目标检测和语义分割(Rich feature hierarchies for accurate object detection and semantic segmentation.)(RCNN)

[3] He, Kaiming, et al. 深度卷曲网络的空间金字塔池用于视觉识别(Spatial pyramid pooling in deep convolutional networks for visual recognition.) (SPPNet)

[4] Girshick, Ross. 快速的循环卷曲神经网络(Fast r-cnn.)

[5] Ren, Shaoqing, et al. 更快的循环卷曲神经网络:通过区域建议网络趋向实时目标检测(Faster R-CNN: Towards real-time object detection with region proposal networks.)

[6] Redmon, Joseph, et al. 你只看到一次:统一实时的目标检测(You only look once: Unified, real-time object detection.) (YOLO, 杰出的工作,真的很实用)

[7] Liu, Wei, et al. SSD:一次性多盒探测器(SSD: Single Shot MultiBox Detector.)

3.3 视觉跟踪

[1] Wang, Naiyan, and Dit-Yan Yeung. 学习视觉跟踪用的一种深度压缩图象表示(Learning a deep compact image representation for visual tracking.) (第一篇使用深度学习进行视觉跟踪的论文,DLT 跟踪器)

[2] Wang, Naiyan, et al. 为稳定的视觉跟踪传输丰富特征层次(Transferring rich feature hierarchies for robust visual tracking.)(SO-DLT)

[3] Wang, Lijun, et al. 用全卷积网络进行视觉跟踪(Visual tracking with fully convolutional networks.) (FCNT)

[4] Held, David, Sebastian Thrun, and Silvio Savarese. 用深度回归网络以 100FPS 速度跟踪(Learning to Track at 100 FPS with Deep Regression Networks.) (GOTURN, 作为一个深度神经网络,其速度非常快,但是相较于非深度学习方法还是慢了很多)

[5] Bertinetto, Luca, et al. 对象跟踪的全卷积 Siamese 网络(Fully-Convolutional Siamese Networks for Object Tracking.) (SiameseFC, 实时对象追踪的最先进技术)

[6] Martin Danelljan, Andreas Robinson, Fahad Khan, Michael Felsberg. 超越相关滤波器:学习连续卷积算子的视觉追踪(Beyond Correlation Filters: Learning Continuous Convolution Operators for Visual Tracking.)(C-COT)

[7] Nam, Hyeonseob, Mooyeol Baek, and Bohyung Han. 在视觉跟踪的树结构中传递卷积神经网络与建模(Modeling and Propagating CNNs in a Tree Structure for Visual Tracking.)(VOT2016 Winner,TCNN)

3.4 图像说明

[1] Farhadi,Ali,etal. 每幅图都讲述了一个故事:从图像中生成句子(Every picture tells a story: Generating sentences from images.)

[2] Kulkarni, Girish, et al. 儿语:理解并生成图像的描述(talk: Understanding and generating image deions.)

[3] Vinyals, Oriol, et al. 展示与表达:一个神经图像字幕生成器(Show and tell: A neural image caption generator)

[4] Donahue, Jeff, et al. 视觉认知和描述的长期递归卷积网络(Long-term recurrent convolutional networks for visual recognition and deion)

[5] Karpathy, Andrej, and Li Fei-Fei. 产生图像描述的深层视觉语义对齐(Deep visual-semantic alignments for generating image deions)

[6] Karpathy, Andrej, Armand Joulin, and Fei Fei F. Li. 双向图像句映射的深片段嵌入(Deep fragment embeddings for bidirectional image sentence mapping)

[7] Fang, Hao, et al. 从字幕到视觉概念,从视觉概念到字幕(From captions to visual concepts and back)

[8] Chen, Xinlei, and C. Lawrence Zitnick. 图像字幕生成的递归视觉表征学习「Learning a recurrent visual representation for image caption generation

[9] Mao, Junhua, et al. 使用多模型递归神经网络(m-rnn)的深度字幕生成(Deep captioning with multimodal recurrent neural networks (m-rnn).)

[10] Xu, Kelvin, et al. 展示、参与与表达:视觉注意的神经图像字幕生成(Show, attend and tell: Neural image caption generation with visual attention.)

3.5 机器翻译

一些里程碑式的论文在 RNN 序列到序列的主题分类下被列举。

[1] Luong, Minh-Thang, et al. 神经机器翻译中生僻词问题的处理(Addressing the rare word problem in neural machine translation.)

[2] Sennrich, et al. 带有子词单元的生僻字神经机器翻译(Neural Machine Translation of Rare Words with Subword Units)

[3] Luong, Minh-Thang, Hieu Pham, and Christopher D. Manning. 基于注意力的神经机器翻译的有效途径(Effective approaches to attention-based neural machine translation.)

[4] Chung, et al. 一个机器翻译无显式分割的字符级解码器(A Character-Level Decoder without Explicit Segmentation for Neural Machine Translation)

[5] Lee, et al. 无显式分割的全字符级神经机器翻译(Fully Character-Level Neural Machine Translation without Explicit Segmentation)

[6] Wu, Schuster, Chen, Le, et al. 谷歌的神经机器翻译系统:弥合人与机器翻译的鸿沟(Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation)

3.6 机器人

[1] Koutník, Jan, et al. 发展用于视觉强化学习的大规模神经网络(Evolving large-scale neural networks for vision-based reinforcement learning.)

[2] Levine, Sergey, et al. 深度视觉眼肌运动策略的端到端训练(End-to-end training of deep visuomotor policies.)

[3] Pinto, Lerrel, and Abhinav Gupta. 超大尺度自我监督:从 5 万次尝试和 700 机器人小时中学习抓取(Supersizing self-supervision: Learning to grasp from 50k tries and 700 robot hours.)

[4] Levine, Sergey, et al. 学习手眼协作用于机器人掌握深度学习和大数据搜集(Learning Hand-Eye Coordination for Robotic Grasping with Deep Learning and Large-Scale Data Collection.)

[5] Zhu, Yuke, et al. 使用深度强化学习视觉导航目标驱动的室内场景(Target-driven Visual Navigation in Indoor Scenes using Deep Reinforcement Learning.)

[6] Yahya, Ali, et al. 使用分布式异步引导策略搜索进行集体机器人增强学习(Collective Robot Reinforcement Learning with Distributed Asynchronous Guided Policy Search.)

[7] Gu, Shixiang, et al. 深度强化学习用于机器操控(Deep Reinforcement Learning for Robotic Manipulation.)

[8] A Rusu, M Vecerik, Thomas Rothörl, N Heess, R Pascanu, R Hadsell. 模拟实机机器人使用过程网从像素中学习(Sim-to-Real Robot Learning from Pixels with Progressive Nets.)

[9] Mirowski, Piotr, et al. 学习在复杂环境中导航(Learning to navigate in complex environments.)

3.7 艺术

[1] Mordvintsev, Alexander; Olah, Christopher; Tyka, Mike (2015). 初始主义:神经网络的更深层(Inceptionism: Going Deeper into Neural Networks)(谷歌 Deep Dream)

[2] Gatys, Leon A., Alexander S. Ecker, and Matthias Bethge. 一个艺术风格的神经算法(A neural algorithm of artistic style.) (杰出的工作,目前最成功的算法)

[3] Zhu, Jun-Yan, et al. 自然图像流形上的生成视觉操纵(Generative Visual Manipulation on the Natural Image Manifold.)

[4] Champandard, Alex J. Semantic Style Transfer and Turning Two-Bit Doodles into Fine Artworks. (神经涂鸦)

[5] Zhang, Richard, Phillip Isola, and Alexei A. Efros. 多彩的图像彩色化(Colorful Image Colorization.)

[6] Johnson, Justin, Alexandre Alahi, and Li Fei-Fei. 实时风格迁移和超分辨率的感知损失(Perceptual losses for real-time style transfer and super-resolution.)

[7] Vincent Dumoulin, Jonathon Shlens and Manjunath Kudlur. 一个艺术风格的学习表征(A learned representation for artistic style.)

[8] Gatys, Leon and Ecker, et al. 神经风格迁移中的控制感知因子(Controlling Perceptual Factors in Neural Style Transfer.) (控制空间定位、色彩信息和全空间尺度方面的风格迁移)

[9] Ulyanov, Dmitry and Lebedev, Vadim, et al. 纹理网络:纹理和风格化图像的前馈合成(Texture Networks: Feed-forward Synthesis of Textures and Stylized Images.) (纹理生成和风格迁移)

3.8 对象分割

[1] J. Long, E. Shelhamer, and T. Darrell, 用于语义分割的全卷积网络(Fully convolutional networks for semantic segmentation)

[2] L.-C. Chen, G. Papandreou, I. Kokkinos, K. Murphy, and A. L. Yuille. 具有深度卷积网络和全连接的条件随机场的语义图像分割(Semantic image segmentation with deep convolutional nets and fully connected crfs)

[3] Pinheiro, P.O., Collobert, R., Dollar, P. 学习如何分割候选对象(Learning to segment object candidates)

[4] Dai, J., He, K., Sun, J. 基于多任务网络级联的实例感知语义分割(Instance-aware semantic segmentation via multi-task network cascades)

[5] Dai, J., He, K., Sun, J. 实例敏感的全卷积网络(Instance-sensitive Fully Convolutional Networks)