感谢苟神

感谢天恒巨巨

感谢所有借过饭卡的人 ʕ •ᴥ•ʔ

开始从头说起

当时提前一天来的，就开始了看ng的网课。

然后实现了第0个lab的优先队列

heap!

数据结构加深理解

hackinit

八十进前十，第七，fake奖品

(workshop)

回来后，

爆肝赶进度，做完LLRBT实现set容器

看算法。看stl详解。

当时出现了一些bug，还是用printf debug法

接下来进入ml的学习

Linear algebra（特征分解、Moore-Penrose伪逆、迹运算）、概率与信息论（常用概率分布、Bernoulli分布、 Multinoulli分布、高斯分布、指数分布和Laplace分布、Dirac分布和经验分布）、数值计算（Hessian）

我对模型的总结

监督：（对样本的适应性+学习结果的限制的合理性）的最优化

如果按照适用问题分类

函数：

部分model之间的关系

model的学习策略上和学习算法上对比：

dl：

卷积运算

通过三个重要的思想: 稀疏交互(sparse interactions)、参数共享(parameter sharing)、等变表示(equivariant representa- tions)。

稀疏交互：使核的大小远小于输入的大小来达到的。举个例子, 当处理一张图像时,输入的图像可能包含成千上万个像素点,但是我们可以通过只占用几十个像素点的核来检测一些小的有意义的特征,例如图像的边缘。意味着我们需要存储的参数更少,而且提高了它的统计效率，更少的计算量。

参数共享：在一个模型的多个函数中使用相同的参数。传统权重矩阵的每一个元素只使用一次,当它乘以输入的一个元素后就再也不会用到了。在卷积神经网络中,核的每一个元素都作用在输入的每一位置上。参数共享保证了我们只需要学习一个参数集合,而不是对于每一位置都需要学习一个单独的参数集合。把模型的存储需求降低至 k 个参数,并且 k 通常要比 m 小很多个数量级。m大概等于n,故·k相对于 m × n 是很小的。总之存储需求和统计效率优于稠密矩阵的乘法运算。

平移等变：如果一个函数满足输入改变,输出也以同样的方式改变这一性质,我们就说是等变的。如果我们把输入中的一个事件向后延时,在输出中仍然会有完全相同的表示,只是时间延后了。图像与之类似,卷积产生了一个 2 维映射来表明某些特征在输入中出现的位置。如果我们移动输入中的对象,它的表示也会在输出中移动同样的量。