您当前的位置: 投影笔 >> 投影笔资源 >> 收藏机器学习深度学习面试知识点汇总

收藏机器学习深度学习面试知识点汇总

本文归纳了一些秋招口试中会碰到的题目和一些首要的学识点，恰当口试前袭击和坚韧根基学识。

做家丨Oldpan根源丨oldpan博客编纂丨极市平台引子

近来这段时候正临秋招，这篇文章是老潘在那会找处事进程中整顿的一些首要学识点，体例较量杂碎，部份搜罗于网络，简捷整顿下发出来，恰当口试前袭击，固然也恰当坚韧根基学识。别的举荐众人一册叫做《百面机械研习》的新书，年8月份出书的，个中包含了不少机械研习、深度研习口试进程中会碰到的题目，较量恰当需求预备口试的机械研习、深度研习方面的算法工程师，固然也一样恰当坚韧根基~偶尔间肯定要需求看的书本：

程序员的数学系列，恰当重温学识，回想一些根基的线性代数、几率论。深度研习花书，归纳类书，有根基学识的讲授，较量周全。统计研习法子，归纳类书，篇幅不长，都是中枢。PatternRecognitionandMachineLearning，头绪明晰，用贝叶斯的方法来讲授机械研习。机械研习西瓜书，恰当当讲义，体例较广然而不深。百翻不烂的百面机械研习罕见的学识题L1正则也许使小量权值较大，多半权值为0，获得零落的权值；L2正则会使权值都趋近于0但非零，获得滑润的权值；在AdaBoost算法中，被错分的模范的权重革新比例的公式好似；Boosting和Bagging都是组合多个分类器投票的法子，但Boosting是依据单个分类器的确实率决议其权重，Bagging是可简捷地配置一切分类器权重好似；EM算法不能保证找到全部最优值；SVR中核函数宽度小欠拟合，宽度大轻易过拟合PCA和LDA都是典范的降维算法。PCA是无监视的，也便是练习模范不需求标签；LDA是有监视的，也便是练习模范需求标签。PCA是去除去原始数据中冗余的维度，而LDA是找寻一个维度，使得原始数据在该维度上投影后不同类其余数据尽或者离别开来。

PCA是一种正交投影，它的想法是使得原始数据在投影子空间的各个维度的方差最大。假定咱们要将N维的数据投影到M维的空间上（MN），依据PCA，咱们首先求出这N维数据的协方差矩阵，尔后求出其前M个最大的特性值所对应的特性向量，那末这M个特性向量即为所求的投影空间的基。LDA投影后类内方差最小，类间方差最大。以下图所示有两种投影方法，左侧的投影后血色数据和蓝色数据尚有叠加部份，右侧的投影后血色数据和蓝色数据则适值被隔开。LDA的投影即好似右侧的投影方法，投影后使得不同类其余数据尽或者隔开，而好似类其余数据则尽或者紧凑地散布。

PCA和LDA参考链接：PCA和LDA的对照KNNK附近

对于K附近算法的学识有不少，譬喻算法施行的环节、运用范畴以及细致事故，不过信托不少人对K附近算法的运用细致事故不是很明白。在这篇文章中咱们针对这个题目举办回答，带众人来好好懂得一下k附近算法的细致事故以及K附近算法的好处与瑕玷。

K附近算法的细致事故

K附近算法的运用细致事故详细便是运用间隔做为度量时，要保证一切特性在数值上是一个数目级上，免得间隔的揣度被数目级大的特性所主宰。在数据准则化这件事上，还要细致一点，练习数据集和测试数据集肯定要运用统一准则的准则化。个中的出处总的来讲就有两点体例，第一便是准则化原来也许视为算法的一部份，既然数据集都减去了一个数，尔后除以一个数，这两个数对于一切的数据来讲，就要视同一律。第二便是练习数据集原来很少，在猜测新模范的功夫，新模范就更少得不幸，倘使新模范就一个数据，它的均值便是它自身，准则差是0，这根柢就不公道。

K附近算法的好处是甚么呢？

K附近算法的好处详细显示在四方面。第一就便是k附近算法是一种在线技能，新数据也许直接参与数据集而无须举办从头练习，第二便是k附近算法理论简捷，轻易完结。第三便是正确性高，对反常值和噪声有较高的忍耐度。第四便是k附近算法天生就援手多分类，差别与感知机、逻辑回归、SVM。

K附近算法的瑕玷是甚么呢？

K附近算法的瑕玷，根基的k附近算法每猜测一个“点”的分类都市从头举办一次全部运算，对于模范容量大的数据集揣度量较量大。况且K附近算法轻易致使维度倒霉，在高维空间中揣度间隔的功夫，就会变得特别远；模范不均衡时，猜测差错较量大，k值巨细的筛选得依赖阅历或者穿插考证获得。k的筛选也许运用穿插考证，也也许运用网格探寻。k的值越大，模子的差错越大，对噪声数据越不敏锐，当k的值很大的功夫，或者形成模子欠拟合。k的值越小，模子的方差就会越大，当k的值很小的功夫，就会形成模子的过拟合。

二维高斯核函数

倘使让你写一个高斯朦胧的函数，你该何如写呢？

`defgaussian_2d_kernel(kernel_size=3,sigma=0):kernel=np.zeros([kernel_size,kernel_size])center=kernel_size//2ifsigma==0:sigma=((kernel_size-1)*0.5-1)*0.3+0.8s=2*(sigma**2)sum_val=0foriinrange(0,kernel_size):forjinrange(0,kernel_size):x=i-centery=j-centerkernel[i,j]=np.exp(-(x**2+y**2)/s)sum_val+=kernel[i,j]#/(np.pi*s)sum_val=1/sum_valreturnkernel*sum_val`练习采样法子穿插考证留一法自主法(bootstrap)：有放回的抽样法子，或者会抽到反复的模范Kmean和GMM道理、差别、运用处景

kmeans的抑制性？

也许看这边

转载请注明地址:http://www.1xbbk.net/jwbfz/260.html

上一篇文章：互联网大事件百度推出无广告版搜索应用

下一篇文章：办公品牌排行榜

收藏机器学习深度学习面试知识点汇总

最新文章

热点文章

推荐文章