深度学习与机器学习面试精华：Tensorflow、距离度量与CNN解析

需积分: 10 85 浏览量更新于2024-07-18 收藏 47KB DOCX 举报

"机器学习相关面试题，包括Tensorflow计算图解释、距离度量对比、CNN卷积核结构以及LR和SVM的关系与差异" 在机器学习面试中，深入理解算法和相关工具至关重要。让我们逐一探讨这些知识点。 1. Tensorflow的计算图：Tensorflow是谷歌开发的开源深度学习库，它的核心概念是计算图。这个计算图是由节点（Nodes）和边（Edges）构成的有向图，其中节点代表操作（Operations），边则代表数据流（Tensors）。每个节点执行一个特定的数学运算，而边则表示数据在节点间流动。在定义计算图时，我们构建了一个静态的描述，而在运行时，Tensorflow会根据这个描述执行实际的计算。这种分离定义和执行的方式允许Tensorflow进行高效的并行计算和优化。 2. 距离度量的比较：在机器学习中，距离度量用于衡量样本之间的相似度。欧氏距离是最直观的距离计算方式，适用于各个属性具有相同权重的情况。而曼哈顿距离（L1距离）忽略了维度之间的相对大小，更适合于各维度独立且同等重要的场景。两者在应用时需根据数据特性选择，例如在处理离群值或者各特征尺度不一时，曼哈顿距离可能更为合适。 3. CNN的卷积核：卷积神经网络（CNN）中的卷积核通常是3维结构，包括宽度、高度和深度三个维度。宽度和高度决定了滤波器覆盖输入图像的区域，而深度对应于输入特征图的通道数。卷积操作不仅是对每个像素的二维操作，还包括了跨通道的卷积，使得网络能捕获不同特征。1x1卷积虽然在面积上为1，但仍有深度，它常用于通道降维或特征融合。 4. LR与SVM的联系与区别：逻辑回归（LR）和支持向量机（SVM）都是常见的分类算法。它们都能处理线性可分的二分类问题，并可通过添加正则化项控制模型复杂度。然而，SVM的核心思想是找到最大间隔的决策边界，即寻找最优超平面，这使得SVM在处理非线性问题时通过核函数有出色表现。相比之下，LR的目标是最大化对数似然，通过概率模型预测类别。SVM通常在小样本或高维数据集上表现更好，而LR则在大规模数据集和速度上具有一定优势。这些面试题涵盖的主题广泛，反映了机器学习工程师需要具备的扎实理论基础和实践经验。理解和掌握这些知识点不仅能帮助应对面试，也能在实际项目中提升问题解决能力。

23.hash 冲突及解决办法。数据结构/算法中等

关键字值不同的元素可能会映象到哈希表的同一地址上就会发生哈希冲突。解决办法：

）开放定址法：当冲突发生时，使用某种探查亦称探测技术在散列表中形成一个探查测序列。沿此序列逐

个单元地查找，直到找到给定的关键字，或者碰到一个开放的地址 即该地址单元为空为止（若要插入，在探查

到开放的地址，则可将待插入的新结点存人该地址单元）。查找时探查到开放的地址则表明表中无待查的关键字

即查找失败。

）再哈希法：同时构造多个不同的哈希函数。

）链地址法：将所有哈希地址为 # 的元素构成一个称为同义词链的单链表，并将单链表的头指针存在哈希表

的第 # 个单元中，因而查找、插入和删除主要在同义词链中进行。链地址法适用于经常进行插入和删除的情况。

7）建立公共溢出区：将哈希表分为基本表和溢出表两部分，凡是和基本表发生冲突的元素，一律填入溢出表。

25.什么是熵。机器学习 ML 基础易

>7? 年，香农 5!@%" 引入信息（熵），将其定义为离散随机事件的出现概率。一个系统越是有序，信

息熵就越低；反之，一个系统越是混乱，信息熵就越高。所以说，信息熵可以被认为是系统有序化程度的一个度

量。

熵：如果一个随机变量 . 的可能取值为 .-ABCD，其概率分布为 /.-#-#（#-），则随机变量 .

的熵定义为：

26.什么是最大熵。机器学习 ML 基础易

熵是随机变量不确定性的度量，不确定性越大，熵值越大；若随机变量退化成定值，熵为 ;。如果没有外界干扰，

随机变量总是趋向于无序，在经过足够时间的稳定演化，它应该能够达到的最大程度的熵。

为了准确的估计随机变量的状态，我们一般习惯性最大化熵，认为在所有可能的概率模型（分布）的集合中，

熵最大的模型是最好的模型。换言之，在已知部分知识的前提下，关于未知分布最合理的推断就是符合已知知识

最不确定或最随机的推断，其原则是承认已知事物（知识），且对未知事物不做任何假设，没有任何偏见。

例如，投掷一个骰子，如果问E每个面朝上的概率分别是多少E，你会说是等概率，即各点出现的概率均为

49。因为对这个E一无所知E的色子，什么都不确定，而假定它每一个朝上概率均等则是最合理的做法。从投资的

角度来看，这是风险最小的做法，而从信息论的角度讲，就是保留了最大的不确定性，也就是说让熵达到最大。

31.什么是分布式数据库？计算机基础数据库易

分布式数据库系统是在集中式数据库系统成熟技术的基础上发展起来的，但不是简单地把集中式数据库分散

地实现，它具有自己的性质和特征。集中式数据库系统的许多概念和技术，如数据独立性、数据共享和减少冗余

度、并发控制、完整性、安全性和恢复等在分布式数据库系统中都有了不同的、更加丰富的内容。

具体来说，集群文件系统是指运行在多台计算机之上，之间通过某种方式相互通信从而将集群内所有存储空

间资源整合、虚拟化并对外提供文件访问服务的文件系统。其与 6%、@. 等本地文件系统的目的不同，前者是

为了扩展性，后者运行在单机环境，纯粹管理块和文件之间的映射以及文件属性

Q1: 什么是偏倚（bias）、方差（variable）均衡？

偏倚指的是模型预测值与真实值的差异，是由使用的学习算法的某些错误或过于简单的假设造成的误差。它

会导致模型欠拟合，很难有高的预测准确率。

方差指的是不同训练数据训练的模型的预测值之间的差异，它是由于使用的算法模型过于复杂，导致对训练

数据的变化十分敏感，这样会导致模型过拟合，使得模型带入了过多的噪音。

任何算法的学习误差都可以分解成偏倚、方差和噪音导致的固定误差。模型越复杂，会降低偏倚增加方差。

为了降低整体的误差，我们需要对偏倚方差均衡，使得模型中不会由高偏倚或高方差。

Q2：监督学习和非监督学习有什么不同？

监督学习需要具有标签（+）的训练数据，比如做分类，你需要先对训练数据做标记，然后才能训练模型

将数据分成你说需要的标记类。

而非监督学习则不需要。

Q3: KNN 和 k-means 聚类由什么不同？

C#'"+是一种监督学习算法，而 C是非监督的。这两种算法看起来很相似，都需要计算样

本之间的距离。C 算法需要事先已有标注好的数据，当你需要对未标注的数据进行分类时，统计它附近最近的 C

个样本，将其划分为样本数最多的类别中。C 聚类只需要一些未分类的数据点和阀值，算法会逐渐将样本点

进行分成族类。

Q9：你最喜欢的算法是什么？把它解释一下。

剩余16页未读，继续阅读

yan_feifei_1993

粉丝: 156
资源: 12

深度学习与机器学习面试精华：Tensorflow、距离度量与CNN解析

机器学习面试题.pdf

机器学习面试题总结.pdf

BAT机器学习面试1000题系列

机器学习面试题pdf

bat机器学习面试1000题系列

bat机器学习面试1000题系列 下载

保研 机器学习 面试题

bat机器学习面试1000题系列 csdn

机器学习python工程师面试题

bat机器学习面试1000题320

最新资源

bat机器学习面试1000题系列下载

保研机器学习面试题