机器学习绪论:数据与模型的探索与应用
读书笔记 from GitHub1是一本关于机器学习的书籍,通过GitHub上的笔记内容,我们可以了解到机器学习的基本概念以及其在现实生活中的应用。绪论中提到了什么是机器学习,即通过数据传达经验,从而让机器能够对未出现过的情况作出正确的预测。机器学习的研究内容主要是从数据中产生模型的算法,也就是学习算法。Mitchell给出了一个更为形式化的定义,即如果程序通过利用经验提高了在任务上的性能,则称该程序对经验进行了学习。因此,要进行机器学习,首先需要有数据集。数据集是一组结构相同的记录的集合,通过编码将文本转化为数值,从而进行机器学习。除此之外,书中还介绍了实际例子,比如西瓜数据集,用于说明机器学习的应用和实际操作。 在实际生活中,很多时候我们也是通过经验来做出一些预测和判断。比如我们知道“朝霞不出门,晚霞行千里”,这是一种通过经验获得的知识,即通过观察朝霞和晚霞的变化,我们可以判断当天的天气情况。这种经验对我们来说已经是一种内化的能力,即使在不同的时间和地点,我们也可以准确地做出预测。同样的道理也适用于机器学习,通过数据传达经验,让机器能够对未出现过的情况作出正确的预测。这种机器学习的能力对于现代科技和生活来说尤为重要。 在机器学习的概念中,有一些基本的术语需要了解。首先是示例(instance),即描述对象的属性值的集合。例如,西瓜数据集中的每个西瓜就是一个示例。其次是样本(sample),即一个示例构成的集合。再来就是属性(attribute)和特征(feature),属性是示例的一个特性,而特征是所有属性的集合。最后是属性值(attribute val),即属性的取值。通过了解这些基本概念,我们可以更好地理解机器学习的过程和原理。 机器学习的实现离不开学习算法。学习算法是机器学习的核心内容,其目的是从数据中产生模型。模型是指所有从数据中学得的结果,可以是全局性的结果,也可以是局部性的结果。学习算法可以帮助机器对数据进行分析和学习,从而更好地预测和判断未来的情况。通过不断地学习和调整,机器可以不断提高性能,从而更好地应用于实际生活中。 总的来说,机器学习是一种通过数据传达经验,让机器能够对未出现过的情况作出正确预测的能力。通过学习算法,机器可以从数据中产生模型,不断提高性能,从而更好地应用于各种实际情况。在现代科技和生活中,机器学习已经发挥着越来越重要的作用,可以预见未来,机器学习的发展将会带来更多的惊喜和改变。
剩余51页未读,继续阅读