雅乐网

计算机技术博客

算法 » 机器学习

机器学习实战3——用python画决策树

机器学习实战3——用python画决策树

《机器学习实战》第三章中使用python画决策树 plotNode plotNode的功能是画结点和线,箭头是从 parentPt 指向 centerPt 的 plotMidText 该函数用于在线的中间写入数字 plotTree 和 cr

机器学习实战2——决策树

机器学习实战2——决策树

信息 信息论奠基人香农(Shannon)认为“信息是用来消除随机不确定性的东西”,信息量用来量化消除的不确定的多少。事件发生的概率越低,那么该事件发生的信息量就越高 一个发生的事件x的信息量为 h(x) = – log_2{(P

机器学习实战1——kNN算法

机器学习实战1——kNN算法

kNN 是 k-NearestNeighbor 的缩写,中文叫做k-临近算法。它的思想是通过一个点最邻接的k个点的分类来预测这个点的分类。 如下图所示,k=3时,预测问号是属于○还是△ 。在距离要预测样本最近的三个点中,有2个是三角,1个时

Andrew Ng机器学习课程笔记11——图像文字识别

Andrew Ng机器学习课程笔记11——图像文字识别

图像文字识别的任务是从一张给定的图片中识别文字。不同于文档的文字识别,图像文字识别首先要发现图像中哪个地方有文字。然后在进行文字识别。 完成这个任务的流水线如下: 1. 文字侦测(Text Detection)—— 确定图片中的文字在哪里

Andrew Ng机器学习课程笔记10——大规模机器学习

Andrew Ng机器学习课程笔记10——大规模机器学习

当训练集的规模很大时,可以帮助我们训练出更好的结果。但是,训练集规模的增大也带来了计算的代价非常大。 可以通过绘制学习曲线来判断大规模的训练集是否有必要。 梯度下降法的两个变种 假设我们的训练集中有100万个记录,在一般的梯度下降中,每次迭

Andrew Ng机器学习课程笔记目录

Andrew Ng机器学习课程笔记目录

这一系列笔记是我在学习Coursera上Andrew Ng的机器学习课程时写的,该课程链接如下: https://www.coursera.org/learn/machine-learning 我主要参考课程中的视频和板书资源,另外还参考了

Andrew Ng机器学习课程笔记8——聚类和降维

Andrew Ng机器学习课程笔记8——聚类和降维

聚类(clustering) 非监督学习(Unsupervised Learning) 聚类算法是本课程学习的第一个非监督学习算法,在第一周就介绍过非监督学习。非监督学习中,数据集中的数据没有任何标签(正确答案),只有x,没有y。数据可能是

Andrew Ng机器学习课程笔记7——支持向量机(SVM)

Andrew Ng机器学习课程笔记7——支持向量机(SVM)

支持向量机(support vector machine,简称SVM),在处理一些复杂的非线性问题时相比逻辑回归和神经网络要更加简洁和强大,在工业界和学术界广泛应用。 最大间隔分类器(Large Margin Classification)

Andrew Ng机器学习课程笔记6——机器学习应用建议和系统设计

Andrew Ng机器学习课程笔记6——机器学习应用建议和系统设计

前面几周介绍了几种机器学习算法,本周主要讲当你的机器学习算法效果不好时应该如何改进。 评估一个机器学习算法 效果不好时该做什么 当用训练好的模型来评估时,如果我们发现有较大的误差,可以采取下面的措施: 1. 使用更多的训练集 2. 使用更少

Andrew Ng机器学习课程笔记5——神经网络:学习

Andrew Ng机器学习课程笔记5——神经网络:学习

这一周主要介绍如何训练得到神经网络中的参数。上一周中说了神经网络的模型 上面的神经网络共4层,用L = 4表示。上图输入3个特征。输出4个分类,用K= 4表示。用\(S_i\)表示第i层的结点个数,上图中有\(S_1 = 3, S_2 =

Andrew Ng机器学习课程笔记4——神经网络:表达

Andrew Ng机器学习课程笔记4——神经网络:表达

神经网络是受人脑的启发而出现的模型,目前得到了广泛应用,例如语音识别和手写体识别。 一、引入 1. 非线性假设 假设有两个特征,使用最多二次项来预测,则有 $$h(x) = g( \theta_0 + \theta_1 x_1 + \the

Andrew Ng机器学习编程作业代码分析1——Linear Regression

Andrew Ng机器学习编程作业代码分析1——Linear Regression

Coursera上Andrew Ng的机器学习课程有8次编程作业。本帖记录我练习过程中学到的知识,希望对大家有帮助。 第一次编程作业之前,我先介绍一些matlab的基础知识。 Matlab基础 Matlab的工作目录 使用matlab中图形

Andrew Ng机器学习课程笔记3——逻辑回归和正则化

Andrew Ng机器学习课程笔记3——逻辑回归和正则化

逻辑回归(Logistic Regression) 逻辑回归虽然带有“回归”两个字,实际上却是分类问题,此时要预测的值y是离散的。例如判断一封邮件是否是垃圾邮件,判断肿瘤是恶性还是良性。 先从二元逻辑回归问题开始,也就是y的值只有0和1两种