神经网络是受人脑的启发而出现的模型,目前得到了广泛应用,例如语音识别和手写体识别。 一、引入 1. 非线性假设 假设有两个特征,使用最多二次项来预测,则有 $$h(x) = g( \theta_0 + \theta_1 x_1 + \the
神经网络是受人脑的启发而出现的模型,目前得到了广泛应用,例如语音识别和手写体识别。 一、引入 1. 非线性假设 假设有两个特征,使用最多二次项来预测,则有 $$h(x) = g( \theta_0 + \theta_1 x_1 + \the
前面几周介绍了几种机器学习算法,本周主要讲当你的机器学习算法效果不好时应该如何改进。 评估一个机器学习算法 效果不好时该做什么 当用训练好的模型来评估时,如果我们发现有较大的误差,可以采取下面的措施: 1. 使用更多的训练集 2. 使用更少
逻辑回归(Logistic Regression) 逻辑回归虽然带有“回归”两个字,实际上却是分类问题,此时要预测的值y是离散的。例如判断一封邮件是否是垃圾邮件,判断肿瘤是恶性还是良性。 先从二元逻辑回归问题开始,也就是y的值只有0和1两种
Coursera上Andrew Ng的机器学习课程有8次编程作业。本帖记录我练习过程中学到的知识,希望对大家有帮助。 第一次编程作业之前,我先介绍一些matlab的基础知识。 Matlab基础 Matlab的工作目录 使用matlab中图形
当训练集的规模很大时,可以帮助我们训练出更好的结果。但是,训练集规模的增大也带来了计算的代价非常大。 可以通过绘制学习曲线来判断大规模的训练集是否有必要。 梯度下降法的两个变种 假设我们的训练集中有100万个记录,在一般的梯度下降中,每次迭
图像文字识别的任务是从一张给定的图片中识别文字。不同于文档的文字识别,图像文字识别首先要发现图像中哪个地方有文字。然后在进行文字识别。 完成这个任务的流水线如下: 1. 文字侦测(Text Detection)—— 确定图片中的文字在哪里
异常检测(Anomaly Detection) 异常检测是一种非监督学习算法,用来发现不属于已知的一组数据的异常数据点。 给定数据集 \( x_{(1)}, x_{(2)}, …, x_{(m)}\) ,假设这些已有数据是正常(
测试文件 graph.txt,内容为:
Modularity,中文称为模块度,是 Community Detection(社区发现/社团检测) 中用来衡量社区划分质量的一种方法。要理解Modularity,我们先来看社团和社团检测的概念。 社团检测 社团检测,就是要在一个图(包含
Modularity的定义和公式推导可以参考Modularity的计算方法——社团检测中模块度计算公式详解 | 雅乐网 使用公式 $$Q = \sum_i{(\frac{e_i}{m} – (\frac{k_{C_i}}{2m}