连续是一种很普遍的现象,不断流逝的时间,物理上的运动,几何里的曲线都是连续的例子。 如果画一条连续的曲线,就要笔不能抬起,要连续的一笔画出。这是一种定性的说明,有了极限的概念后,我们可以从定量上分析连续。 我们先看一下反应实数连续性的实数基
连续是一种很普遍的现象,不断流逝的时间,物理上的运动,几何里的曲线都是连续的例子。 如果画一条连续的曲线,就要笔不能抬起,要连续的一笔画出。这是一种定性的说明,有了极限的概念后,我们可以从定量上分析连续。 我们先看一下反应实数连续性的实数基
齐次线性方程组 三种形式:方程组、矩阵、向量 下面是m个方程,n个未知数的方程组,右边全部是0. $$\left\{ \begin{array}{c} a_{11}x_1 + a_{12}x_2 + … + a_{1n}x_n
本笔记是我学习Coursera上Andrew Ng的机器学习课程的笔记。除了课上内容外我也会补充一些其他地方的资料。如有错误欢迎大家指正。 什么是机器学习(Machine Learning) 从维基百科里可以看到, Machine lear
二次型起源于几何学中二次曲线方程和二次曲面方程化为标准形问题的研究,它是线性代数的重要内容之一,在一些其他数学分支以及其他学科中也有重要地位。 二次型 二次型的定义 定义:含有n个变量 \(x_1, x_2, …, x_n\)
特征值和特征向量是线性代数的主要内容之一,它们在物理学和统计学中都有很大的用处。另外还有一个小小的用处,求矩阵的m次幂。特征值和特征向量都是针对方阵来说的。 矩阵的相似 定义:设A与B都是n阶方阵,若存在一个可逆矩阵P,使得 $$B = P
前面几周介绍了几种机器学习算法,本周主要讲当你的机器学习算法效果不好时应该如何改进。 评估一个机器学习算法 效果不好时该做什么 当用训练好的模型来评估时,如果我们发现有较大的误差,可以采取下面的措施: 1. 使用更多的训练集 2. 使用更少
逻辑回归(Logistic Regression) 逻辑回归虽然带有“回归”两个字,实际上却是分类问题,此时要预测的值y是离散的。例如判断一封邮件是否是垃圾邮件,判断肿瘤是恶性还是良性。 先从二元逻辑回归问题开始,也就是y的值只有0和1两种
支持向量机(support vector machine,简称SVM),在处理一些复杂的非线性问题时相比逻辑回归和神经网络要更加简洁和强大,在工业界和学术界广泛应用。 最大间隔分类器(Large Margin Classification)
单变量线性回归 假设我们有下面的房子面积和房价的数据 面积 价格 2104 460 1416 232 1534 315 852 178 … … 这些已有的数据我们称之为训练集(Training Set)。我们通常使用
聚类(clustering) 非监督学习(Unsupervised Learning) 聚类算法是本课程学习的第一个非监督学习算法,在第一周就介绍过非监督学习。非监督学习中,数据集中的数据没有任何标签(正确答案),只有x,没有y。数据可能是