斯坦福大学吴恩达教授Machine Learning课程笔记

【斯坦福大学吴恩达教授Machine Learning课程笔记】01什么是机器学习?
(机器学习)是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能 。它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎 。在过去的十年中,机器学习帮助我们自动驾驶汽车,有效的语音识别,有效的网络搜索,并极大地提高了人类基因组的认识 。机器学习是当今非常普遍,你可能会使用这一天几十倍而不自知 。
02.监督学习
假设你想通过查看病历来推测乳腺癌是良性还是恶性,下图中,横轴表示肿瘤的大小,纵轴上,记1和0表分别示是或者不是恶性肿瘤 。之前见过的肿瘤,如果是恶性则记为1,不是恶性,或者说良性记为0 。

斯坦福大学吴恩达教授Machine Learning课程笔记

文章插图
根据机器学习估算出某个已知大小的肿瘤是恶性的或是良性的概率 。这是一个分类问题 。分类指的是:我们试着推测出离散的输出值,事实上在分类问题中输出可能不止两个值 。如下图中列举了五个特征值 。
你有一大批同样的货物,想象一下,你有上千件一模一样的货物等待出售,这时你想预测接下来的三个月能卖多少件?你有许多客户,这时你想写一个软件来检验每一个用户的账户 。对于每一个账户,你要判断它们是否曾经被盗过?
第一个问题是回归问题
第二个问题是分类问题 03 无监督学习
对于监督学习的每条数据,我们是知道训练集对应的正确答案,是良性或恶性了 。不同于监督学习的数据的是,无监督学习中没有任何的标签或者是有相同的标签或者就是没标签 。
针对数据集,无监督学习就能判断出数据有两个不同的聚集簇 。无监督学习算法可能会把这些数据分成两个不同的簇 。所以叫做聚类算法 。