机器学习入门

以下内容无特殊说明,均来自于斯坦福大学2014(吴恩达)机器学习教程

参考笔记:fengdu78, Data-Science-Notes, (2019), GitHub repository, https://github.com/fengdu78/Data-Science-Notes

什么是机器学习

Machine Learning(机器学习)是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识和技能,重新组织已有的知识结构使之不断改善自身的性能。

机器学习的定义

  • Arthur Samuel(1959)机器学习:在进行特定编程的情况下,给予计算机学习能力的领域。
  • Tom Mitchel(1998)计算机程序从经验E中学习,解决某一任务T,达到性能度量值P,在经验E后,经过P评判,程序在处理T时的性能有所提升。

机器学习的分类

按照数据的label形式进行分类:

  • 监督学习

    监督学习使用已知正确答案的数据来训练模型,从而使得输入数据以求预测出正确的结果。这里输入的数据有标签。

  • 半监督学习

    一半数据有标签,一半数据无标签。

  • 无监督学习

    无监督学习常常被用于数据挖掘,用于在大量无标签数据中发现些什么。它的训练数据是无标签的,训练目标是能对观察值进行分类或者区分等。

  • 强化学习

    一个智能体(Agent)采取行动(Action)从而改变自己的状态(State)获得奖励(Reward)与环境(Environment)发生交互的循环过程。

    以上来自:基础篇--机器学习类型分类 - 知乎 (zhihu.com)

名词解释:

回归问题:找出自变量与应变量之间的关系,主要用来预测数据。回归的意思就是推测出一系列连续值的属性。

分类问题:分类指的是,推测出离散的输出值。


机器学习入门
https://excelius.xyz/机器学习入门/
作者
Ther
发布于
2021年5月14日
许可协议