初识机器学习

什么是机器学习?

机器学习的定义:

  1. 在没有明确设置的情况下,使计算机具有学习能力——Samuel
  2. 计算机程序从经验E中学习,解决某一任务T,进行某一性能度量P,通过P测定在T上的表现因经验E而提高——Tom Mitchell(experience,task,performance measure)

机器学习算法分类:

  1. 监督学习(Supervised learning)
  2. 无监督学习(Unsupervised learning)
  3. 强化学习(Reinforcement learning)
  4. 推荐系统(Recommender systems)

监督学习

监督学习是指 我们给算法一个数据集,其中包含了正确答案。也就是说我们给它一个房价数据集,在这个数据集中的每个样本,我们都给出正确的价格即这个房子实际卖价,算法的目的就是给出更多的正确答案,例如为你朋友想要卖掉的这所新房子给出估价。

  • 回归问题:结果是线性的(我们设法预测出一个连续值的结果)

  • 分类问题:结果是离散的(我们设法预测出一个离散值的结果)

无监督学习:

相对于监督学习(给定输入,输出,作为参考),无监督学习不知道输入/输出是什么,可以将所给数据分簇,事先并没有给出分簇规则,只能将数据进行聚类(聚类算法)。

聚类和分类的区别:

  • 分类:已知数据的类型,即在没有输入的时候,就知道输出的结果(如:肿瘤良性还是恶性)。
  • 聚类:不知道数据的类型,只给数据一些特征,机器根据特征,将数据分开。
Donate? comment?