机器学习 - 监督学习概述

前言

监督学习的目的是通过已经标记好的训练集(Training Set),构建模型,然后用训练得到的模型对未来数据进行预测。术语监督(Supervised),则是指每个训练数据中的每个样本都有已经人工做了标记。

应用场景

1. 对数据进行分类

分类是监督学习中的一个经典应用,通俗来讲就是根据样本的特征(离散、无序)进行类别区分。

以垃圾邮件为例:通过人工标记垃圾邮件和正常邮件,使用监督学习算法训练生成一个判定模型,用来判定一封新的邮件是否为垃圾邮件。

2. 回归预测连续输出值

在监督学习中另一个常用的场景就是对连续型输出变量进行预测,也就是回归分析。

例如将学生的学习时间和考试分数进行分析,我们认为学生的学习时间和考试分数是有关联的,那么就可以将它作为训练数据来训练模型,然后根据学习时间来预测考试分数。

监督学习常用算法

1. KNN近邻

监督学习

所谓K近邻算法,即是给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例(也就是上面所说的K个邻居), 这K个实例的多数属于某个类,就把该输入实例分类到这个类中。


2. 决策树

监督学习

决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。


3. 朴素贝叶斯

贝叶斯方法是以贝叶斯原理为基础,使用概率统计的知识对样本数据集进行分类。由于其有着坚实的数学基础,贝叶斯分类算法的误判率是很低的。贝叶斯方法的特点是结合先验概率和后验概率,即避免了只使用先验概率的主管偏见,也避免了单独使用样本信息的过拟合现象。贝叶斯分类算法在数据集较大的情况下表现出较高的准确率,同时算法本身也比较简单。


4. 逻辑回归

监督学习

logistic回归又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。


5. SVM支持向量机

监督学习

支持向量机(Support Vector Machine, SVM)是一类按监督学习(supervised learning)方式对数据进行二元分类的广义线性分类器(generalized linear classifier),其决策边界是对学习样本求解的最大边距超平面。


相关主题:
相关推荐
  1. 脱单!武汉的相亲角在哪你知道吗?
  2. 甲壳虫带来的魔法
  3. 静海县第六小学
  4. 杭州市北秀小学
  5. 淄博市张店区科苑小学
  6. 祖传秘方
  7. 北京市房山区班各庄幼儿园 - 北京幼儿园黄页
  8. 驴子的围墙
  9. 河北省邯郸市素育双语幼儿园 - 邯郸幼儿园黄页
  10. 武汉一女子七天被骗220万
  11. 未来星幼儿园 - 哈尔滨幼儿园黄页
  12. 南昌市施尧小学
  13. 面试宝典
  14. 狐狸爸爸的韭菜面衣
  15. 警方通报:武汉男子持刀至五死一伤,嫌犯已跳桥
  16. 萧何月下追韩信
  17. 武汉动物园火烈鸟孔雀排队打疫苗
  18. 广饶县丁庄镇第六小学
  19. Python源码剖析 - 对象初探
  20. 技术破解钉钉打卡考勤 - 苹果手机专用完整解决方案
  21. 珠海市香洲区第七小学
  22. 吉林省吉林市雨禾科学教育幼儿园 - 吉林市幼儿园黄页
  23. 西安市庆安实验小学
  24. Python公开课 - 全文检索模块Whoosh详解(3)
  25. 武汉女子网上做兼职被骗六十五万
  26. 河北省邯郸市丛台区东风实验幼儿园 - 邯郸幼儿园黄页
  27. 奥迪客户不满加价,被武汉4S店销售群殴
  28. 武汉00后大二学妹拍视频月入七十万
  29. Putty登录安装在VirtualBox里的Linux服务器
  30. 武汉推出越王勾践剑交通卡
  31. 生活不易,酒在远方
  32. 上海市民办盛大花园小学
  33. 杭州师范大学东城小学
  34. 小叶的兔子和兔子的阳光
  35. 什么是TCP中三次握手和四次挥手
  36. 长春市南关区茗淇国际幼稚园 - 长春幼儿园黄页
  37. 河北省邯郸市七色光幼儿园(馆陶县财政局西南) - 邯郸幼儿园黄页
  38. 易中天给英雄武汉的一首诗 - 武汉新鲜事
  39. 逃跑的怪兽
  40. 猫和靴子
  41. 会画画的狼
  42. 央媒聚焦!国庆假期173.78万人次打卡大美黄陂
  43. 天津市塘沽区慧聪双语幼儿园 - 天津幼儿园黄页
  44. 宝宝酒精过敏了怎么办 - 育儿经验
  45. 上海市浦东新区亮晶晶托儿所 - 上海幼儿园黄页
  46. 【读书】QBQ! 问题背后的问题 - 附下载地址
  47. 提高Tesseract文字识别率的三种方法
  48. 车企数字化转型(上)
  49. 一棵奇异的苹果树
  50. 南宁市五塘镇民政小学