# ML-Andrew Ng 学习笔记(1) Supervised Learning & Unsupervised Learning

**Published by:** [jasonyang](https://paragraph.com/@jasonyang/)
**Published on:** 2023-04-26
**URL:** https://paragraph.com/@jasonyang/ml-andrew-ng-1-supervised-learning-unsupervised-learning

## Content

笔者今年只有大一，虽然课程内有讲ml但是觉得不应止于此，想额外学一部分，故见解不到位的也请谅解（虽然是写给自己的==） 以下将会讨论监督学习（supervised learning）和无监督学习（unsupervised learning）的特点及实例，同时附上笔者个人对此的见解。 监督学习：根据数据（“right answer”given）拟合出一条直线或者曲线，进而使模型能给出更多right answer 回归（Regression） 分类（Classification） Regression 例子1：一个学生收集了某市的房屋尺寸大小及其对应价格的一些数据，现在甲有一栋750平方英尺的房子，如何估计一下大概能卖掉多少钱？ a regression problem Regression： Predict continuous valued output 个人理解为变量之间有着非常强的数学关系，输入与输出都是数字 Classification 例子2：某人收集了一部分与乳腺癌肿瘤相关的数据，现在乙有一个肿瘤，如何判断该肿瘤是良性还是恶性？ a classification problem Classification: Predict discrete valued output(0 or 1) 不同于回归，输出结果是0与1代表两类，不是单纯意义上的数字，代表分类、等级 分类结果不一定是只有两种 更加决策性 例子3：该人更进一步收集了相关数据，补充了年龄 another classification problem 对于离散和连续的理解： 房价将精度调整之后可以再次细分，同时两个相邻的房价样本之间，客观上可以存在无数个可能，算作连续数据 但良性与不良性之间，只有这两种可能性，诸如此类，计数型，分类型，等级型的，算作离散数据 （但是有一说一通常情况下收集的数据都应该算作离散型吧） 总结：监督学习适用于预测具体数值、对某样事物进行决策，是一种明确目的的训练方式 无监督学习：将数据直接丢给模型，没有明确标签，让模型自己处理 聚类（Clustering）- K-means聚类 聚类（Clustering）- 层次聚类 降维-主成分分析（PCA） 降维-奇异值分解（SVD） clustering problem 例子4：有很多违法行为都需要"洗钱"，这些洗钱行为跟普通用户的行为是不一样的，到底哪里不一样？ 如果通过人为去分析是一件成本很高很复杂的事情，我们可以通过这些行为的特征对用户进行分类，就更容易找到那些行为异常的用户，然后再深入分析他们的行为到底哪里不一样，是否属于违法洗钱的范畴。 虽然我们不知道这些分类意味着什么，但是通过这种分类，可以快速排出正常的用户，更有针对性的对异常行为进行深入分析。 例子5：鸡尾酒问题-将人声分离 SVD problem 总结：无监督学习适用于处理训练前也不清楚结果的数据，是一种无明确目的的训练方式 无监督学习先写这么多吧，以后再补充吧 第一次写 参考来源： https://zhuanlan.zhihu.com/p/62075440 https://www.coursera.org/learn/machine-learning

## Publication Information

- [jasonyang](https://paragraph.com/@jasonyang/): Publication homepage
- [All Posts](https://paragraph.com/@jasonyang/): More posts from this publication
- [RSS Feed](https://api.paragraph.com/blogs/rss/@jasonyang): Subscribe to updates