-
Notifications
You must be signed in to change notification settings - Fork 59
Open
Labels
Description
前言
最近开始入手学习AI技术,计划从《机器学习》开始,在我的理解里,机器学习的内容,本质上就是在学习一系列算法。
参考书籍:
- 《机器学习实战》. Peter Harrington
学习大纲
谈到机器学习,对很多的算法,每个算法都特定的解决某些问,因此计划对各个主流算法进行一番学习;
如果要分类的话,这里暂时这样划分,大概为接下来的学习做一些铺垫:
一、分类算法:分类
分类方法是一种对离散型随机变量建模或预测的监督学习算法。使用案例包括邮件过滤、金融欺诈和预测雇员异动等输出为类别的任务。
- k-临近算法(kNN)
- 决策树:CART、随机森林、梯度提升树
- 朴素叶贝斯算法(NB)—概率论
- Logistics回归
- 支持向量机(SVM)
- AdaBoost算法
- 分类树
- 深度学习
二、回归算法:预测
回归方法是一种对数值型连续随机变量进行预测和建模的监督学习算法。使用案例一般包括房价预测、股票走势或测试成绩等连续变化的案例。
- 线性回归算法(LASSO、Ridge 和 Elastic-Net)
- 回归树(决策树的一种):RF、GBM
- 深度学习:卷积、drop-out
- 最近邻算法
三、聚类算法:聚类、自然集群
聚类是一种无监督学习任务,该算法基于数据的内部结构寻找观察样本的自然族群(即集群)。使用案例包括细分客户、新闻聚类、文章推荐等。
- K均值聚类算法
- Apriori算法
- Affinity Propagation 聚类
- FP-growth算法
- 层次聚类(Hierarchical / Agglomerative)
- DBSCAN