AI方法(机器学习)总结
作者:微信文章机器学习:人工智能(AI)中最具有代表性的分支。
机器学习:研究如何通过计算手段(算法和算力),利用经验(数据)来产生有效的预测模型。模型泛指从数据中学得的结果。
发展简史:
1950初:机器逻辑推理。
1950中后:神经网络-连接主义
1960-1970:逻辑表示-符号主义
1990-:统计学习(支持向量)
2000-:深度学习(连接主义)
基本概念:
数据集:每一条记录为一个样本(sample)或示例(instance)。
样本的性质为属性(attribute)或特征(feature),可以形成向量。
数据集组成空间一般可以用矩阵表示。
学习(训练):从数据中学得模型的过程。
训练集:训练样本的数据集。
测试集:用来对模型进行验证的数据集。
学习类型:分类(离散值),回归(连续值),聚类
根据训练数据是否有标记分:监督学习(分类,回归),无监督学习(聚类)
主要方法:
线性判别分析(LDA):线性学习方法,最早由Fisher于1936年提出。
决策树:基于树的结构进行推理。
支持向量机:基于训练集在样本空间找到一个划分超平面,将不同类别分开。
机器学习最经典的参考书:
周志华,机器学习,清华大学出版社,2016年第1版
页:
[1]