机器学习西瓜书笔记

软件发布|下载排行|最新软件

当前位置:首页IT学院IT技术

机器学习西瓜书笔记

帅鹏鹏   2021-01-31 我要评论

机器学习基本术语

数据集(data set):记录的集合

示例(instance)或样本(sample):每条记录是关于一个时间或对象的描述

属性(attribute)或特征(feature):反映事件或对象在某方面的表现或性质的事项

属性值(attribute value):属性上的取值

属性空间(attribute space)或样本空间(sample space)或输入空间:属性张成的空间

特征向量(feature vector)

维数(dimensionality)

训练(training)

训练样本(training sample)

训练集(training set)

假设(hypothesis)

真实(ground-truth)

学习器(learn)

预测(prediction)

标记(label)

标记空间(label space)

分类(classification)

多分类(multi-class classification)

正类(positive class)

反类(negative class)

测试(testing)

测试样本(testing sample)

分布(distribution)

独立同分布(independent and identically distributed)

监督学习(supervised learning)

无监督学习(unsupervised learning)

聚类(clustering)

簇(cluster)

回归(regression)

泛化(generalization)

归纳(induction)

演绎(deduction)

假设空间

由形如属性值的不同的可能取值所组成的假设组成

可以由许多不同的策略对假设空间进行搜索,自顶向下或者自顶向上,前者从一般到特殊,即特化,后者从特殊到一般,即泛化,搜索过程中可以删除与正例不一样的假设、和(或)、反例一致的假设,最终将会获得与训练集一致(即可以对所有训练样本进行正确判断)的假设,即为我们学习的结果

归纳偏好

机器学习算法在学习过程中对某种类型假设的偏好,称为“归纳偏好”,或简称为“偏好”

 

Copyright 2022 版权所有 软件发布 访问手机版

声明:所有软件和文章来自软件开发商或者作者 如有异议 请与本站联系 联系我们