Command Palette
Search for a command to run...
百科
机器学习术语表:探索关键AI和ML概念的定义与解释
Search for a command to run...
机器学习术语表:探索关键AI和ML概念的定义与解释
梯度消失问题是一种在使用梯度下降法和反向传播训练人工神经网络时遇到的难题。
T – 分布随机近邻嵌入(t – SNE)是一种用于降维的机器学习方法
树库(Treebank)是对句子进行分词、词性标注和句法结构关系标注的深加工语料库。
图灵机又称确定型图灵机,是艾伦·图灵于 1936 年提出的一种抽象计算模型,其更抽象的意义为一种数学逻辑机,可以看作等价于任何有限逻辑数学过程的终极强大逻辑机器。
特化是从一般到特殊的一个过程
同义词集是指具有相同意义的字条组成的集合。
时间步长定义物理模拟之间的时间间隔有多小。在游戏引擎中,这反映了函数需要运行的频率。
调参指为了得到更优的效果去调整参数的行为。
数值属性是定量描述数据的一种属性类型,是指数据是可度量的量。
通用人工智智能是指具备与人类同等能力、或超越人类能力的智能体。又称强人工智能,能表现正常人类所具有的所有智能行为。为了与传统人工智能或主流人工智能的 AI 用词相区分,因此增加通用的前缀表述。
属性空间:属性张成的空间,又称为「样本空间(sample space)」或「输入空间」。 特征空间:所选择的排除线性相关和对模型构建没有益处后的属性,所构成的属性空间,就叫特征空间。 相关概念 数据集(data set)[…]
朴素贝叶斯分类器采用了「属性条件独立性假设」:对已知类别,假设所有属性相互独立。 改进朴素贝叶斯: 为避免其他属性携带的信息被训练集中从未出现的属性值「抹去」,在估计概率值时通常要进行「平滑」,常用「拉普拉斯修正」; 对 […]
生成对抗网络是一种非监督学习方法,其通过让两个神经网络相互博弈的方式实现,这种方法由伊恩·古德费洛于 2014 年提出。 生成对抗网络包括生成网络和判别网络,生成网络以潜在空间中随机采样作为输入,输出结果需要尽可能模仿训 […]
机器学习中,生成模型可被用于直接对数据建模,也可被用于建立变量间的条件概率分布,条件概率分布可基于贝叶斯定理的生成模型。 生成模型适用于无监督任务,如分类、聚类,其中典型的生成模型包括以下几类: 高斯混合模型 和其他混合 […]
图论是组合数学的分支,主要研究对象是图,这里的图是指由若干给定顶点、连接两顶点边构成的图形,常被用于描述事物间的特种关系,其中顶点代表事物,边则表示它们之间的联系。 图论起源于柯尼斯堡七桥问题,欧拉在 1736 年解决了 […]
梯度爆炸问题通常出现在深层网络、权值初始化值过大的情况下,其一般随着网络层数的增加而明显。 通过对激活函数求导,若结果大于 1,那么层数增加时,最终求出的梯度更新将以指数形式增加,即发生梯度爆炸;若结果小于 1,那么层数 […]
特征分解是一种表示矩阵之积的方法,其通过将矩阵分解为特征值、特征向量表示,不过只有可对角化矩阵才可被特征分解。 矩阵乘法对应了一个变换,即将任意向量转变为另一个方向、长度的新向量,在这个过程中,原向量会发生旋转、伸缩的变 […]
算法是一个表示为有限长列表的有效方法,在数学和计算机科学中,算法可以被视为任何良定义的具体计算步骤的一个序列。
调和平均是一种平均数计算方法,其分为简单和加权两种形式,其中加权调和平均数是加权算术平均数的变形。由于大多数情况下,只知道每组某个标志的数值总和 m,而缺少总体单位数 f 的信息,因此不可直接采用加权算术平均数法计算,而 […]
试错法是通过不断尝试来解决问题的一种方法。
松弛变量是应用软间隔方法分类时加入的辅助量。它的引入是为了解决离群点对分类的影响。
随机梯度下降(SGD)是梯度下降算法的一种迭代求解思路。
替代函数是目标函数无法使用或效果不佳时使用的函数。
损失函数是用于衡量、预测模型好坏的度量,其反映了模型预测值与真实值之间的差距,它是经验风险函数的核心部分,也是结构风险函数的组成部分。 常见损失函数 Log 对数损失函数 平方损失函数 指数损失函数 Hinge 损失函数
梯度消失问题是一种在使用梯度下降法和反向传播训练人工神经网络时遇到的难题。
T – 分布随机近邻嵌入(t – SNE)是一种用于降维的机器学习方法
树库(Treebank)是对句子进行分词、词性标注和句法结构关系标注的深加工语料库。
图灵机又称确定型图灵机,是艾伦·图灵于 1936 年提出的一种抽象计算模型,其更抽象的意义为一种数学逻辑机,可以看作等价于任何有限逻辑数学过程的终极强大逻辑机器。
特化是从一般到特殊的一个过程
同义词集是指具有相同意义的字条组成的集合。
时间步长定义物理模拟之间的时间间隔有多小。在游戏引擎中,这反映了函数需要运行的频率。
调参指为了得到更优的效果去调整参数的行为。
数值属性是定量描述数据的一种属性类型,是指数据是可度量的量。
通用人工智智能是指具备与人类同等能力、或超越人类能力的智能体。又称强人工智能,能表现正常人类所具有的所有智能行为。为了与传统人工智能或主流人工智能的 AI 用词相区分,因此增加通用的前缀表述。
属性空间:属性张成的空间,又称为「样本空间(sample space)」或「输入空间」。 特征空间:所选择的排除线性相关和对模型构建没有益处后的属性,所构成的属性空间,就叫特征空间。 相关概念 数据集(data set)[…]
朴素贝叶斯分类器采用了「属性条件独立性假设」:对已知类别,假设所有属性相互独立。 改进朴素贝叶斯: 为避免其他属性携带的信息被训练集中从未出现的属性值「抹去」,在估计概率值时通常要进行「平滑」,常用「拉普拉斯修正」; 对 […]
生成对抗网络是一种非监督学习方法,其通过让两个神经网络相互博弈的方式实现,这种方法由伊恩·古德费洛于 2014 年提出。 生成对抗网络包括生成网络和判别网络,生成网络以潜在空间中随机采样作为输入,输出结果需要尽可能模仿训 […]
机器学习中,生成模型可被用于直接对数据建模,也可被用于建立变量间的条件概率分布,条件概率分布可基于贝叶斯定理的生成模型。 生成模型适用于无监督任务,如分类、聚类,其中典型的生成模型包括以下几类: 高斯混合模型 和其他混合 […]
图论是组合数学的分支,主要研究对象是图,这里的图是指由若干给定顶点、连接两顶点边构成的图形,常被用于描述事物间的特种关系,其中顶点代表事物,边则表示它们之间的联系。 图论起源于柯尼斯堡七桥问题,欧拉在 1736 年解决了 […]
梯度爆炸问题通常出现在深层网络、权值初始化值过大的情况下,其一般随着网络层数的增加而明显。 通过对激活函数求导,若结果大于 1,那么层数增加时,最终求出的梯度更新将以指数形式增加,即发生梯度爆炸;若结果小于 1,那么层数 […]
特征分解是一种表示矩阵之积的方法,其通过将矩阵分解为特征值、特征向量表示,不过只有可对角化矩阵才可被特征分解。 矩阵乘法对应了一个变换,即将任意向量转变为另一个方向、长度的新向量,在这个过程中,原向量会发生旋转、伸缩的变 […]
算法是一个表示为有限长列表的有效方法,在数学和计算机科学中,算法可以被视为任何良定义的具体计算步骤的一个序列。
调和平均是一种平均数计算方法,其分为简单和加权两种形式,其中加权调和平均数是加权算术平均数的变形。由于大多数情况下,只知道每组某个标志的数值总和 m,而缺少总体单位数 f 的信息,因此不可直接采用加权算术平均数法计算,而 […]
试错法是通过不断尝试来解决问题的一种方法。
松弛变量是应用软间隔方法分类时加入的辅助量。它的引入是为了解决离群点对分类的影响。
随机梯度下降(SGD)是梯度下降算法的一种迭代求解思路。
替代函数是目标函数无法使用或效果不佳时使用的函数。
损失函数是用于衡量、预测模型好坏的度量,其反映了模型预测值与真实值之间的差距,它是经验风险函数的核心部分,也是结构风险函数的组成部分。 常见损失函数 Log 对数损失函数 平方损失函数 指数损失函数 Hinge 损失函数