Command Palette
Search for a command to run...
百科
机器学习术语表:探索关键AI和ML概念的定义与解释
Search for a command to run...
机器学习术语表:探索关键AI和ML概念的定义与解释
训练误差是在在数据训练中出现的误差。是模型关于训练数据的平均损失。
最大期望是在概率模型中寻找参数最大似然估计、最大后验估计的算法,其中概率模型基于无法观测因变量。 最大期望算法通常用于机器学习、计算机视觉的数据聚类领域,其经过两个步骤的交替计算: 计算期望 E:利用对隐藏变量的现有估计 […]
过拟合是机器学习中的一种现象。指把样本中一些并不需要拿来作为分类的属性学习了的情况,此时学习的决策树模型并不是最优的模型,而且会会导致泛化性能下降。
期望损失是对全体样本的预测能力,是全局概念的一种;经验风险是局部概念,仅表示决策函数对训练数据集中样本的预测能力。 经验风险和期望风险 经验风险是局部的,基于训练集所有样本点损失函数最小化,经验风险局部最优,现实可求; […]
朴素贝叶斯分类器 ( NBC ),是依据朴素贝叶斯进行分类的一种条件概率分类器。
朴素贝叶斯 是指仅依据每个类别出现的概率进行预测分类,是基于概率理论的一种分类算法。该算法依据于贝叶斯公式。
配对 t 检验是常用的一种 t 检验。它是指对同一个总体,在不同的条件下获取两组样本进行分析,以评价不同条件是否有显著影响。不同条件可以指不同存放环境、不同的测量系统等。
欠拟合 是指在模型对训练数据拟合度差的情形。通常用在模型学习和泛化能力的评估上。
定义 分类器是在已有数据基础上构造出一个分类模型,该模型能够把数据库中的数据记录映射到给定类别中的某一个,从而应用于数据预测。 分类器的构造和实施 分类器的构造和实施大体会经过以下几个步骤: 选定样本(包含正样本和负样本 […]
权重是一个相对的概念,是针对某一指标而言。某一指标的权重是指该指标在整体评价中的相对重要程度。
欠采样 是抛弃一些样本来缓解类不平衡的方法。即对训练集里面样本数量较多的类别(多数类)进行适当的少采样。
软间隔是用来处理线性不可分问题及减少噪点影响的一种方法。软间隔是允许分类时存在一些错误点的做法。
径向基函数(RBF)是沿径向对称的标量函数。通常定义为空间中任一点 X 到某一中心 Xc 之间距离的单调函数。可记作 K ( || X – X c || ), 其作用往往是局部的 , 即当 X 远离 Xc 时函数取值很小。
量子计算是基于量子效应的新型计算方式,基本原理是以量子位作为信息编码和存储单元,通过大量量子位的受控演化来完成计算任务。 量子计算和传统计算的对比 (1) 信息表达 传统计算中,计算机运行的单位是取值为 0 或 1 的比 […]
量子计算机是一种使用量子逻辑进行通用计算的设备。是量子计算的具体实现形式
量子神经网络(QNN)是由若干个量子神经元按一定的拓扑结构构成的网络。
鲁棒性是指一个计算机系统在执行过程中处理错误,以及算法在遭遇输入、运算等异常时继续正常运行的能力。
监督学习是输出与输入存在联系的一种机器学习方法。可以由训练资料中学到或建立一个模式,并依此模式推测新的实例。
结构风险是对经验风险和期望风险的折中,在经验风险函数后面加一个正则化项(惩罚项),得到结构分险。
结构风险最小化(SRM)是机器学习中的一个归纳原理。常作为防止过拟合的一个策略。
挤压函数是把较大范围的输入挤压到较小的区间的函数。经常用来做激活函数。
加权投票法是一种计入权重的投票方法。
近邻成分分析(NCA)是一种与 KNN(K 近邻)相关联的距离测度学习方法,属于监督式学习方法。最早是 2004 年由 Goldberger 等人提出。
类内散度矩阵是表示各样本点围绕均指的散布情况。
训练误差是在在数据训练中出现的误差。是模型关于训练数据的平均损失。
最大期望是在概率模型中寻找参数最大似然估计、最大后验估计的算法,其中概率模型基于无法观测因变量。 最大期望算法通常用于机器学习、计算机视觉的数据聚类领域,其经过两个步骤的交替计算: 计算期望 E:利用对隐藏变量的现有估计 […]
过拟合是机器学习中的一种现象。指把样本中一些并不需要拿来作为分类的属性学习了的情况,此时学习的决策树模型并不是最优的模型,而且会会导致泛化性能下降。
期望损失是对全体样本的预测能力,是全局概念的一种;经验风险是局部概念,仅表示决策函数对训练数据集中样本的预测能力。 经验风险和期望风险 经验风险是局部的,基于训练集所有样本点损失函数最小化,经验风险局部最优,现实可求; […]
朴素贝叶斯分类器 ( NBC ),是依据朴素贝叶斯进行分类的一种条件概率分类器。
朴素贝叶斯 是指仅依据每个类别出现的概率进行预测分类,是基于概率理论的一种分类算法。该算法依据于贝叶斯公式。
配对 t 检验是常用的一种 t 检验。它是指对同一个总体,在不同的条件下获取两组样本进行分析,以评价不同条件是否有显著影响。不同条件可以指不同存放环境、不同的测量系统等。
欠拟合 是指在模型对训练数据拟合度差的情形。通常用在模型学习和泛化能力的评估上。
定义 分类器是在已有数据基础上构造出一个分类模型,该模型能够把数据库中的数据记录映射到给定类别中的某一个,从而应用于数据预测。 分类器的构造和实施 分类器的构造和实施大体会经过以下几个步骤: 选定样本(包含正样本和负样本 […]
权重是一个相对的概念,是针对某一指标而言。某一指标的权重是指该指标在整体评价中的相对重要程度。
欠采样 是抛弃一些样本来缓解类不平衡的方法。即对训练集里面样本数量较多的类别(多数类)进行适当的少采样。
软间隔是用来处理线性不可分问题及减少噪点影响的一种方法。软间隔是允许分类时存在一些错误点的做法。
径向基函数(RBF)是沿径向对称的标量函数。通常定义为空间中任一点 X 到某一中心 Xc 之间距离的单调函数。可记作 K ( || X – X c || ), 其作用往往是局部的 , 即当 X 远离 Xc 时函数取值很小。
量子计算是基于量子效应的新型计算方式,基本原理是以量子位作为信息编码和存储单元,通过大量量子位的受控演化来完成计算任务。 量子计算和传统计算的对比 (1) 信息表达 传统计算中,计算机运行的单位是取值为 0 或 1 的比 […]
量子计算机是一种使用量子逻辑进行通用计算的设备。是量子计算的具体实现形式
量子神经网络(QNN)是由若干个量子神经元按一定的拓扑结构构成的网络。
鲁棒性是指一个计算机系统在执行过程中处理错误,以及算法在遭遇输入、运算等异常时继续正常运行的能力。
监督学习是输出与输入存在联系的一种机器学习方法。可以由训练资料中学到或建立一个模式,并依此模式推测新的实例。
结构风险是对经验风险和期望风险的折中,在经验风险函数后面加一个正则化项(惩罚项),得到结构分险。
结构风险最小化(SRM)是机器学习中的一个归纳原理。常作为防止过拟合的一个策略。
挤压函数是把较大范围的输入挤压到较小的区间的函数。经常用来做激活函数。
加权投票法是一种计入权重的投票方法。
近邻成分分析(NCA)是一种与 KNN(K 近邻)相关联的距离测度学习方法,属于监督式学习方法。最早是 2004 年由 Goldberger 等人提出。
类内散度矩阵是表示各样本点围绕均指的散布情况。