机器学习中的主动学习算法有什么？

如题所述

推荐答案推荐于2017-07-27

主动学习的算法主要有两种
(1)基于评委的方法 (committee-based methods)
首先用各种不同的学习器对样本进行标注，然后由标注人员对有争议的标注结
果作出最终判断。不同的学习器之间的分歧是由它们对样本标注结果预测的差异所
造成的。
(2)基于置信度的方法
(certainty-based methods)
先由模型给出具有较低置信度的样本，再交给标注人员选择性地进行标注。置
信度的计算通常是由学习器度量
n-最优(n-best)标注结果之间的差异得到的。
下面详细描绘一下基于评委的方法和基于置信度的方法的普遍流程。

基于评委的方法：
(1) 对于由 n
个未标注样本构成的样本组 B 中的每个样本
e，使用从先前标注样本中训练出来的 k 个模型对其进行标注，得到 k
个结果{L1,L2...Lk}，通过{L1,L2...Lk}，对每个 e
测量出具有争议的标注结果De ；
(2) 从样本组 B 中选择出 m
个具有最高 De
值的样本交给标注人员进行标注。把人工标注好的样本加进训练样本库里；
(3)
在扩大后的训练样本库的基础上，再重新得到 k
个模型。首先将语料库划分为连续的n个样本组，贯穿整个语料库，重复地在
n 个样本组中顺序地进行该过程。如果语料库不大，样本 n
正好等于语料库的大小，那么这个过程中的每一步都是在语料库的未标注样本中选择出
m 个全局最优的实例，如果语料库的大小比样本 n
大，那么这个过程是承接进行的。
基于置信度的方法：

(1)从先前标注的样本中训练出一个模型；
(2)对于 N
个未标注的样本组中的每一个样本用模型对其进行标注，评估模型标
注的置信度；
(3)从样本组中选择 m
个具有最低置信度的样本交给标注人员进行标注；

(4)把新标注的样本加进训练语料中；

(5)重复执行以上过程直到标注人员停止或未标注样本用尽。
Hwa
运用基于置信度的方法从 Penn Treebank
语料库学习语法，把学习器对一个样本的标注结果的不确定性等同于该样本的“训练效用值”。如果学习器能够从大量的未标注语料中识别出具有较高训练效用值的
样本的子集，标注人员就不需要花费时间去标注那些不富含信息的样本。基于置信度的方法的难点在于如何构造一种度量方法来评估学习器标注结果的置信度。

温馨提示：答案为网友推荐，仅供参考

当前网址：http://99.wendadaohang.com/zd/zBOXtWBXv.html

其他回答

第1个回答 2011-12-31

你说的主动学习算法是什么意思? 是指无监督学习吗?

相似回答

机器学习有哪些算法答：1.线性回归 在统计学和机器学习领域，线性回归可能是最广为人知也最易理解的算法之一。2.Logistic回归 Logistic回归是机器学习从统计学领域借鉴过来的另一种技术。它是二分类问题的首选方法。3.线性判别分析 Logistic回归是一种传统的分类算法，它的使用场景仅限于二分类问题。如果你有两个以上的类，那么...

有哪些常用的机器学习算法?答：机器学习中常用的方法有：(1) 归纳学习符号归纳学习：典型的符号归纳学习有示例学习、决策树学习。函数归纳学习(发现学习)：典型的函数归纳学习有神经网络学习、示例学习、发现学习、统计学习。(2) 演绎学习 (3) 类比学习：典型的类比学习有案例(范例)学习。(4) 分析学习：典型的分析学习有解释学习、...

机器学习一般常用的算法有哪些?答：一、线性回归 一般来说，线性回归是统计学和机器学习中最知名和最易理解的算法之一。这一算法中我们可以用来预测建模，而预测建模主要关注最小化模型误差或者尽可能作出最准确的预测，以可解释性为代价。我们将借用、重用包括统计学在内的很多不同领域的算法，并将其用于这些目的。当然我们可以使用不同的...

常见的机器学习算法答：1、数据质量和准备：机器学习算法的效果很大程度上依赖于输入数据的质量。确保数据集的准确性、完整性和一致性，并处理缺失值、异常值和噪音等问题。2、特征选择和工程：选择合适的特征对于算法的效果至关重要。进行特征选择和工程，可以提取出更有信息量的特征，提高算法的准确性和泛化能力。3、模型选择和...

机器学习的方法答：监督学习（Supervised Learning）：使用带有标记的训练数据集来训练模型，以预测未标记数据的输出。常见的监督学习算法包括线性回归、逻辑回归、决策树、支持向量机等。机器学习无监督学习（Unsupervised Learning）：使用未标记的训练数据集来训练模型，以发现数据中的模式和结构。常见的无监督学习算法包括聚类...

机器学习人工智能的算法有哪些?答：一、集成算法。1、简单算法一般复杂度低、速度快、易展示结果，其中的模型可以单独进行训练，并且它们的预测能以某种方式结合起来去做出一个总体预测。2、每种算法好像一种专家，集成就是把简单的算法组织起来，即多个专家共同决定结果。集成算法比使用单个模型预测出来的结果要精确的多，但需要进行大量的...

机器学习的常见算法答：机器学习算法如下：机器学习(MachineLearning,ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本...

机器学习的分类答：机器学习的世界犹如一座多元化的宝库，包含了多种强大的学习方式，以适应各种复杂问题。让我们深入探讨这五种核心学习方法：监督学习、无监督学习、强化学习、半监督学习和主动学习，以及它们在构建智能解决方案中的独特角色。在监督学习的领域，我们有如璀璨的明星阵容，如KNN、线性回归、逻辑回归等，它们通过...

大家正在搜

机器学习中的主动学习算法 有什么？

机器学习中的主动学习算法有什么？