偏好学习
词条百科 2
目录
偏好学习
偏好学习是机器学习的一个子领域,是一种基于观察到的偏好信息的分类方法。在监督学习的观点中,偏好学习对一组对标签或其他项目有偏好的项目进行训练,并预测所有项目的偏好。虽然偏好学习的概念在许多领域(如经济学)已经出现了一段时间,但它在人工智能研究中是一个相对较新的课题。在过去的十年中,有几个研讨会一直在讨论偏好学习和相关话题。
偏好学习的任务
偏好学习的主要任务涉及学习排名的问题。根据观察到的不同类型的偏好信息,这些任务在《偏好学习》一书中被分为三个主要问题。
标签排行
在标签排行中,模型有一个实例空间.一组偏好信息被用作模型的训练数据。这个模型的任务是在任何实例的标签中找到一个偏好排名。据观察,一些传统的分类问题可以在标签排名问题的框架内被概括:如果一个训练实例.在这些偏好信息上训练一个偏好模型,一个实例的分类结果只是对应的最高排名标签。
实例排行
实例排行也有实例空间给予一组实例作为训练数据,这个任务的目标是为一组新的实例找到排名顺序。
对象排名
对象排名与实例排名类似,只是没有标签与实例相关联。给出一组成对的偏好信息,其形式为
功用函数
如果我们能找到一个从数据到实数的映射,对数据的排序就可以通过对实数的排序来解决。这种映射被称为效用函数。对于标签排名,映射是一个函数寻找效用函数是一个回归学习问题,在机器学习中得到了很好的发展。

偏好关系
偏好信息的二进制表示被称为偏好关系。对于每一对备选方案(实例或标签),可以通过传统的监督学习方法学习一个二元谓词。Fürnkranz和Hüllermeier在标签排名问题上提出了这种方法。对于对象的排名,Cohen等人有一个早期的方法。使用偏好关系来预测排名就不那么直观了。由于偏好关系不是传递性的,它意味着该
内容来源于网络,本内容不代表16map.com立场,内容投诉举报请联系16map.com客服。如若转载,请注明出处:https://16map.com/wiki/nmtegi0loitq