Multi-view Learning 多视角学习入门

Multi-view Learning 多视角学习入门

标签:机器学习


在上海呆了一年了,从啥都不会 到 啥都不会,还是要回归博客,做做小结整理整理……
多视角学习是老板的拿手好戏,最近布置的任务也和多视角相关。经过老板的一番吐槽,在找论文时候要注意其上过哪些会议,比较好的会议上论文的质量较高。经过多方求助,入门可以从最精(xuan)华(xue)的综述开始看起。

  • Xu C, Tao D, Xu C. A Survey on Multi-view Learning[J]. Computer Science, 2013.
  • Sun S. A survey of multi-view machine learning[J]. Neural Computing & Applications, 2013, 23(7-8):2031-2038.

多视角简介

Multi-view learning: introduces one function to model a particular view and jointly optimizes all the functions to exploit the redundant views of the same input data and improve the learning performance.

引入了一个函数去模型化一个特定的视角,并且利用相同输入的冗余视角去联合优化所有函数,最终提高学习效果。

多视角来源

(1) multiple sources (2) different feature subsets;

(1) 多个源:比如人物识别可以用脸、指纹等作为不同源的输入。
(2) 多个特征子集:比如图像表示可以用颜色、文字等作为不同特征表述。

多视角学习算法

  • co-training 协同训练
    trains alternately to maximize the mutual agreement on two distinct views of the unlabeled data.
  • multi-kernel learning 多核学习
    exploits kernels that naturally correspond to different views and combine kernels either linearly or non-linearly to improve learning performance.
  • subspace learning 子空间学习
    obtains a latent subspace shared by multiple views by assuming that the input views are generated from this latent subspace.

学习准则

为了确保 redundant views 可以被有效充分地利用,建立以下 Principles:

  1. consensus principle (共识准则)
    尽量保证两个 Hypothesis 一致,其不一致的概率作为右边式子的上界。右式为单独每个假设下的错误率,下式保证了该值最小化。
    P(f1f2)max{ Perr(f1),P<
### 多视图多标签学习的概念与方法 多视图多标签学习Multi-View Multi-Label Learning, MVML)是一种结合了多视图学习和多标签学习的方法。它旨在利用来自不同视角的数据特征来提高分类性能,尤其是在处理复杂数据集时更为有效。 #### 1. 基本定义 多视图多标签学习的核心在于如何有效地融合多个视图的信息以提升预测精度。每个视图可以看作是从不同的角度描述同一个样本[^1]。例如,在图像识别任务中,颜色直方图可能是一个视图,而纹理特征可能是另一个视图。通过整合这些视图中的互补信息,模型能够更全面地理解输入数据。 #### 2. 方法类别 根据具体实现方式的不同,MVML 可分为以下几类: - **基于集成的学习 (Ensemble-based Methods)** 此类方法通常会针对每一个单独的视图构建独立的基础分类器,并最终采用某种策略组合它们的结果。这种方法的优点是可以充分利用各个视图的独特特性。 - **联合表示学习 (Joint Representation Learning)** 联合表示学习试图找到一种统一的方式将所有视图映射到同一低维空间内进行后续操作。典型代表有CCA(Canonical Correlation Analysis)及其变体。 - **深度神经网络框架下的解决方案** 随着深度学习技术的发展,越来越多的研究者开始探索使用深层架构解决MVML问题。比如引入注意力机制(Multi-head attention mechanism),使得模型能够在训练过程中动态调整各视图的重要性权重[^2]。 #### 3. 数据预处理技巧 对于实际应用而言,除了设计合理的算法外还需要注意一些重要的前期准备工作: - 应用适当的数据增强(Data Augmentation Techniques)可以帮助缓解过拟合现象并增加泛化能力; - 当面对不平衡标签分布的情况时,则需采取相应的平衡措施如重采样或者代价敏感型损失��数等手段加以应对。 ```python import numpy as np from sklearn.multiclass import OneVsRestClassifier from sklearn.svm import SVC # Example of Binary Relevance approach using SVMs. X_train = [[0], [1], [2], [3]] y_train = [ [0, 1], [1, 1], [1, 0], [0, 0] ] classifier = OneVsRestClassifier(SVC(kernel='linear')) classifier.fit(X_train, y_train) print(classifier.predict([[0.8]])) ``` 上述代码片段展示了二元相关法(Binary Relevance)的一个简单实例,其中`OneVsRestClassifier`配合支持向量机完成多标签分类任务。 ---
评论 3
添加红包
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值