自监督学习(SSL)是机器学习的一种范式,用于处理未标记数据以获取有用的表示,以帮助下游学习任务。SSL方法最显著的特点是它们不需要人类标注的标签,这意味着它的训练完全基于由未标记的数据样本组成的数据集。典型的SSL流程包括在第一阶段学习监督信号(自动生成的标签),这些监督信号将用于后续阶段中的某些监督学习任务。因此,SSL可以视为无监督学习监督学习的中间形式。

典型的 SSL 方法基于人工神经网络或其他模型(例如决策列表英语Decision list[1]

参考资料

编辑
  1. ^ Yarowsky, David. Unsupervised Word Sense Disambiguation Rivaling Supervised Methods. Proceedings of the 33rd Annual Meeting of the Association for Computational Linguistics (Cambridge, MA: Association for Computational Linguistics). 1995: 189–196 [1 November 2022]. doi:10.3115/981658.981684 . (原始内容存档于2022-12-14).