张敏灵在CCAI 2017分享:弱监督机器学习新进展

需积分: 10 2 下载量 107 浏览量 更新于2024-07-17 收藏 2.1MB PDF 举报
在2017年的中国人工智能大会(CCAI 2017)上,东南大学计算机科学与工程学院的张敏灵教授分享了题为《弱监督机器学习范式》的报告。报告聚焦于大数据分析背景下机器学习的新进展,特别强调了在缺乏大规模标注数据的情境中,如何利用有限的信息进行有效分类和学习。 首先,张教授指出机器学习在大数据驱动下取得了显著的成功,大型规模并行实施带来了许多突破,如大规模机器学习算法在诸如自然语言处理、图像识别等领域展现出强大的能力。然而,现实世界中有许多应用场景,如医疗诊断、工业制造、灾害预警和基础设施管理等,由于数据获取的限制,大规模标注数据并不普遍可用。 针对这一挑战,张敏灵教授的研究主要围绕弱监督机器学习展开。弱监督学习是一种在缺乏完整标注数据的情况下,通过利用较少或不精确的标签信息来提升模型性能的方法。例如,密度比率估计(Density Ratio Estimation)是其中一种关键技术,它可以帮助模型估计不同类别之间的分布差异,即使在仅有部分标记或者标签噪声的情况下也能进行学习。 报告中提到了几本相关的书籍,包括Sugiyama教授的作品,如《统计机器学习导论》(Introduction to Statistical Machine Learning),以及《数据集迁移在机器学习中的影响》(Dataset Shift in Machine Learning),这些著作深入探讨了统计强化学习、非平稳环境下的机器学习、无监督学习等议题,为理解和应用弱监督学习提供了理论基础。 Sugiyama教授的另一些著作,如《机器学习在非stationary环境中》和《统计强化学习》,展示了如何处理环境变化和动态学习问题,这对于适应不断变化的数据分布和应用场景至关重要。此外,《机器学习的密度比率估计》则详述了这一核心技术在实际问题中的应用和优化方法。 在报告中,张敏灵教授分享了他们的最新研究成果,即在有限信息条件下进行分类的进展。这可能包括开发新的弱监督学习算法、处理小样本学习、半监督学习或基于元学习的策略,以降低对大规模标注数据的依赖。这些研究不仅有助于解决实际问题,也推动了机器学习理论的前沿发展,对于未来的数据驱动型决策系统具有重要意义。 总结来说,张敏灵教授的分享揭示了在大数据时代,如何通过弱监督机器学习范式应对数据标注不足的问题,并介绍了他们在这一领域的关键贡献和技术突破,为理解和发展现代机器学习实践提供了重要视角。