我们建立一个5000个特征, 100万数据的机器学习模型. 想要有效地应对这样的大数据训练应该()①随机抽取一些样本, 在这些少量样本之上训练;②可以试用在线机器学习算法;③应用PCA算法降维, 减少特征数 A.①③ B.①②③ C.②③ D.①②
时间: 2024-05-21 15:16:40 浏览: 176
周虎成-大学习时代:应对大数据和大模型带来的挑战
正确答案是 D. ①②。
对于大数据训练,可以考虑以下方法:
①随机抽取一些样本,在这些少量样本之上训练;
②可以使用在线机器学习算法,逐步迭代更新模型,避免一次性处理大量数据的问题;
③可以应用PCA算法降维,减少特征数,降低模型复杂性,提高训练效率。
其中,随机抽取一些样本进行训练是最基本的方法,而在线学习和PCA算法则可以作为补充措施。
阅读全文