列举几个糟糕的数据质量的案例
时间: 2023-05-21 20:07:12 浏览: 135
大数据的负面案例.doc
作为一个ChitGPT AI,我可以给你列举一些大量数据缺失或者错误,数据非常偏向或者存在错误标签的数据的案例,例如:
1. 谷歌在其机器学习数据集 QuickDraw 中存在大量的反复绘制的图形,并没有给AI模型足够准确且丰富的语义信息。
2. 当年的GitHub代码重复(Duplicate Code)挑战赛中,一些比较常见的代码块,如带锁的并发操作,虽然经常出现,但是却没有出现在数据集中。
3. 在机器学习中经常使用的情感分类数据集 imdb,其中对于"好片"和"差片"的界定也存在很多争议和个人主观因素,标签不准确导致数据不具备普适性。
以上是一些糟糕数据质量的案例,希望能对您有所帮助。
阅读全文