Scale AI:大模型时代的数据标注新角色

需积分: 0 1 下载量 23 浏览量 更新于2024-06-14 收藏 994KB DOCX 举报
"Scale AI:大模型还需要数据标注吗" Scale AI是一家成立于2016年的公司,由Alexandr Wang和Lucy Guo创立,后者已离职。该公司在2019年成为独角兽企业,目前估值约为73亿美元,年度经常性收入(ARR)接近3亿美元。Scale AI的主要业务是数据标注,最初专注于自动驾驶领域,随后扩展到政府、电子商务、机器人以及最近的大模型应用。得益于强大的领导力和团队执行力,Scale AI能够及时抓住市场机遇,推出适应各种趋势的产品,并在各个细分市场取得显著份额。 随着AI行业的快速发展,Scale AI正在积极进入MLOps(机器学习操作)和LLM(大型语言模型)领域,推出如ScaleCatalog(电商图片生成工具)、ScaleSpellbook(大语言模型开发者平台)和ScaleSynthetic(合成数据产品)等工具和服务。尽管这些新产品显示出对第二增长曲线的探索,但根据调研,它们的销售表现并不出色,公司的主要收入来源仍然依赖于数据标注业务。 在大模型中,数据标注的作用至关重要。高质量和高效率的数据标注是训练模型的基础,尤其是对于非结构化数据,如图像、视频、3D传感器数据、文本和音频等。由于数据标注不是大多数公司的核心竞争力,他们倾向于外包这项工作,选择的方式包括建立内部团队、使用众包平台或与专门的数据标注公司,如Scale AI,进行合作。 文章探讨了数据标注在大模型中的作用,数据标注的商业模式,Scale AI的公司治理问题以及其未来发展前景。作为AI行业的一个重要参与者,Scale AI的产品动态反映了行业的新趋势,因此关注其产品更新可以帮助洞察行业变化。 总结来看,尽管Scale AI在探索新的业务领域,但数据标注仍然是其核心业务。大模型的崛起并没有消除对数据标注的需求,反而可能因为模型复杂度的增加而更加依赖于高效的数据标注服务。因此,数据标注在AI产业链中依然占据重要位置,而Scale AI将继续在这一领域发挥关键作用。
2023-05-29 上传