NeoBeta - AI 科技资讯

根据 Wired 报道，OpenAI 和训练数据公司 Handshake AI 正要求第三方承包商上传他们在过去和当前工作中的真实任务文件。这似乎是AI公司更广泛战略的一部分，旨在通过承包商生成高质量训练数据，以期望最终使模型能自动化更多白领工作。在 OpenAI 的案例中，一份公司演示文稿要求承包商描述他们在其他工作中执行的任务，并上传他们“实际完成”的“真实在职工作”示例，这些示例可包括具体输出文件，如 Word 文档、PDF、PowerPoint、Excel、图像或代码仓库。据报道，OpenAI 指示承包商在上传前删除专有和个人可识别信息，并指向一个 ChatGPT “超级明星擦除”工具来执行此操作。尽管如此，知识产权律师 Evan Brown 告诉 Wired，任何采取此方法的AI实验室都“将自己置于巨大风险中”，这种方法需要“对其承包商决定什么是机密什么不是机密有高度信任”。OpenAI 发言人拒绝置评。

背景阅读

AI 模型的训练依赖于大量高质量数据，这些数据通常来自公开数据集或网络爬取，但自动化白领工作（如文档处理、数据分析）需要更专业和结构化的数据。近年来，AI 公司如 OpenAI 通过 GPT 系列模型在自然语言处理领域取得进展，但训练数据的获取和隐私问题一直是行业挑战。此前，OpenAI 曾因使用受版权保护的数据而面临诉讼，促使公司探索更合规的数据收集方法。Handshake AI 作为训练数据公司，专注于为AI模型提供定制化数据解决方案。这一新闻反映了AI行业在数据获取与知识产权保护之间的平衡努力，以及如何通过承包商生成特定领域数据以提升模型性能的趋势。

OpenAI 要求承包商上传过往真实工作内容以训练AI

背景阅读

相关阅读

谷歌推出AI收件箱视图，预览Gmail未来功能

AI行业内部人士发起数据投毒网站以对抗AI训练

Stack Overflow 营收翻倍，通过向 AI 公司销售数据实现转型

评论 (0)