OpenAI 要求承包商上传过往真实工作内容以训练AI

2026/1/13·来源:TechCrunch
OpenAI训练数据AI模型知识产权承包商

据报道,OpenAI 与训练数据公司 Handshake AI 正要求第三方承包商上传过去和当前工作中的真实任务文件。此举旨在生成高质量训练数据,以帮助AI模型自动化更多白领工作。OpenAI 提供 ChatGPT 工具协助删除敏感信息,但律师警告这可能带来知识产权风险。

根据 Wired 报道,OpenAI 和训练数据公司 Handshake AI 正要求第三方承包商上传他们在过去和当前工作中的真实任务文件。这似乎是AI公司更广泛战略的一部分,旨在通过承包商生成高质量训练数据,以期望最终使模型能自动化更多白领工作。在 OpenAI 的案例中,一份公司演示文稿要求承包商描述他们在其他工作中执行的任务,并上传他们“实际完成”的“真实在职工作”示例,这些示例可包括具体输出文件,如 Word 文档、PDF、PowerPoint、Excel、图像或代码仓库。据报道,OpenAI 指示承包商在上传前删除专有和个人可识别信息,并指向一个 ChatGPT “超级明星擦除”工具来执行此操作。尽管如此,知识产权律师 Evan Brown 告诉 Wired,任何采取此方法的AI实验室都“将自己置于巨大风险中”,这种方法需要“对其承包商决定什么是机密什么不是机密有高度信任”。OpenAI 发言人拒绝置评。

背景阅读

AI 模型的训练依赖于大量高质量数据,这些数据通常来自公开数据集或网络爬取,但自动化白领工作(如文档处理、数据分析)需要更专业和结构化的数据。近年来,AI 公司如 OpenAI 通过 GPT 系列模型在自然语言处理领域取得进展,但训练数据的获取和隐私问题一直是行业挑战。此前,OpenAI 曾因使用受版权保护的数据而面临诉讼,促使公司探索更合规的数据收集方法。Handshake AI 作为训练数据公司,专注于为AI模型提供定制化数据解决方案。这一新闻反映了AI行业在数据获取与知识产权保护之间的平衡努力,以及如何通过承包商生成特定领域数据以提升模型性能的趋势。

评论 (0)

登录后参与评论

加载评论中...