Hugging Face AI Sheets 推出视觉功能,支持图像数据处理

2 天前·来源:Hugging Face Blog
Hugging FaceAI Sheets计算机视觉开源工具数据集

Hugging Face AI Sheets 发布重大更新,新增视觉支持功能。用户无需编码即可使用 AI 模型从图像中提取数据、生成图像和编辑图像。该工具通过 Inference Providers 集成数千个开源模型,支持在电子表格中直接处理视觉内容。

Hugging Face AI Sheets 是一个开源工具,用于通过 AI 模型增强数据集,无需编码。最新更新增加了视觉支持功能,允许用户从图像中提取数据、生成图像和编辑图像。该工具通过 Inference Providers 集成数千个开源模型,支持在电子表格中直接处理视觉内容。

AI Sheets 利用 Inference Providers,这意味着用户可以使用全球最佳推理提供商支持的数千个开源模型。第一版 AI Sheets 专注于文本内容的结构化和丰富化,现在新增了视觉功能。

图像无处不在,如产品照片、收据、截图、图表和徽标。这些文档包含结构化信息,等待被提取、分析和转换。现在,用户可以在 AI Sheets 中直接处理视觉内容:查看图像、分析图像、提取信息、生成新图像,甚至实时编辑图像,所有操作都在同一工作流程中完成。

用户可以上传图像或使用包含图像的数据集,利用视觉模型提取、分析和结构化其中的信息。功能包括描述和分类图像、提取结构化数据以及添加上下文和元数据。用户可以通过提示迭代、手动编辑输出和使用点赞功能来指导模型,反馈成为少样本示例以改善结果。

例如,从收据中提取结构化费用数据:上传收据到 AI Sheets,创建提示列以提取商家名称、日期、总金额和费用类别。AI Sheets 处理每张收据,生成包含提取细节的整洁表格。用户可以编辑错误、点赞验证结果并重新生成以改进数据。最终数据集可导出为 CSV 或 Parquet 格式,用于费用跟踪工具。

AI Sheets 还可以在同一工作流程中生成和编辑图像。用户可以从文本生成图像、编辑和转换现有图像、大规模创建变体以及构建视觉内容库。例如,为社交媒体内容日历生成图像:在电子表格中规划帖子标题和描述,使用 AI 模型生成匹配的视觉内容,保持整个内容创建工作流程集中。

背景阅读

Hugging Face 是一个领先的 AI 平台,专注于开源模型和工具,其社区提供了大量预训练模型,涵盖自然语言处理、计算机视觉等领域。AI Sheets 是 Hugging Face 推出的一个工具,旨在简化数据集的构建和增强过程,通过集成 AI 模型实现自动化数据处理。此前,AI Sheets 主要支持文本内容,如结构化文本和生成文本,帮助用户无需编码即可利用 AI 能力。随着计算机视觉技术的发展,图像数据处理需求日益增长,特别是在文档数字化、内容生成和数据分析等场景中。Hugging Face 通过 Inference Providers 整合了多个推理服务提供商,如 AWS、Google Cloud 和 Azure,使得用户能够访问高性能的视觉模型,如用于图像分类、对象检测和图像生成的模型。这一更新反映了 AI 工具向多模态发展的趋势,结合文本和图像处理能力,提升数据工作流的效率和灵活性。在行业中,类似工具如 Google Sheets 的 AI 插件和 Microsoft Excel 的 AI 功能也在探索集成 AI 模型,但 AI Sheets 的开源特性使其更具可定制性和社区支持。

评论 (0)

登录后参与评论

加载评论中...