Sentence Transformers 库正式加入 Hugging Face

2 天前·来源:Hugging Face Blog
Sentence TransformersHugging Face自然语言处理开源库语义嵌入

Sentence Transformers 库已从德国达姆施塔特工业大学的 UKP 实验室转移至 Hugging Face。该库是一个用于生成高质量语义嵌入的开源工具,自 2019 年发布以来被广泛用于 NLP 任务。Hugging Face 将提供基础设施支持,确保项目持续更新和发展。

Sentence Transformers 库已从德国达姆施塔特工业大学的 Ubiquitous Knowledge Processing (UKP) 实验室转移至 Hugging Face。Hugging Face 的 Tom Aarsen 自 2023 年底起已负责维护该库,并将继续领导项目。在新归属下,Sentence Transformers 将受益于 Hugging Face 的稳健基础设施,包括持续集成和测试,确保其跟上信息检索和自然语言处理领域的最新进展。

Sentence Transformers 是一个流行的开源库,用于生成捕捉语义的高质量嵌入。自 2019 年由 Nils Reimers 创建以来,该库已被研究人员和从业者广泛用于各种自然语言处理任务,包括语义搜索、语义文本相似性、聚类和释义挖掘。经过多年的社区开发和训练,Hugging Face Hub 上已有超过 16,000 个 Sentence Transformers 模型公开可用,每月服务超过一百万独立用户。

Sentence Transformers 将保持社区驱动和开源项目性质,沿用相同的开源许可证(Apache 2.0)。欢迎并鼓励研究人员、开发者和爱好者的贡献。项目将继续优先考虑透明度、协作和广泛可访问性。

背景阅读

Sentence Transformers 库,也称为 SentenceBERT 或 SBERT,由 Nils Reimers 于 2019 年在德国达姆施塔特工业大学的 UKP 实验室开发,旨在解决标准 BERT 嵌入在句子级语义任务中的局限性。该库采用孪生网络架构,生成语义上有意义的句子嵌入,可通过余弦相似性高效比较。由于其模块化、开源的设计以及在语义文本相似性、聚类和信息检索等任务上的强大实证性能,Sentence Transformers 迅速成为自然语言处理研究工具包中的核心组件,催生了大量后续研究和实际应用。Hugging Face 是一个专注于人工智能和机器学习的开源平台,提供模型托管、数据集和工具,支持社区协作。此次转移标志着开源 AI 项目整合的趋势,旨在通过集中资源促进创新和可访问性。

评论 (0)

登录后参与评论

加载评论中...