Hugging Face发布了Ettin Suite,这是首个在相同数据、架构和训练配方下训练的状态最先进(SoTA)配对编码器与解码器模型套件。该套件包含从1700万到10亿参数的模型,训练数据量为2万亿标记,支持掩码语言建模(MLM)和因果语言建模(CLM)两种训练目标。Ettin Suite基于ModernBERT配方,应用了从解码器模型借鉴的现代技术,并扩展了上下文长度至8K标记。该套件旨在实现编码器与解码器架构之间的公平比较,为分类、检索和嵌入任务提供高效模型。用户可通过GitHub上的示例代码尝试这些模型。