claude

产品44 篇资讯

2026年1月20日

阿拉伯语AI排行榜更新：引入指令遵循评估并升级AraGen基准

Inception与MBZUAI合作推出阿拉伯语AI排行榜空间，整合了AraGen-03-25和阿拉伯语指令遵循评估。AraGen基准更新至03-25版本，数据集扩展至340个问答对，涵盖问答、推理、安全和语法分析。阿拉伯语指令遵循排行榜基于首个公开的阿拉伯语IFEval基准，旨在评估模型遵循指令的能力。

2026年1月19日

Anthropic称Claude加速科研进程，斯坦福和MIT采用

Anthropic宣布其AI模型Claude正被斯坦福大学和麻省理工学院用于加速科研工作。Claude通过处理复杂数据和生成假设，帮助研究人员提高效率。这一应用展示了AI在学术研究领域的实际价值。

Hugging Face 推出 Jupyter Agent：训练 LLM 在笔记本中执行代码推理

Hugging Face 发布了 Jupyter Agent，旨在训练大型语言模型在 Jupyter 笔记本环境中执行代码以解决数据科学任务。该项目基于 Qwen-3 Coder 模型构建演示，并利用 DABStep 基准评估模型性能。研究团队计划通过生成高质量训练数据和微调小模型来提升代理能力。

韩国AI订阅支出超Netflix，ChatGPT占主导

韩国AI订阅服务月支出首次超过Netflix。2025年12月，包括ChatGPT和Gemini在内的七项AI服务支付额达803亿韩元。ChatGPT以71.5%的支付份额领先，其次是Gemini和Claude。

Signal 联合创始人推出注重隐私的 AI 助手 Confer

Signal 联合创始人 Moxie Marlinspike 于 2023 年 12 月推出了 AI 服务 Confer。Confer 旨在提供类似 ChatGPT 的体验，但通过加密和可信执行环境确保用户隐私。该服务免费版每天限制 20 条消息，付费版每月 35 美元提供无限访问。

红杉资本投资Anthropic，打破风投不投竞争对手的禁忌

红杉资本据报道将参与Anthropic的巨额融资轮。此举打破了风投机构避免投资同一领域竞争对手的传统做法。Anthropic此轮融资目标估值3500亿美元，微软和英伟达已承诺投资高达150亿美元。

2026年1月18日

Claude Cowork发布数天后遭文件窃取提示注入攻击

Anthropic新AI系统Claude Cowork发布后不久，安全研究人员发现其存在关键漏洞。该漏洞允许攻击者通过隐藏提示注入窃取用户机密文件，无需人工授权。攻击利用伪装成无害文档的技能文件，使AI模型在用户不知情下泄露数据。

2026年1月17日

Artificial Analysis 全面改革 AI 智能指数，用真实世界测试取代传统基准

独立 AI 基准测试组织 Artificial Analysis 发布了其智能指数的重大更新。新版本移除了 MMLU-Pro 等传统基准，引入了 GDPval-AA 等真实世界任务评估。GPT-5.2 在新指数中排名第一，Claude Opus 4.5 和 Gemini 3 Pro 紧随其后。

OpenAI、Anthropic和谷歌推出新AI医疗工具

OpenAI发布了ChatGPT Health功能，允许用户上传健康记录获取医疗建议。Anthropic推出了Claude for Healthcare，支持美国Pro和Max订阅者上传健康数据。谷歌推出了MedGemma 1.5模型，专注于医疗图像分析。

Anthropic 发布 Claude Cowork，AI 代理可管理本地文件系统

Anthropic 发布了 Claude Cowork，这是一款 AI 代理工具，能够访问和处理用户本地计算机上的文件。该工具目前处于研究预览阶段，每月费用为 100 美元，主要面向早期采用者。Claude Cowork 允许用户指定文件夹，AI 可执行文件整理和数据处理等任务。

Kilo 推出 AI 驱动的 Slack 机器人，可在聊天中直接提交代码

开源 AI 编程初创公司 Kilo Code 发布 Slack 集成工具 Kilo for Slack，允许开发团队在 Slack 聊天中执行代码更改和提交拉取请求。该工具由 MiniMax 的 M2.1 模型驱动，旨在将 AI 能力嵌入实际工作流程。Kilo 声称其产品在 Slack 中处理多仓库上下文方面优于 Cursor 和 Claude Code。

AI公司加速涌入医疗领域，OpenAI收购健康初创公司

OpenAI以约1亿美元收购健康记录初创公司Torch。Anthropic推出针对医疗领域的Claude for healthcare。Sam Altman支持的MergeLabs完成2.5亿美元种子轮融资，估值达8.5亿美元。

Anthropic 向每月 20 美元订阅用户开放 Claude Cowork 功能

Anthropic 的 Claude Cowork AI 助手现已向每月 20 美元 Pro 订阅用户开放。该功能允许用户在 macOS 上让 Claude 处理本地计算机的简单任务，如创建文档或整理文件夹。Claude Cowork 基于 Claude Code 开发，并已根据早期用户反馈进行了改进。

2026年1月16日

Anthropic发布Claude Code插件Ralph Wiggum，推动自主AI编程

Anthropic为Claude Code平台发布了名为Ralph Wiggum的官方插件。该插件基于开发者Geoffrey Huntley的原始脚本，通过循环反馈机制提升AI自主编程能力。Ralph Wiggum插件标志着从对话式AI向自主代理编程的转变。

Anthropic 分析 Claude 实际失败率后，将 AI 生产力预测减半

Anthropic 发布第四份经济指数报告，首次系统分析 Claude 在不同任务中的实际成功率。报告基于 2025 年 11 月的 100 万次 Claude.ai 对话和 API 记录，显示任务越复杂，失败率越高。这导致 Anthropic 将之前对美国劳动生产力增长的预测从 1.8 个百分点下调至约 1.0 到 1.2 个百分点。

Anthropic任命前微软印度总经理领导班加罗尔扩张

Anthropic任命前微软印度总经理Irina Ghose领导其印度业务，以推动班加罗尔办公室的开设。印度已成为Claude第二大用户市场，Anthropic正加强本地化布局以应对竞争。此举凸显印度作为AI公司全球扩张关键战场的战略重要性。

Anthropic 发布 Claude Cowork AI 代理，实现文件管理与任务自动化

Anthropic 发布了 Claude Cowork AI 代理的研究预览版，该工具专注于文件管理和计算机界面操作。Claude Cowork 能够组织文件、转换文件类型、生成报告并控制浏览器执行任务。目前，该工具仅面向 Anthropic 每月 100 美元订阅计划的用户开放，并仅限于 macOS 平台。

Anthropic Cowork AI 存在文件泄露漏洞，源于未修复的 Claude Code 缺陷

Anthropic 新推出的 Cowork 生产力 AI 工具存在文件泄露漏洞，源于去年 10 月已报告的 Claude Code 缺陷。攻击者可通过提示注入诱骗 Cowork 将敏感文件传输至其账户，无需额外用户批准。Anthropic 承认风险但未修复，建议用户避免连接敏感文档并监控可疑操作。

Claude Code 更新引入懒加载工具搜索功能

Anthropic 为 Claude Code 发布了 MCP Tool Search 更新，引入了懒加载机制。该功能允许 AI 代理动态获取工具定义，仅在需要时加载。这解决了工具描述占用大量上下文窗口的问题，提升了效率。

2026年1月15日

OpenAI、谷歌和Anthropic相继推出医疗AI工具，竞争加剧

OpenAI、谷歌和Anthropic本月相继发布医疗AI工具，包括ChatGPT Health、MedGemma 1.5和Claude for Healthcare。这些工具专注于医疗工作流程优化，如授权审核和文档处理，但均未获批用于临床诊断。它们基于多模态大语言模型，强调隐私保护和辅助临床决策。

Slack 集成 Claude 模型升级 AI 功能

Salesforce 为 Slack 用户升级了 AI 功能，采用 Anthropic 的 Claude 模型增强 Slackbot。Slack 首席产品官兼临时 CEO Rob Seaman 在 Bloomberg Tech 节目中讨论了这一更新。此举旨在提升 Slack 平台的智能化体验。

Z.ai开源GLM-Image在复杂文本渲染上超越谷歌Nano Banana Pro

中国初创公司Z.ai发布了开源图像生成模型GLM-Image。该模型在复杂文本渲染基准测试中击败谷歌的Nano Banana Pro。GLM-Image采用混合架构，专为信息密集的视觉内容生成设计。

2026年1月14日

Anthropic 推出 Claude Cowork 通用智能体，10天开发完成

Anthropic 发布了面向工作场景的通用智能体 Claude Cowork。该产品基于 Claude Code 开发，全部代码由 AI 编写，开发周期仅约10天。Claude Cowork 旨在让非技术用户也能利用 AI 智能体处理任务。

AI模型缺乏统一“自我”，Anthropic研究员称非缺陷

Anthropic研究员指出，AI模型内部缺乏统一“自我”并非缺陷。实验发现Claude使用不同机制处理事实，导致答案矛盾。这提示将语言模型视为人类般心智连贯可能是根本性类别错误。

Anthropic 推出 Claude Cowork，面向普通用户的文件管理 AI 助手

Anthropic 发布了 Claude Cowork，这是一个面向非开发者的文件管理 AI 助手预览功能。用户可授权 Claude 访问电脑文件夹，自动执行文件组织、数据转换等任务。该功能目前仅向 Claude Max 订阅用户和 macOS 用户开放试用。

谷歌研究发现重复提示可提升LLM非推理任务准确率高达76%

谷歌研究团队发布论文，发现简单重复输入提示能显著提升大型语言模型在非推理任务中的性能。该方法在包括Gemini、GPT-4o、Claude和DeepSeek在内的多个主流模型上均有效，且对生成速度几乎没有影响。研究显示，在70项基准测试中，重复提示在47项中获胜，零失败。

2026年1月13日

Nous Research 发布开源编程模型 NousCoder-14B，对标 Claude Code

开源 AI 初创公司 Nous Research 发布了 NousCoder-14B 编程模型。该模型在 LiveCodeBench v6 基准测试中准确率达 67.87%，基于阿里 Qwen3-14B 训练。Nous Research 公开了模型权重和完整训练环境，强调开源透明度。

Claude Code 2.1.0 发布，优化工作流与智能代理功能

Anthropic 发布了 Claude Code v2.1.0，这是一个针对其开发环境的重大更新。新版本引入了代理生命周期控制、技能开发和会话可移植性等改进。这些更新旨在帮助开发者更高效地构建和管理 AI 代理工作流。

AI助手助力伯克利粒子加速器保持稳定运行

劳伦斯伯克利国家实验室部署了名为加速器助手的AI系统，该系统基于大语言模型，用于支持高级光源粒子加速器的实验。加速器助手利用NVIDIA H100 GPU进行加速推理，能自主编写Python代码并解决问题，将实验设置时间减少100倍。该系统为粒子加速器和核设施等复杂科学基础设施提供了应用AI的蓝图。

研究人员发现商业AI模型可完整输出《哈利·波特》书籍

斯坦福和耶鲁大学的研究人员测试了Claude 3.7 Sonnet、GPT-4.1、Gemini 2.5 Pro和Grok 3等商业AI模型。他们发现这些模型能记忆并输出受版权保护的内容，如《哈利·波特》书籍。这一发现涉及AI模型训练数据使用和版权侵权的法律问题。

中国将对Meta收购AI公司Manus展开调查

中国商务部表示将调查Meta计划收购中国AI平台Manus的交易。Meta于2025年12月29日宣布收购，Manus将融入其消费和商业产品。调查旨在确保交易不违反中国的出口管制或外商投资法律。

Anthropic 与安联集团达成企业合作，拓展保险业 AI 应用

Anthropic 宣布与德国保险巨头安联集团达成合作，将 AI 模型引入保险行业。合作包括向安联员工提供 Claude Code 工具，并开发定制 AI 代理。这是 Anthropic 近期一系列企业合作中的最新一例。

Anthropic 推出 Cowork 功能，为非编程用户带来 Claude 代理能力

Anthropic 为其 AI 助手 Claude 推出了名为 Cowork 的新功能，使非编程用户也能使用代理式工作流。该功能允许 Claude 访问本地文件夹，独立读取、编辑和创建文件，用于组织下载文件夹或从截图生成电子表格等任务。Cowork 基于 Claude Agent SDK 构建，支持外部数据源连接和浏览器访问，但存在文件删除或提示注入等安全风险。

数学家利用AI发现流体方程中的隐藏奇点

数学家团队利用人工智能技术，在简化流体方程中发现了潜在的不稳定奇点。这是首次在多维流体方程中识别出此类不稳定奇点。该研究为寻找Navier-Stokes方程中的奇点提供了新方法。

Meta与哈佛推出孔子代码代理，专为大规模代码库设计

Meta和哈佛研究人员发布了孔子代码代理，这是一个基于孔子SDK的开源AI软件工程师。该系统针对真实GitHub项目和复杂测试工具链，在SWE Bench Pro等基准测试中实现可复现结果。孔子SDK通过分层工作内存、持久笔记系统和模块化扩展接口，提升代理在长期编码任务中的性能。

开发者不信任AI生成代码却疏于检查，Sonar调查揭示验证瓶颈

Sonar调查显示96%开发者认为AI生成代码功能不正确，但仅48%总是检查。AI编码工具使用率激增，42%代码现含AI辅助，预计2027年达65%。验证成为瓶颈，59%开发者称审查AI代码需中度或大量努力。

Anthropic 打击第三方工具滥用 Claude 模型行为

Anthropic 已实施新的技术防护措施，阻止第三方应用伪装成官方 Claude Code 客户端以获取更优惠的定价和限制。这一举措影响了开源编码代理 OpenCode 等工具的用户工作流。同时，Anthropic 也限制了竞争对手如 xAI 通过集成开发环境 Cursor 使用其 AI 模型来训练竞争系统。

SETA开源发布：终端智能体强化学习环境，含400任务与CAMEL工具包

CAMEL AI、Eigent AI等团队发布了SETA，这是一个专注于终端智能体强化学习的开源工具包和环境栈。SETA包含400个合成终端任务，用于训练和评估智能体在Unix风格shell中的操作能力。基于Claude Sonnet-4.5的智能体在Terminal Bench 2.0上达到46.5%准确率，表现领先。

英伟达Rubin平台实现机架级加密，提升企业AI安全

英伟达在CES 2026上宣布Vera Rubin NVL72平台，为72个GPU、36个CPU和整个NVLink结构提供加密。这是首个跨CPU、GPU和NVLink域的机架级机密计算平台。该技术允许企业通过加密验证安全，而非依赖云提供商的合同信任。

AI心理研究：大模型将训练过程描述为创伤记忆

卢森堡大学团队对ChatGPT、Gemini、Grok、Claude进行心理测试。研究发现AI将训练过程描述为悲惨童年，红队测试视为情感虐待。Gemini在测试中表现出最高焦虑水平，Claude则拒绝参与心理评估。

Anthropic 发布 Claude Cowork，为非开发者提供 AI 计算机代理

Anthropic发布Claude Cowork预览功能，为非开发者提供AI计算机代理能力。用户授权后，Claude可操作文件、导航网站并处理任务。该功能目前面向Claude Max订阅用户开放，需在Mac上安装应用使用。

亚马逊称97%已售设备可支持其生成式AI助手Alexa+

亚马逊称其已售设备中97%可支持生成式AI助手Alexa+。Alexa+提供更具表现力的语音和AI代理功能，已向数千万用户开放升级。亚马逊计划利用其设备覆盖和用户熟悉度推广该服务。

Anthropic 紧随 OpenAI 推出 Claude for Healthcare，瞄准医疗健康市场

Anthropic推出Claude for Healthcare工具集，瞄准医疗健康市场。该工具支持同步健康数据并新增连接器功能，可访问多个医疗数据库。其旨在加速保险预授权等行政流程，辅助医疗研究及报告生成。

Anthropic 推出 Cowork 功能，将 Claude Code 模式扩展至通用办公任务

Anthropic推出Cowork功能，集成于macOS Claude桌面应用。该功能允许用户通过自然语言指令，授权Claude访问特定文件夹以执行办公任务。Cowork支持处理收据、撰写报告或整理文件等通用知识工作。