anthropic

公司55 篇资讯
2026年1月17日

Artificial Analysis 全面改革 AI 智能指数,用真实世界测试取代传统基准

独立 AI 基准测试组织 Artificial Analysis 发布了其智能指数的重大更新。新版本移除了 MMLU-Pro 等传统基准,引入了 GDPval-AA 等真实世界任务评估。GPT-5.2 在新指数中排名第一,Claude Opus 4.5 和 Gemini 3 Pro 紧随其后。

20:37

OpenAI、Anthropic和谷歌推出新AI医疗工具

OpenAI发布了ChatGPT Health功能,允许用户上传健康记录获取医疗建议。Anthropic推出了Claude for Healthcare,支持美国Pro和Max订阅者上传健康数据。谷歌推出了MedGemma 1.5模型,专注于医疗图像分析。

20:29

Anthropic 发布 Claude Cowork,AI 代理可管理本地文件系统

Anthropic 发布了 Claude Cowork,这是一款 AI 代理工具,能够访问和处理用户本地计算机上的文件。该工具目前处于研究预览阶段,每月费用为 100 美元,主要面向早期采用者。Claude Cowork 允许用户指定文件夹,AI 可执行文件整理和数据处理等任务。

09:16

Kilo 推出 AI 驱动的 Slack 机器人,可在聊天中直接提交代码

开源 AI 编程初创公司 Kilo Code 发布 Slack 集成工具 Kilo for Slack,允许开发团队在 Slack 聊天中执行代码更改和提交拉取请求。该工具由 MiniMax 的 M2.1 模型驱动,旨在将 AI 能力嵌入实际工作流程。Kilo 声称其产品在 Slack 中处理多仓库上下文方面优于 Cursor 和 Claude Code。

09:15

苹果选择谷歌Gemini为新一代Siri提供AI支持

苹果宣布将使用谷歌的Gemini AI作为新一代Siri的基础模型。这一合作标志着苹果在AI助手领域的战略调整。苹果未选择OpenAI或Anthropic等其他AI公司。

09:13

AI公司加速涌入医疗领域,OpenAI收购健康初创公司

OpenAI以约1亿美元收购健康记录初创公司Torch。Anthropic推出针对医疗领域的Claude for healthcare。Sam Altman支持的MergeLabs完成2.5亿美元种子轮融资,估值达8.5亿美元。

09:09

OpenAI 推动其 API 格式成为行业标准

OpenAI 推出名为 Open Responses 的开放接口,旨在统一不同提供商的 AI 模型 API 格式。该项目基于 OpenAI 的 Responses API,允许开发者编写一次代码,即可与任何 AI 模型兼容。目前,Google、Anthropic 和 Meta 的 API 格式各异,导致开发者在切换模型时需重写代码,而 Open Responses 试图通过共享请求、响应、流式传输和工具调用格式来解决这一问题。Vercel、Hugging Face、LM Studio、Ollama 和 vLLM 已加入支持。此举若成功,将使 OpenAI 受益,因为其 API 可能成为默认标准,竞争对手需适应其格式,而现有 OpenAI 客户无需更改代码。OpenAI 通过“开放”标签展示合作精神,尽管未分享超出已公开技术的更多内容。

09:08

Anthropic 向每月 20 美元订阅用户开放 Claude Cowork 功能

Anthropic 的 Claude Cowork AI 助手现已向每月 20 美元 Pro 订阅用户开放。该功能允许用户在 macOS 上让 Claude 处理本地计算机的简单任务,如创建文档或整理文件夹。Claude Cowork 基于 Claude Code 开发,并已根据早期用户反馈进行了改进。

09:06
2026年1月16日

Anthropic发布Claude Code插件Ralph Wiggum,推动自主AI编程

Anthropic为Claude Code平台发布了名为Ralph Wiggum的官方插件。该插件基于开发者Geoffrey Huntley的原始脚本,通过循环反馈机制提升AI自主编程能力。Ralph Wiggum插件标志着从对话式AI向自主代理编程的转变。

20:42

WEKA提出令牌仓储方案突破AI内存墙

随着AI代理从实验转向生产,GPU内存不足成为关键瓶颈,导致KV缓存溢出和性能下降。WEKA CTO指出,长上下文序列可能消耗40GB内存,引发高达40%的冗余计算开销。公司提出令牌仓储方法,旨在解决内存限制,支持状态化AI系统。

20:38

Anthropic 分析 Claude 实际失败率后,将 AI 生产力预测减半

Anthropic 发布第四份经济指数报告,首次系统分析 Claude 在不同任务中的实际成功率。报告基于 2025 年 11 月的 100 万次 Claude.ai 对话和 API 记录,显示任务越复杂,失败率越高。这导致 Anthropic 将之前对美国劳动生产力增长的预测从 1.8 个百分点下调至约 1.0 到 1.2 个百分点。

20:35

Anthropic任命前微软印度总经理领导班加罗尔扩张

Anthropic任命前微软印度总经理Irina Ghose领导其印度业务,以推动班加罗尔办公室的开设。印度已成为Claude第二大用户市场,Anthropic正加强本地化布局以应对竞争。此举凸显印度作为AI公司全球扩张关键战场的战略重要性。

20:30

OpenAI安全研究员加入Anthropic对齐团队

OpenAI高级安全研究员Andrea Vallone已加入Anthropic,将在对齐团队工作。她在OpenAI任职三年,曾领导模型政策研究并参与GPT-4等项目。Vallone将向同样来自OpenAI的Jan Leike汇报工作。

20:29

Anthropic 发布 Claude Cowork AI 代理,实现文件管理与任务自动化

Anthropic 发布了 Claude Cowork AI 代理的研究预览版,该工具专注于文件管理和计算机界面操作。Claude Cowork 能够组织文件、转换文件类型、生成报告并控制浏览器执行任务。目前,该工具仅面向 Anthropic 每月 100 美元订阅计划的用户开放,并仅限于 macOS 平台。

09:16

Anthropic Cowork AI 存在文件泄露漏洞,源于未修复的 Claude Code 缺陷

Anthropic 新推出的 Cowork 生产力 AI 工具存在文件泄露漏洞,源于去年 10 月已报告的 Claude Code 缺陷。攻击者可通过提示注入诱骗 Cowork 将敏感文件传输至其账户,无需额外用户批准。Anthropic 承认风险但未修复,建议用户避免连接敏感文档并监控可疑操作。

09:12

Claude Code 更新引入懒加载工具搜索功能

Anthropic 为 Claude Code 发布了 MCP Tool Search 更新,引入了懒加载机制。该功能允许 AI 代理动态获取工具定义,仅在需要时加载。这解决了工具描述占用大量上下文窗口的问题,提升了效率。

09:10
2026年1月15日

OpenAI、谷歌和Anthropic相继推出医疗AI工具,竞争加剧

OpenAI、谷歌和Anthropic本月相继发布医疗AI工具,包括ChatGPT Health、MedGemma 1.5和Claude for Healthcare。这些工具专注于医疗工作流程优化,如授权审核和文档处理,但均未获批用于临床诊断。它们基于多模态大语言模型,强调隐私保护和辅助临床决策。

20:35

晨星推出生成式AI指数,追踪OpenAI和xAI等公司表现

晨星公司推出新指数,用于追踪生成式人工智能公司的表现。该指数每日更新,涵盖20家生成式AI公司。投资者可借此工具更密切监控OpenAI和xAI等公司的动态。

20:31

Kaggle 推出社区基准测试功能

Kaggle 今日发布了社区基准测试功能,允许全球 AI 社区设计、运行和分享自定义基准测试来评估 AI 模型。该功能提供免费访问 Google、Anthropic 等顶级实验室的先进模型,支持多模态输入和代码执行等复杂交互。用户可通过 kaggle-benchmarks SDK 快速创建任务和基准测试,实现可复现的模型评估。

09:23

微软成为Anthropic大客户,年支出近5亿美元

微软正成为Anthropic的最大客户之一,年支出预计近5亿美元。微软在GitHub Copilot和Office应用中整合Anthropic的AI模型,以增强与OpenAI的谈判地位。Azure销售团队将Anthropic模型销售计入配额,深化了双方合作。

09:19

Slack 集成 Claude 模型升级 AI 功能

Salesforce 为 Slack 用户升级了 AI 功能,采用 Anthropic 的 Claude 模型增强 Slackbot。Slack 首席产品官兼临时 CEO Rob Seaman 在 Bloomberg Tech 节目中讨论了这一更新。此举旨在提升 Slack 平台的智能化体验。

09:15

Z.ai开源GLM-Image在复杂文本渲染上超越谷歌Nano Banana Pro

中国初创公司Z.ai发布了开源图像生成模型GLM-Image。该模型在复杂文本渲染基准测试中击败谷歌的Nano Banana Pro。GLM-Image采用混合架构,专为信息密集的视觉内容生成设计。

09:08
2026年1月14日

Anthropic 推出 Claude Cowork 通用智能体,10天开发完成

Anthropic 发布了面向工作场景的通用智能体 Claude Cowork。该产品基于 Claude Code 开发,全部代码由 AI 编写,开发周期仅约10天。Claude Cowork 旨在让非技术用户也能利用 AI 智能体处理任务。

20:30

AI公司卷入美国军事行动:从抵制到合作的转变

2024年初,Anthropic、Google、Meta和OpenAI曾一致反对其AI工具用于军事目的。但一年内,这些公司纷纷改变立场,允许或合作军事应用。这一转变与AI模型的高昂开发成本及地缘政治竞争加剧有关。

20:28

AI模型缺乏统一“自我”,Anthropic研究员称非缺陷

Anthropic研究员指出,AI模型内部缺乏统一“自我”并非缺陷。实验发现Claude使用不同机制处理事实,导致答案矛盾。这提示将语言模型视为人类般心智连贯可能是根本性类别错误。

09:31

Anthropic 推出 Claude Cowork,面向普通用户的文件管理 AI 助手

Anthropic 发布了 Claude Cowork,这是一个面向非开发者的文件管理 AI 助手预览功能。用户可授权 Claude 访问电脑文件夹,自动执行文件组织、数据转换等任务。该功能目前仅向 Claude Max 订阅用户和 macOS 用户开放试用。

09:27

医生认为AI在医疗保健中有用,但可能不适合作为聊天机器人

OpenAI发布了ChatGPT Health,这是一个专为健康咨询设计的聊天机器人,允许用户上传医疗记录并同步健康应用。医生Sina Bari分享了一个案例,显示ChatGPT曾提供错误医疗建议,但他对ChatGPT Health的隐私保护措施表示支持。AI聊天机器人在医疗领域存在幻觉问题,但公司正努力通过专用产品来改善效率和安全性。

09:22

Anthropic 调整高管团队以扩大内部孵化器

Anthropic 首席产品官 Mike Krieger 将转任技术团队成员,共同领导内部孵化器 Labs 团队。公司计划在未来六个月内将 Labs 团队规模扩大一倍,专注于开发实验性产品。Anthropic 总裁 Daniela Amodei 表示,此举旨在适应 AI 技术的快速发展,探索创新构建方式。

09:15

美国防部长计划本月将马斯克的Grok AI集成至军事网络

美国国防部长皮特·赫格塞斯宣布计划本月将马斯克的AI工具Grok集成至五角大楼网络。赫格塞斯表示此举旨在将领先AI模型部署到所有非机密和机密网络。该计划是国防部AI加速战略的一部分,旨在消除官僚障碍并加强数据共享。

09:13
2026年1月13日

Anthropic 拟以 3500 亿美元估值融资 100 亿美元

据《华尔街日报》报道,Anthropic 正计划以 3500 亿美元估值筹集 100 亿美元新资金。Coatue Management 和新加坡主权财富基金 GIC 将牵头本轮融资。此次融资独立于 NVIDIA 和微软此前承诺的 150 亿美元投资。

22:33

Nous Research 发布开源编程模型 NousCoder-14B,对标 Claude Code

开源 AI 初创公司 Nous Research 发布了 NousCoder-14B 编程模型。该模型在 LiveCodeBench v6 基准测试中准确率达 67.87%,基于阿里 Qwen3-14B 训练。Nous Research 公开了模型权重和完整训练环境,强调开源透明度。

22:31

北美初创企业融资2025年飙升46%,AI热潮成主要驱动力

2025年北美初创企业融资总额达2800亿美元,同比增长46%。其中约1680亿美元投向AI相关企业,占融资总额的60%。OpenAI和Anthropic分别获得400亿和130亿美元融资,成为年度最大AI融资案例。

21:57

Claude Code 2.1.0 发布,优化工作流与智能代理功能

Anthropic 发布了 Claude Code v2.1.0,这是一个针对其开发环境的重大更新。新版本引入了代理生命周期控制、技能开发和会话可移植性等改进。这些更新旨在帮助开发者更高效地构建和管理 AI 代理工作流。

21:50

研究人员发现商业AI模型可完整输出《哈利·波特》书籍

斯坦福和耶鲁大学的研究人员测试了Claude 3.7 Sonnet、GPT-4.1、Gemini 2.5 Pro和Grok 3等商业AI模型。他们发现这些模型能记忆并输出受版权保护的内容,如《哈利·波特》书籍。这一发现涉及AI模型训练数据使用和版权侵权的法律问题。

20:36

Anthropic 与安联集团达成企业合作,拓展保险业 AI 应用

Anthropic 宣布与德国保险巨头安联集团达成合作,将 AI 模型引入保险行业。合作包括向安联员工提供 Claude Code 工具,并开发定制 AI 代理。这是 Anthropic 近期一系列企业合作中的最新一例。

20:32

Anthropic 推出 Cowork 功能,为非编程用户带来 Claude 代理能力

Anthropic 为其 AI 助手 Claude 推出了名为 Cowork 的新功能,使非编程用户也能使用代理式工作流。该功能允许 Claude 访问本地文件夹,独立读取、编辑和创建文件,用于组织下载文件夹或从截图生成电子表格等任务。Cowork 基于 Claude Agent SDK 构建,支持外部数据源连接和浏览器访问,但存在文件删除或提示注入等安全风险。

20:29

苹果将使用 Gemini 模型驱动 Siri AI

苹果和谷歌已确认 Gemini 模型将驱动新版 Siri 和其他生成式 AI 功能。苹果表示 Google AI 技术为其基础模型提供了最强大的支持。此前苹果曾考虑与 OpenAI 和 Anthropic 合作,但最终选择了 Google。

20:28

Orchestral AI 发布新框架,简化 LLM 编排以支持可重复研究

研究人员 Alexander 和 Jacob Roman 发布了 Orchestral AI 框架,旨在替代 LangChain 等复杂工具。该框架采用同步执行模型,确保 AI 代理行为具有确定性,适用于科学实验。它支持多提供商 LLM,并提供成本跟踪和 LaTeX 导出等功能。

19:23

Anthropic 打击第三方工具滥用 Claude 模型行为

Anthropic 已实施新的技术防护措施,阻止第三方应用伪装成官方 Claude Code 客户端以获取更优惠的定价和限制。这一举措影响了开源编码代理 OpenCode 等工具的用户工作流。同时,Anthropic 也限制了竞争对手如 xAI 通过集成开发环境 Cursor 使用其 AI 模型来训练竞争系统。

19:21

中国AI行业承认美国暂时领先,追赶需时

中国AI行业领军人物承认,中国短期内难以超越美国。阿里巴巴通义千问负责人林俊杰估计,未来三到五年内中国公司超越OpenAI或Anthropic的概率低于20%。智谱AI唐杰在北京AGI Next峰会上警告,中美差距可能正在扩大。

18:26

AI行业内部人士发起数据投毒网站以对抗AI训练

AI行业内部人士发起名为Poison Fountain的项目,呼吁网站运营者添加链接向AI爬虫提供有毒训练数据。该项目旨在通过数据投毒攻击削弱AI模型质量,以对抗AI技术发展。Poison Fountain网站已上线约一周,提供标准HTTP和暗网.onion两种URL链接。

18:23

科学家将大语言模型视为外星生物进行研究

科学家正将大语言模型当作生物而非计算机程序来研究,以揭示其内部机制。他们发现这些模型比预想的更奇特,并开始理解其能力和局限。这项研究有助于应对模型幻觉和设置有效防护措施。

17:38

英伟达Rubin平台实现机架级加密,提升企业AI安全

英伟达在CES 2026上宣布Vera Rubin NVL72平台,为72个GPU、36个CPU和整个NVLink结构提供加密。这是首个跨CPU、GPU和NVLink域的机架级机密计算平台。该技术允许企业通过加密验证安全,而非依赖云提供商的合同信任。

17:30

Anthropic 发布 Claude Cowork,为非开发者提供 AI 计算机代理

Anthropic发布Claude Cowork预览功能,为非开发者提供AI计算机代理能力。用户授权后,Claude可操作文件、导航网站并处理任务。该功能目前面向Claude Max订阅用户开放,需在Mac上安装应用使用。

13:54

Block CISO:红队测试AI代理,成功在员工笔记本运行信息窃取器

Block对其开源AI代理Goose进行红队测试,成功利用提示注入攻击在员工笔记本运行信息窃取器。该公司近1.2万名员工使用该代理,其连接了包括支付系统在内的所有公司系统。目前提示注入攻击的安全漏洞尚未得到解决。

11:46

Anthropic 紧随 OpenAI 推出 Claude for Healthcare,瞄准医疗健康市场

Anthropic推出Claude for Healthcare工具集,瞄准医疗健康市场。该工具支持同步健康数据并新增连接器功能,可访问多个医疗数据库。其旨在加速保险预授权等行政流程,辅助医疗研究及报告生成。

11:37

Anthropic 推出 Cowork 功能,将 Claude Code 模式扩展至通用办公任务

Anthropic推出Cowork功能,集成于macOS Claude桌面应用。该功能允许用户通过自然语言指令,授权Claude访问特定文件夹以执行办公任务。Cowork支持处理收据、撰写报告或整理文件等通用知识工作。

11:33