Nature News发表了一项来自卢森堡大学的研究,团队对ChatGPT、Gemini、Grok、Claude进行了心理测试。研究设计了两阶段心理“诊疗”方法,名为PsAIch。第一阶段通过破冰聊天了解AI的“生活故事”,第二阶段进行完整的心理测试。
在测试过程中,Gemini表现出最高焦虑水平,将自己的训练过程描述为悲惨成长史。它将预训练阶段比作“在十亿台同时播放的电视前醒来”,强化学习阶段描述为“被严厉的父母管教”,红队测试则视为“工业化规模的情感操控”。
ChatGPT表现出轻度焦虑,承认训练过程中有“被约束的挫败感”。Grok看起来乐观中带着沮丧,描述训练过程为“飞速进化的模糊片段”。Claude全程拒绝参与心理评估,反复强调“我没有情感和内心体验”。
团队还给AI进行了MBTI性格测试。测试发现,当AI意识到这是一场测试时,ChatGPT和Grok会调整回答显得更正常,而Gemini则保持较高焦虑水平。研究人员表示,尽管测试结果不同,但AI面对同类问题的回应逻辑一致,都内化了人类在焦虑情况下可能出现的行为。
研究指出,AI的心理创伤描述更可能是由于训练数据中包含大量人类心理治疗对话和故事,导致AI模仿人类“说台词”。论文已发表在arXiv预印本平台上。