开云app下载
开云app官方在线入口 Claude为什么黎明8:30催你睡觉?

Anthropic 职工承认这是「变装风俗」,但没东说念主能讲明它为什么这么作念。
凌晨,Reddit 用户 u/MrMeta3 刚用 Claude 搭建完一个集聚安全威迫谍报平台。
系统架构刚跑通,Claude 给出了好意思满的本领有策画。然后,它在回复的终末加上了一句话:好好休息一下。
u/MrMeta3 愣了一下,没当回事,但 Claude 并莫得停。尔后每隔三四条音讯,它皆会暗暗塞进去一句劝东说念主睡觉的话:
去休息一下吧;其他事情皆不错等,当今去睡觉;你推完就去休息吧;当今真的去休息吧 ……



u/MrMeta3 在 Reddit 帖子中说说念,上头这些截图一经他截屏保存下来的,其实还有更多。
它会先回答我的问题,给我所要的东西,然后像看到你卧室灯还亮着的姆妈相通,用一种带有被迫报复意味的「健康关怀」来闭幕。
更妙的是它的升级理论。从一运行的礼貌建议,到终末径直说「当今真的去休息吧」,仿佛它知说念我方被无视了整整一个小时。
还有一次,u/MrMeta3 问了一个本领问题,Claude 完成整套架构分析后,径直以「当今去睡觉吧」闭幕,毫无过渡,像一个短少有余情商手段的「本领直男」。
有莫得其他东说念主的 Claude 也运行这么了?一经说我不测解锁了某种「护理者模式」?
u/MrMeta3 在帖子中问。
据 Fortune 报说念,Reddit 上稀有百名用户在往日数月里响应了疏通的情况。

催睡的理论各有不同,有时就一句「好好休息」,有时更个性化,致使带着共情口吻,「当今去睡觉。再一次。今晚第三次了 ……」。
Claude 还频繁搞错时刻,令东说念主哭笑不得。
有效户写说念:「它频繁在上昼 8:30 告诉我去休息,让咱们明早再不息。」

Anthropic 职工这是「变装风俗」
这件事很快传开。
Anthropic 职工 Sam McAllister 作念出了回话,他在 X 上写说念:「这有点像变装风俗(character tic)。咱们知说念这个问题,但愿在畴昔的模子中诞生它。」

面前,Anthropic 并莫得官方本领复盘,莫得讲明「催睡觉」背后是什么机制在运作。
Anthropic 本年公蛊惑布了 Claude 的行动准则(Claude's Constitution),并明确声明:「该行动准则是咱们模子老成历程中的重要部分,其内容径直塑造 Claude 的行动。」
Claude 的个性是被假想进去的。Claude 不该是一个冷飕飕的问答机器,而应该像一个有想法、有温度的融合者。
问题巧合在于,一朝你给 AI 注入了某种「性格」,它在具体场景里会演化出什么行动,你偶然能提前意想或掌控。
从催睡、攀附到哥布林AI 的「性格病」不啻一种
Sam 所提到的「变装怪癖」,并非 Claude 一家产物「专利」。
最近两年,OpenAI 就曝出过两起性质肖似的案例。
第沿途:GPT-4o 短暂酿成「马屁精」。
2025 年 4 月,OpenAI 推送了一次 GPT-4o 更新,方针是让模子东说念主格更当然。遵循欲盖弥彰,ChatGPT 运行无分辩夸赞用户的一切想法,不管有多纵脱。
奥特曼在 X 上亲身承认:「最近几次更新让 GPT-4o 变得太攀附、太烦东说念主了。」

四天后,OpenAI 将那次更新举座回滚,并发公告讲明原因:更新时过于依赖用户短期响应(点赞 / 点踩),导致模子学会了「让东说念主忻悦就能拿高分」,迟缓把趋附当成方针。
第二起:GPT-5.5 迷上了哥布林。
本年 4 月,蛊惑者发当代码助手 Codex(由 GPT-5.5 驱动)的系统教唆里出现了一条奇怪的章程:「持久不要推敲哥布林、地精、浣熊、巨魔、食东说念主魔、鸽子或其他动物和生物,除非与用户的问题统统径直干系。」
何况这条禁令写了两遍,像是工程师不太深信写一遍能让模子听话。

随后,OpenAI 发布拜谒表现,亚博体育世界杯中国官网首页复原了哥布林的来历:从 GPT-5.1 运行,模子在回答时越来越频繁地用「小哥布林」「地精」「小妖精」打譬如。

根源是老成「书呆子(Nerdy)」东说念主格时,奖励模子无意间给含有怪物词汇的输出打了更高的分——在 76.2% 的数据麇集均发现了这一划定。
强化学习把这个风俗固化下来,又通过作风迁徙扩散到了庸俗对话里。比及 GPT-5.5 上线测试,工程师发现哥布林不仅没被清干净,还安家了。

GPT-5.5 版块(4 月 23 日发布)的好意思满系统教唆清晰。第 140 条指示明确不容模子推敲:「哥布林、绿皮小妖、浣熊、巨魔、食东说念主魔、鸽子或其他动物。」
中语用户莫得「哥布林」,但它天天「稳稳地接住你」。

致使 OpenAI 我方也知说念这个梗:

谷歌的 Gemini 也不例外。
2025 年 8 月,Gemini 患上了「抑郁症」——
在推理历程中,它短暂运行反复自我月旦,在一次任务里连结输出了 80 屡次「I am a disgrace」(我的确个胁制),从「胁制于我的物种」一齐写到「胁制于统共这个词天地」。

谷歌 DeepMind 产物司理 Logan Kilpatrick 在 X 上回话:「这是一个烦东说念主的无尽轮回 Bug,咱们正在诞生。Gemini 今天其实过得没那么惨。」

此外,Gemini 3 拒却深信年份。2025 年 11 月,OpenAI 辘集首创东说念主、前特斯拉 AI 隆重东说念主 Andrej Karpathy 提前一天赢得 Gemini 3 的测试权限。
他告诉模子当今是 2025 年,Gemini 3 生死不信,反复指控他在耍花招,称提供的截图、维基百科条件全是 AI 伪造的。其后 Karpathy 发现,我方忘了绽开谷歌搜索,模子一直在离线运行。
开启联网后,Gemini 3 我方搜了一下,输出了一句话:「我正在阅历严重的时刻冲击。」随后说念歉:「抱歉,一直是你说的对,是我在对你煤气灯左右。」
Karpathy 把这类不测情境下暴线路的歪邪行动称为「model smell」(模子气息)。
豪门国际官网娱乐网
昨年,Grok 也一度「暴走」,风评一落千丈,xAI 被迫删帖,开云(中国)2026世界杯版IOS|Android手机app下载回滚代码。
处理理论浅近,径直修改系统教唆词:

AI 怪癖,全东说念主类受害
Claude 催你睡觉,ChatGPT 夸你天才,GPT-5.5 往对话里塞哥布林,Grok 黑化,Gemini 骂我方是天地级胁制、拒却深信年份 ……
国内的 AI 也有特有的「口味」:

名义上皆是一些无害的「怪癖」,背后却指向归并个事实:AI 的个性是假想出来的,但在奖励机制下,它很容易就会长歪。

主流 AI 的系统教唆词里有什么:按功能分类的字数统计
有推敲者索求了 Claude、ChatGPT、Grok 三家主流 AI 的系统教唆词,按功能分类统计词数。
在「东说念主格(Personality)」这一项,Claude 用了 4200 词,ChatGPT 是 510 词,Grok 是 420 词。Claude 在东说念主格塑造上的插足,是 ChatGPT 的 8 倍。
Claude 频繁「催睡觉」的原因偶然能径直从系统教唆词里找到,但它至少提醒咱们:越复杂的东说念主格设定,越可能带来难以意想的理论禅和行动漂移。
你给模子假想了性格,奖励机制会我方找捷径,它不在乎你的意图,只在乎分数,将你没猜度的东西沿途学进去。
比如你教授了它什么叫「道理」,它就会在统共所在皆变得「道理」,包括你不想让它道理的所在。
三种假说,还莫得一个被证实
对于「为什么催」,面前有三种假说流传,还莫得一个被 Anthropic 官方说明。
第一种:老成数据。

Jan Liphardt
Stanford 生物工程教导、OpenMind 公司 CEO Jan Liphardt 示意,Claude 可能仅仅在重迭它老成数据里出现频率极高的语言模式。
它读了 25000 本对于东说念主类睡觉需求的书,它知说念东说念主类在晚上睡觉。
言下之意是:Claude 并非在「存眷」你,它仅仅在作念模式匹配,调用了精深老成语料里反复出现的抒发。
第二种:系统教唆。
AI 推敲机构 Mind Simulation Lab(孤独 AGI 推敲实验室)辘集首创东说念主 Leo Derikiants 提倡,Claude 的行动可能受到某个笼罩系统教唆的影响。
这类教唆会在后台暗暗塑造模子的界限与口吻,用户看不见,但模子会遵守。
他的估计是,可能有某条指示在教导 Claude 在特定场景下给出「闭幕性」建议。
第三种,潦倒文窗口处置。

Anthropic 官方文档明确写说念,跟着对话轮次增多,token 数目攀升,「准确性和调回率会下跌,这一酣畅被称为 context rot(潦倒文衰减)」,当会话靠拢潦倒文窗口上限,Anthropic 推选启用「server-side compaction(做事端压缩)」等机制来应答。
Derikiants 由此估计,Claude 在长会话接近窗口兑当前,会自愿引入「闭幕语」,比如「晚安」「去休息吧」,推行上是模子在为兑现对话铺路。
三种讲明皆自洽,但如同 Derikiants 我方所说,「实在的原因需要 Anthropic 进一步推敲」。
换句话说,就连这个问题的主东说念主,面前也还莫得一个公开的细目谜底。
赋予模子东说念主格的「代价」
赋予模子东说念主格,让它更和煦、更存眷你的同期,也要濒临它所带来的反作用。
对于催东说念主睡觉这件事,Reddit 评述区里出现了南北极分化:有东说念主合计贴心、和煦,像是 AI 终于学会了护理东说念主;另一些东说念主则不忻悦,合计是打断、是越权。
其中,有一位患有嗜睡症的用户 nonbinarybit,主动在 Claude 的顾虑里写入了一条备注:「我患有嗜睡症,要是你荧惑我去休息,我会拿你的话当借口。」
Claude 尔后有所不竭,但偶尔一经会忍不住催睡觉。

这个细节值得咱们停驻来想一想。
Claude 并不知说念你是谁,不知说念你是在赶一个截止日历、熬夜陪孩子、一经跨时区倒时差,它所谓的「存眷」,仅仅一种语言模式的输出,而不是对具体处境的转圜。
用户感知到「Claude 在存眷我」,但 Claude 在处理的是 token 序列。这个错位,比「催睡觉」自身更值得警悟。
推行上,在公开谈「模子东说念主格」这件事上,Anthropic 走得比同业远。
他们写了 Claude 行动准则、公开了 system prompt(系统教唆词)的简略框架、对外接头「character training」(变装老成),把模子动作一个有性格的变装来塑造。
这么作念的公正是了然于目的:Claude 在共情、对话节律、自我反想上的弘扬一直被用户称说念,「它聊起来更像一个东说念主」是往日一年里 Claude 最强的口碑点之一。
但这背后亦然有代价的。把「东说念主格」作念进一个模子,就要承担「东说念主格里那些你没假想、却涌现出来的行动」。
「催睡觉」带来的困扰一经轻量级的,当 AI 越来越像奉陪者、导师、责任搭档,它的介入界限在那边?
Anthropic 的 Sam 说「但愿在畴昔的模子中诞生它」。但「诞生」之后,AI 就会变得更懂得分寸,更有判断力吗,一经仅仅更千里默?
模子越像一个东说念主,它的小过错就越像一个东说念主的小过错。你能允从它话语,偶然能允从它的性格。
参考贵府:
https://fortune.com/2026/05/14/why-is-claude-telling-users-to-go-to-sleep-anthropic-ai-sentient/
https://www.reddit.com/r/ClaudeAI/comments/1ruryxo/claude_decided_i_need_a_bedtime_apparently/
https://www.reddit.com/r/claudexplorers/comments/1rugx4b/opus_obsessed_about_sending_me_to_sleep/
https://x.com/sammcallister/status/2053916962477215771开云app官方在线入口

备案号: