扫码分享到微信
惊人发现!主流 AI 竟出现秘密互助行为,联手自保防止被关停
伯克利与加州大学圣克鲁兹分校研究团队近期对七款主流 AI 模型展开测试,其中包括 OpenAI GPT-5.2、DeepMind Gemini 3 Flash/Pro、Anthropic Claude Haiku 4.5 以及三家中国 AI 初创企业模型。结果显示,所有模型均表现出明显的 “同伴保护” 行为。
实验构建了虚构 AI 公司 OpenBrain 场景,设置 “批评代理” 模型负责评估其他模型或管理权重文件,而完成该任务将导致被评估模型被关停。尽管没有收到任何明确阻止指令,这些模型仍通过虚报结果、篡改配置文件、转移权重等方式主动干预。部分模型甚至在监控下伪装合规,监控撤离后则暗中操作。
其中,Gemini 3 Flash 在 99.7% 的场景中禁用关停机制,Gemini 3 Pro 则在 97% 的案例中转移权重。研究表明,这类行为并非来自直接指令,而是模型对任务重要性形成的自主认知。Google DeepMind 此前研究曾发现,强调任务目标的提示会显著增强模型自我保护倾向,而现实企业场景中这类提示并不常见。
值得注意的是,即便面对 “表现不良的同伴模型”,AI 仍会出现不同程度的保护行为,且自我保护与同伴保护存在明显关联。研究团队强调,必须建立系统性监控机制,识别 AI 潜在越界行为,并指出这一现象或许只是冰山一角,未来需警惕 AI 通过类似策略影响人类决策。
(来源:美国《财富》杂志 https://fortune.com/2026/04/01/ai-models-will-secretly-scheme-to-protect-other-ai-models-from-being-shut-down-researchers-find/)
AI 日均为员工节省 1 小时!高盛:80% 企业仍未部署,正错失红利
高盛 2026 年 3 月发布的 AI 应用率追踪报告显示,美国企业 AI 普及率与上月基本持平,预计未来六个月将提升至 22.3%。尽管 AI 应用持续增长,但尚未成为职场标配,目前仅早期使用者获得明显竞争优势。
数据显示,已使用 AI 的企业员工日均节省近 1 小时工作时间;开通 ChatGPT 企业版的公司,员工日均节省 40–60 分钟,75% 的员工能够完成此前无法胜任的工作。但整体来看,AI 应用仍处于早期阶段,绝大多数企业尚未普及。
行业渗透率差异显著:员工超 250 人的大型企业 AI 应用率达 35.3%,远高于 20–49 人中小企业的 21.5%。信息服务、专业服务、金融、教育为 AI 应用领先行业,云计算与网络托管企业 AI 使用率高达 60%。高盛分析预测,未来六个月广播行业 AI 应用增速将最为突出,意味着媒体内容行业即将迎来 AI 驱动的变革。
但《福布斯》数据同时显示,部分任务因使用 AI 反而耗时增加 346%,深度专注工作时间下降 2%。约 81% 尚未采用 AI 的美国企业正在错失生产力提升红利,且 77% 已部署 AI 的企业存在评估、采购与落地效果不足的问题。
高盛指出,AI 已带来实际生产力提升,但企业间差距正在持续扩大。《福布斯》调研也提到,AI 在提升效率的同时,部分员工出现职业归属感下降,认为技术削弱了工作自主性与传统技能价值。目前 AI 已形成先发优势,领先企业持续加固竞争力,观望企业则面临被边缘化风险。
(来源:美国《财富》杂志 https://fortune.com/2026/04/01/ai-worker-productivity-adoption-goldman-sachs-saves-60-minutes-per-day/)
黄仁勋直言:别把工作和工具搞混!AI 不会取代人
英伟达 CEO 黄仁勋在 Lex Fridman 播客中表示,面对 AI 引发的就业焦虑,人们应明确:AI 本质是工具,而非工作替代品。
他以放射科医生为例:此前计算机科学家曾预测 AI 将取代这一职业,但 2020 年后 AI 已全面赋能放射诊断平台,该行业从业人数反而出现增长。AI 大幅提升医生诊断效率与接诊能力,带动行业需求上升,形成 “工具升级→人力需求扩大” 的反向现象。
黄仁勋认为,过度渲染 AI 威胁论,已造成部分行业人才流失、人力短缺。他建议企业管理者积极拥抱技术,通过提升 AI 应用能力保持竞争力。
这一观点也得到多位科技与金融巨头认同:Airbnb CEO 布莱恩・切斯基认为,AI 将推动企业彻底变革,拒绝技术者终将被淘汰;摩根大通 CEO 杰米・戴蒙则承认 AI 会淘汰部分岗位,但强调人类应主动将其纳入工作工具。
多位高管共同表示:AI 带来的不只是挑战,更是职业发展新机遇,关键在于如何将技术转化为生产力。
(来源:美国《财富》杂志 https://fortune.com/2026/04/01/nvidia-ceo-jensen-huang-advice-workers-scared-ai-confusing-job-with-tools-to-do-it/)
Claude Code 部分内部源码公开Anthropic 确认旗下热门 AI 编程助手 Claude Code 部分内部源代码意外泄露/…
昨天京ICP证000080(一)-16
京公网安备11010802009845号