造成这种现象的模式,在报告中被形象地称为“凭感觉编码”(vibe coding)——即主要基于信任来生成和发布代码的做法。如今,这种“凭感觉编码”已成为主流,而未经验证的信任,正酿成一场影响深远的生产危机 。
New Relic 并非唯一敲响警钟的机构。2026 年其他几份重磅行业报告,描绘了同样令人担忧的图景:
根本问题并不在于 AI 写出的代码有多糟糕,而在于一个速度上的算术悖论:AI 代码生成的速度是人类的 5 到 10 倍,但验证代码的速度仍然保持在 1 倍 。原本为人类工作节奏设计的代码审查流程根本无法消化 AI 爆炸式的输出,形成了一个巨大的验证瓶颈。这个瓶颈让不可靠的代码得以悄无声息地流入生产环境,为事故埋下伏笔。
2026 年 6 月 8 日,New Relic 直面这一脱节难题,宣布推出 New Relic AI Coding Observability 的开发计划。这是一款专为 AI 辅助软件开发设计的开源可观测性解决方案 。该功能定于 2026 年 6 月 23 日 发布,并将对 New Relic 现有客户免费开放,无需支付额外费用
。
其背后的架构设计非常关键。New Relic 特意将 AI Coding Observability 建立在两个开放标准之上:OpenTelemetry (OTel) 和 模型上下文协议 (MCP) 。这意味着团队不会被锁定在 New Relic 的专有遥测架构上,也不会被绑定到某一个特定的 AI 编码助手上。任何能够提供 MCP 兼容遥测数据的 AI 助手——无论是 GitHub Copilot、Cursor,还是 Claude Code 等——都可以接入这一层
。在一个 2027 年的主流编码工具未必是今天这位“优等生”的市场上,厂商中立性是一个至关重要的实用性考量。
New Relic 的战略赌注落在了“关联性”上。AI Coding Observability 的设计初衷,是标准化来自不同 AI 编码助手的遥测数据,并将其与现有生产环境中基础设施的监控数据无缝关联起来 。它的构想是打造一个统一的全景视图,让团队能够追溯一段 AI 生成的代码变更,从其产生的集成开发环境(IDE)开始,历经部署,最终进入生产环境——然后,直观地看到这段代码在数小时或数天后,是否与某个事故高峰存在关联。
在过去两年(2024-2025),CTO(首席技术官)们的焦点一直放在如何引入 AI 编码助手并提升开发效率。然而,New Relic、Lightrun、Faros、Sonar 等机构的数据已经明确无误地指出,下一阶段的焦点必须转移到验证、可靠性和成本问责上来。
94% 的代码审查信心并非完全没有道理。AI 通常确实能产出简洁、可读、语法正确且能通过静态分析的代码。真正的漏洞在于环境:AI 生成的代码在 Pull Request 这样窄小的沙盒环境里表现良好,但在面对复杂的生产数据、真实的用户行为和系统间相互作用时,就会暴露出问题。这是任何代码审查都无法完全模拟的复杂场景。
如果没有一套能同时覆盖开发和生产的可观测性体系,企业就相当于在用一个生产环境根本不认可的评分标准来做决策。New Relic 的 AI Coding Observability 是一次直接尝试,试图打通这个闭环,推动整个行业从“相信审核”迈向“生产验证”的新范式。
Comments
0 comments