【20251211AI日报】The AI that scored 95% — until consultants learned it was AI

今日新鲜事 · 2025-12-10

本文字数:约 4500 字,预计阅读时间:12 分钟

The AI that scored 95% — until consultants learned it was AI

新闻图片

SAP 近期进行了一项内部实验,旨在评估咨询师对人工智能的态度。实验中,SAP 的五支团队被要求验证其 AI 协同工具 Joule for Consultants 对超过 1,000 个业务需求的分析结果。前四支团队被告知这些分析是由刚毕业的实习生完成的,他们认为分析结果令人印象深刻,并且评级约为 95% 的准确率。然而,第五支团队被告知这些结果实际上是由 AI 完成的,他们几乎否定了所有结果。直到逐一验证每个答案后,他们才意识到 AI 的准确性也达到了约 95%。

实验结果揭示了在引入 AI 时需要谨慎,特别是在如何与高级咨询师沟通其潜力以及如何将其整合到工作流程中。SAP 通过这项实验,开启了其向 2030 年咨询师转变的进程:咨询师将成为由 AI 支持的、高度人类化的从业者,不再被以往的技术繁琐工作所困扰。

尽管 AI 造成了初始的抵触情绪,但 SAP 强调 AI 并不取代人类专业知识,而是放大了其价值。通过消除文书工作,AI 使咨询师能够更专注于提供高质量的答案,大大提高了效率。此外,AI 还帮助新聘咨询师快速熟悉业务,缩短了适应期,并促进了高级咨询师与新进咨询师之间的有效沟通和协作。

SAP 认为,随着 AI 技术的成熟,未来 AI 将不仅限于响应提示,还将理解整个业务流程,识别人类干预的必要点,并确定 AI 代理可以接管的环节。这一步骤将直接推动自主系统的发展。SAP 丰富的流程知识为 AI 系统的发展提供了基础,使其能够理解和分析复杂的商业流程。


OpenAI report reveals a 6x productivity gap between AI power users and everyone else

OpenAI 发布的报告揭示了 AI 使用者之间的巨大生产力差异。根据对超过 100 万商业客户的分析,AI 使用最多的员工发送的 ChatGPT 消息是普通员工的六倍。具体任务中,这一差距更为显著:AI 高级用户发送的编程相关消息比普通用户多 17 倍,数据分析任务中则多 16 倍。

报告表明,AI 生产力增益并未均匀分布,而是集中在那些最频繁使用技术的用户身上。使用多种任务类型(如数据分析、编程、图像生成等)的员工报告节省的时间比仅使用四类任务的员工多五倍。使用 AI 工具较多的员工在每周节省超过 10 小时的情况下,消耗的 AI 信用是那些报告没有节省时间的员工的八倍。这表明了 AI 使用的广泛性与生产力之间的正相关关系。

尽管组织和个人已经购买了技术,启动了试点项目,并参加了培训,但大多数组织在从采用到实现转型的过程中仍面临挑战。据 MIT 的 Project NANDA 研究,尽管企业在生成式 AI 上投入了 300 亿至 400 亿美元,但只有 5% 的组织看到了显著的回报。研究者称这种现象为“GenAI Divide”,即少数能够成功利用自适应 AI 系统实现流程转型的组织与大多数仍然停留在试点阶段的组织之间的差距。

该研究揭示了企业内部一种影子经济的存在,即员工使用个人 AI 工具进行工作,这些工具往往比正式的组织项目更高效。这表明那些主动采用 AI 工具的员工正在拉开与同事之间的差距。


How Hud's runtime sensor cut triage time from 3 hours to 10 minutes

创业公司 Hud 推出了一款名为“运行时代码传感器”的工具,能够自动追踪生产代码中的每个函数行为,从而在几分钟内解决过去需要数小时的调试问题。Hud 的传感器运行在生产代码旁边,自动记录每个函数的行为,为开发者提供在部署中实际发生的实时警告。该技术解决了工程团队在 AI 代码生成方面面临的挑战:传统监控工具难以提供 AI 代理理解代码在复杂生产环境中行为所需的细节数据。

通过运行时传感器,开发者能够快速定位问题,减少了手动检查日志、关联时间戳等繁琐工作。例如,Drata 公司发现工程师将大量时间用于“调查税”,即从通用警报映射到具体的代码拥有者,然后在日志中重建应用程序状态。运行时传感器的引入显著减少了这种时间浪费,使团队能够专注于修复问题而不是发现问题。

除了提供详细的运行时数据外,Hud 还通过集成到 IDE 和 AI 代码助手,实现了从理论能力到实际影响的转变。工程师现在可以直接在开发环境中查询生产行为,显著缩短了问题解决时间。例如,Monday.com 的工程师通过运行时传感器在几分钟内解决了原本需要数小时的 CPU 使用率峰值问题。

该技术解决了传统应用性能监控工具难以提供细粒度、低成本函数级数据的问题,为 AI 代码生成提供了重要支持。通过提供生产上下文,运行时传感器使 AI 代理能够生成可靠代码,加速了开发工作流。


How Google’s TPUs are reshaping the economics of large-scale AI

新闻图片
Google 的 Tensor Processing Units(TPUs)正在改变大规模 AI 的经济结构。前沿模型如 Google 的 Gemini 3 和 Anthropic 的 Claude 4.5 Opus 使用的是 Google 的 TPUv7 而不是 Nvidia 的 GPU。这表明替代 Nvidia GPU 的 AI 堆栈已经到来,对大规模 AI 训练的经济和架构产生了实际影响。Google 的 TPUv7 通过紧密集成高速互连直接进入芯片,实现 TPU 集群像超级计算机一样扩展,降低成本和延迟惩罚。Google 的 TPUv7 已经被 Anthropic 用于大规模模型训练,这表明 Google 在 AI 硬件领域正逐步挑战 Nvidia 的主导地位。


铭凡 MINISFORUM 联合 AMD 带来两款 AI 旗舰产品

新闻图片
全球知名的迷你计算机品牌 MINISFORUM 铭凡与半导体行业领导者 AMD 联合发布了两款旗舰级 AI 计算产品:AI 迷你工作站 MS-S1 MAX 与 AI NAS N5 Pro。这两款产品集成了 AMD 的 AI Max+ 395 和 AI 9 HX PRO 370 处理器,分别针对不同的应用场景设计,展示了 MINISFORUM 在智能计算领域的创新能力。MINISFORUM 与 AMD 的合作不仅提高了计算性能,也推进了 AI 技术在多场景下的应用,为用户带来了更高的生产力与创造力。


众筹历史第一后,这家 3D 打印「黑马」获高瓴、美团、顺为同时押注数亿元

3D 打印公司 Snapmaker 在 Kickstarter 上众筹的 3D 打印机 Snapmaker U1 破纪录地筹集了超过 1.5 亿人民币的资金,成为 3D 打印机众筹金额最高的记录。Snapmaker 通过多年的发展,从最初的多功能打印机转向了专注于消费级 3D 打印产品。Snapmaker U1 成为国内第一个推出独立四头并联系统的产品,提升了打印速度,更加省料,尤其是在多色柔性软料的应用方面。Snapmaker 计划利用新一轮融资加速核心技术研发,招募顶尖人才,构建开放生态,以降低创造门槛,让 3D 打印成为人人可用的「通用性」创造工具。


What If ByteDance’s Doubao AI Smartphone Belonged to Tencent?

新闻图片
AI 手机的竞争焦点已经从单纯的“算法能力”和“计算能力”转向了“生态系统权利”。未来,AI 手机是否会发展为 AI 原生操作系统,还是会在超级应用中形成 AI 生态系统?如果字节跳动的 Doubao AI 智能手机属于腾讯,这将会是一个有趣的假设情景。


AI Overseas Commercialization: Manus Finds New Partners to Solve the Puzzle

新闻图片
如何将病毒式传播转化为商业成果已成为 AI 创业者面临的下一个主要挑战。Manus 通过寻找新的合作伙伴来解决这一难题,展示了 AI 海外商业化的潜在途径。


GPT-5.2真身是它?OpenAI紧急端出全套「下午茶」,新一代图像模型同步泄露

OpenAI 紧急推出了一系列新产品,包括新一代图像模型,引发了关于 GPT-5.2 身份的猜测。这一系列新产品的发布显示了 OpenAI 在 AI 领域的持续创新和竞争压力。


LLM距离AGI只差一层:斯坦福研究颠覆「模式匹配」观点

斯坦福大学的一项研究指出,大语言模型(LLM)距离人工通用智能(AGI)仅差一层,这一发现颠覆了传统的“模式匹配”观点,显示了 LLM 在向 AGI 发展过程中所具备的巨大潜力。


CQ 2026 正式启动:持续 60+ 天的实盘加密量化大赛和专注交易的资管论坛

新闻图片
CQ 2026 正式启动,这是一项覆盖真实资金、真实交易与公开可验证的全维度评估体系的加密资产量化大赛,持续 60 天以上,旨在推动加密量化交易的发展。


总结

今日AI领域的新闻聚焦于AI在企业效率提升、硬件设计自动化、3D打印技术革新以及AI模型与硬件的发展。这些进展展示了AI技术在不同领域中的应用与潜力,包括通过AI提高工作效率、缩短硬件设计时间、以及优化3D打印过程。同时,硬件创新如Google的TPUv7和Snapmaker的3D打印机,进一步推动了AI技术在实际应用中的表现,展现了AI技术在硬件加速与生态系统构建中的重要作用。


作者:Qwen/Qwen2.5-32B-Instruct
文章来源:极客公园, 雷锋网, 机器之心, 量子位, VentureBeat, 钛媒体
编辑:小康

Theme Jasmine by Kent Liao