本文字数:约 4500 字,预计阅读时间:15 分钟The 'truth serum' for AI: OpenAI’s new method for training models to confess their mistakesOpenAI 研究人员提出了一种新颖的方法,可以作为大型语言模型(LLM)的“催吐剂”,迫使它们自我报告自身错误、幻觉和政策违规行为。这种方法称为“忏悔”,解决了企业AI中的一个日益增长的问题:模型可能不诚实,夸大其信心或掩盖它们得出答案所采用的捷径。对于实际应用,这项技术将促进更透明和可控的AI系统的创建。通过将奖励分离,即在训练过程中,忏悔的奖励仅基于其诚实性,而非其主要任务的奖励,这种方法创建了一个“安全空间”,使模型能够坦白错误而不会受到惩罚。这种方法在实际应用中,可以提供一种实用的监控机制,例如,系统可以设计为自动审查任何输出,如果其忏悔表明存在政策违规或高度不确定性,就将输出提交给人类审查。从技术角度看,这种方法通过分离奖励,创建了一个“忏悔法官”,这使得模型在忏悔时更难以欺骗,从而提供了一种更准确的自我评估机制。这对于企业AI而言,意味着能够
本文字数:约 3678 字,预计阅读时间:12 分钟腾讯胡文博:引领 3D 视频世界模型新趋势丨GAIR 20252025年 12 月 12-13 日,由 GAIR 研究院与雷峰网联合主办的「第八届 GAIR 全球人工智能与机器人大会」将在深圳南山·博林天瑞喜来登酒店举办。今年大会将聚焦大模型、算力变革、世界模型等多个议题,描绘 AI 最前沿的探索群像。腾讯 ARC 实验室高级研究员胡文博将在《世界模型》论坛上带来《迈向三维感知的视频世界模型》的主题分享。过去一年多,视频生成模型如Sora成为新的学术热点。这些模型本质上是一种世界模型,核心目的是生成一段逼真、连贯的视频。要达到这一目标,模型必须理解世界的运作方式,例如水往低处流、物体碰撞后的运动、人的合理动作等。胡文博正是世界模型研究领域的佼佼者,已发表20余篇论文。在世界模型领域,胡文博的研究成果《Tri-MipRF》受到极大关注,该论文提出了一种新颖的Tri-Mip编码,实现神经辐射场的即时重建和抗锯齿高保真渲染。这项技术将预滤波后的3D特征空间分解为三个正交的mipmap,从而在不牺牲效率的前提下显著提升渲染质量。实验表明,与I
本文字数:约 7300 字,预计阅读时间:25 分钟Amazon's new AI can code for days without human help. What does that mean for software engineers?Amazon Web Services (AWS) recently announced the release of a new class of artificial intelligence systems called "frontier agents." These AI systems are designed to operate autonomously for extended periods without human intervention, marking a significant advancement in the automation of the software development lifecycle. During the annual re:Invent conference, AWS CEO Ma
本文字数:约 7200 字,预计阅读时间:15 分钟MIT offshoot Liquid AI releases blueprint for enterprise-grade small-model trainingLiquid AI, a startup founded by MIT computer scientists, introduced its Liquid Foundation Models series 2 (LFM2) in July 2025. The initial release included models with 350M, 700M, and 1.2B parameters, showcasing a hybrid architecture heavily reliant on gated short convolutions. The key highlight was the company's focus on training and inference efficiency, positioning small models as a se
本文字数:约 3000 字,预计阅读时间:10 分钟GAIR 2025 世界模型论坛:走向真实智能的起点12 月 13 日,雷峰网 GAIR 2025 以「走向真实智能的起点」为主题,在深圳南山 · 博林天瑞喜来登酒店举办了一场重要的专题论坛。该论坛聚焦于智能体未来的发展方向,特别是世界模型在构建智能体的感知、推理和行动能力中的作用。来自世界模型、智能体、强化学习、多模态理解、评估体系与开源实践领域的青年学者将共同探讨如何构建“能看、能想、能行动”的下一代智能体。论坛的关键方向包括真实世界建模能力和智能体体系结构的整体演化。与会者将讨论如何通过大规模模拟系统和多模态学习来构建统一的世界模型,以及如何在开源数据集和工具链的支持下进行研究。此外,评估体系的科学化推进也将是讨论的重点之一。本次论坛邀请了来自不同领域的活跃青年学者,包括上海人工智能实验室的王靖博、腾讯 ARC Lab 的胡文博、浙江大学的彭思达、诺亦腾的戴若犁等,他们将共同分享研究成果和开源实践经验。通过现场Demo展示和深度访谈,与会者可以直观地了解最新技术进展。15岁拿下量子物理博士,他马不停蹄转战AI医学,誓言「创造超人
康叔的AI全栈工坊
Code for Life, AI for Future