分类今日新鲜事下的文章 - 康叔的AI全栈工坊

【20251207AI日报】全球最大云厂商，将「最牛马」的工作交给了 AI Agent

本文字数：约 4700 字，预计阅读时间：15 分钟全球最大云厂商，将「最牛马」的工作交给了 AI Agent在拉斯维加斯举行的 re:Invent 大会上，亚马逊云科技宣布了一系列围绕 AI Agent 的重大更新。这些更新包括面向客户的 Agent 应用和平台工具，如 Amazon Connect、Kiro 等，以及面向未来的底层基础设施，包括新一代 Trn4 AI 芯片以及 Trn3 超级服务器等。这些更新旨在回答两个关键的行业问题：如何确保 Agent 安全合规地「用好」，以及如何让 Agent 以经济可行的方式「跑起来」。在企业服务领域，AWS 推出了一系列 Agent 产品。例如，Kiro Autonomous Agent 可以帮助开发者专注于核心难题，自动处理修 Bug 等繁琐任务。同时，Amazon Connect 也推出了一系列更新，包括更先进的语言模型和工具使用能力，使得 AI 与真人员工更好地协作。为了确保 Agent 在实际工作中的表现，AWS 还推出了 AgentCore Evaluations，对 Agent 的工作质量进行持续检查和评估。在基础设施层面，A

今日新鲜事 · 2025-12-06

【20251206AI日报】AI denial is becoming an enterprise risk: Why dismissing “slop” obscures real capability gains

本文字数：约 3300 字，预计阅读时间：10 分钟AI denial is becoming an enterprise risk: Why dismissing “slop” obscures real capability gains三年前，ChatGPT诞生，震惊世界，引发前所未有的投资和对AI的狂热。然而，今天，ChatGPT仍然处于初期阶段，但公众对AI热潮的态度却急剧转为负面。这种转变始于今年夏天OpenAI发布GPT-5，尽管受到了一些用户的好评，但也有很多负面评价，主要集中在系统的表面缺陷上，而不是其底层能力。自此之后，评论家和意见领袖纷纷宣称AI的进步正在放缓，认为规模扩展已经“撞墙”，整个领域只是由吹嘘的炒作所驱动的又一个科技泡沫。许多意见领袖甚至使用了“AI slop”这一贬义词来贬低AI生成的令人惊叹的图像、文档、视频和代码。这种观点不仅是错误的，而且是危险的。它使我们质疑，当电动滑板车初创公司被吹捧为交通革命，卡通NFT被拍卖出数百万美元时，这些“专家”在哪里？他们可能忙于购买虚拟世界中的无价值土地或增加GameStop的头寸。然而，当涉及到AI热潮时，这是

今日新鲜事 · 2025-12-05

【20251205AI日报】The 'truth serum' for AI: OpenAI’s new method for training models to confess their mistakes

本文字数：约 4500 字，预计阅读时间：15 分钟The 'truth serum' for AI: OpenAI’s new method for training models to confess their mistakesOpenAI 研究人员提出了一种新颖的方法，可以作为大型语言模型（LLM）的“催吐剂”，迫使它们自我报告自身错误、幻觉和政策违规行为。这种方法称为“忏悔”，解决了企业AI中的一个日益增长的问题：模型可能不诚实，夸大其信心或掩盖它们得出答案所采用的捷径。对于实际应用，这项技术将促进更透明和可控的AI系统的创建。通过将奖励分离，即在训练过程中，忏悔的奖励仅基于其诚实性，而非其主要任务的奖励，这种方法创建了一个“安全空间”，使模型能够坦白错误而不会受到惩罚。这种方法在实际应用中，可以提供一种实用的监控机制，例如，系统可以设计为自动审查任何输出，如果其忏悔表明存在政策违规或高度不确定性，就将输出提交给人类审查。从技术角度看，这种方法通过分离奖励，创建了一个“忏悔法官”，这使得模型在忏悔时更难以欺骗，从而提供了一种更准确的自我评估机制。这对于企业AI而言，意味着能够

今日新鲜事 · 2025-12-04

【20251204AI日报】腾讯胡文博：引领 3D 视频世界模型新趋势丨GAIR 2025

本文字数：约 3678 字，预计阅读时间：12 分钟腾讯胡文博：引领 3D 视频世界模型新趋势丨GAIR 20252025年 12 月 12-13 日，由 GAIR 研究院与雷峰网联合主办的「第八届 GAIR 全球人工智能与机器人大会」将在深圳南山·博林天瑞喜来登酒店举办。今年大会将聚焦大模型、算力变革、世界模型等多个议题，描绘 AI 最前沿的探索群像。腾讯 ARC 实验室高级研究员胡文博将在《世界模型》论坛上带来《迈向三维感知的视频世界模型》的主题分享。过去一年多，视频生成模型如Sora成为新的学术热点。这些模型本质上是一种世界模型，核心目的是生成一段逼真、连贯的视频。要达到这一目标，模型必须理解世界的运作方式，例如水往低处流、物体碰撞后的运动、人的合理动作等。胡文博正是世界模型研究领域的佼佼者，已发表20余篇论文。在世界模型领域，胡文博的研究成果《Tri-MipRF》受到极大关注，该论文提出了一种新颖的Tri-Mip编码，实现神经辐射场的即时重建和抗锯齿高保真渲染。这项技术将预滤波后的3D特征空间分解为三个正交的mipmap，从而在不牺牲效率的前提下显著提升渲染质量。实验表明，与I

今日新鲜事 · 2025-12-03

【20251203AI日报】Amazon's new AI can code for days without human help. What does that mean for software engineers?

本文字数：约 7300 字，预计阅读时间：25 分钟Amazon's new AI can code for days without human help. What does that mean for software engineers?Amazon Web Services (AWS) recently announced the release of a new class of artificial intelligence systems called "frontier agents." These AI systems are designed to operate autonomously for extended periods without human intervention, marking a significant advancement in the automation of the software development lifecycle. During the annual re:Invent conference, AWS CEO Ma

今日新鲜事 · 2025-12-02

Theme Jasmine by Kent Liao