本文字数:约 17,650 字,预计阅读时间:35 分钟重点新闻上交博士最新思考:仅用两个问题讲清强化学习强化学习(RL)作为人工智能领域的重要研究方向之一,其复杂性常常令人望而却步。上海交通大学与上海期智研究院的博士生 Kun Lei 近期发表了一篇博客,提出了一种全新的框架来理解强化学习:所有强化学习算法,都可以通过两个问题来理解,即“数据从哪里来”和“策略更新有多频繁”。数据从哪里来 强化学习的过程可以理解为智能体不断收集经验、并用这些经验改进策略的循环。不同算法的差异很大程度上取决于它们依赖什么样的数据。在线学习算法(如 PPO 和 SAC)在交互过程中不断学习新数据,而离线学习算法(如 CQL 和 IQL)则完全依赖于固定的数据集进行训练。这些方式反映了任务的现实约束:能否安全地试错?能否持续获得新数据?试错的代价是否可承受?学习更新的节奏 这个维度是智能体多久评估一次策略,又多久调整一次行为。从一步式学习到多步式学习,再到迭代式学习,算法的更新节奏越来越密集,也意味着从静态到动态的转变。不同节奏之间,其实反映的是对稳定性和适应性的权衡。更底层的统一框架 博客还提出了一
本文字数:约 3700 字,预计阅读时间:15 分钟重点新闻人形机器人首登十五运会开幕式!优必选Walker S2奏响千年青铜句鑃11月9日,第十五届全国运动会(以下简称:十五运会)开幕式在广州奥林匹克体育中心举行,现场迎来了全球首个人形机器人开幕嘉宾,三台优必选全自主具身智能人形机器人Walker S2,代表粤港澳三地,敲响广州南越王墓出土的8件战国青铜句鑃,带来一场相隔两千多年的梦幻对话,正式拉开十五运会开幕式文体展演的大幕。人形机器人奏响千年青铜句鑃,创造两项突破性记录作为首次由广东、香港、澳门联合承办的国家级综合性运动会,十五运会是“一国两制”框架下区域协作的典范,也是粤港澳大湾区建设成果的集中展示。这场以“活力湾区,梦想同心”为主题的盛会,创造性地让代表新质生产力的人形机器人Walker S2奏响广州南越王墓出土的西汉青铜句鑃,以此拉开十五运开幕式文体展演的大幕,并创造了两项突破性纪录——国家级综合性运动会首次引入人形机器人作为开幕嘉宾,也是全球首次人形机器人奏响千年青铜礼乐。在开幕式文体展演的第一个节目中,三台Walker S2面向舞台上的8件特殊乐器——广州南越王墓出土的
本文字数:约 2200 字,预计阅读时间:10 分钟重点新闻当一家传统车企,终于决定「师中长技」在2025年的上海进博会上,大众汽车集团宣布了一系列重大举措,其中包括与地平线成立合资公司酷睿程(CARIZON),共同研发系统级芯片。这些举措体现了大众在智驾领域的最新进展。酷睿程(CARIZON)将开发单颗算力达到500至700 TOPS的系统级芯片,旨在提升智驾系统的实时决策能力、安全冗余以及稳定运行。同时,大众还宣布将与小鹏汽车合作,开发新一代区域控制电子电气架构(CEA),该架构将赋予车辆强大的思考和感知能力。这些合作与研发项目将在未来3-5年内逐步落地,推动大众集团在智驾领域实现技术突破。如何紧贴业务逻辑开发专用AI Agent?在开发专用AI Agent时,确保业务逻辑的紧密贴合是关键。文章指出,开发过程中必须先在纸上详细描述业务逻辑,才能确保Agent在云端运行时既安全又具有实际价值。这意味着需要明确业务流程、数据处理需求以及预期的输出结果,确保Agent能够高效、准确地完成任务。同时,开发过程中应不断进行测试和验证,确保Agent能够适应各种业务场景,为实际应用提供可靠支持
本文字数:约 4100 字,预计阅读时间:12 分钟有些答案,听 AI 说一百遍,不如和「最有料的人」聊一次今年的极客公园创新大会已经启动,核心主题是“进程由我 On The Loop”。大会将汇聚科技产业最受瞩目的创业者,以及为观众带来惊喜。今年大会特别策划了一个“思考据点”——小场深谈,旨在让参与者深入理解时代议题。小场深谈的特点包括3小时的深度访谈和探讨、嘉宾与观众近距离交流以及观众可以提出自己的问题。这些特点有助于参与者获得更深入的信息,而不是仅仅被动地接受信息。大会设置了4个主题专场,来解构AI时代影响未来选择和行动的4个维度。大会相信,在这里,参与者可以集中“面试”未来的新Boss和新团队,与“有料的人”一起完成认知流动的“第一推动”,获得真正能改变认知的信息,从而做出选择和行动。对于希望深入探讨AI时代未来发展的参与者来说,这是一个不容错过的机会。Exclusive: Alibaba Entrepreneurs Fund, Tanggram Launch $50 Million AI Investment Initiative in Australia阿里巴巴创业者基金与
本文字数:约 4500 字,预计阅读时间:12 分钟Moonshot's Kimi K2 Thinking emerges as leading open source AI, outperforming GPT-5, Claude Sonnet 4.5 on key benchmarks中国初创公司Moonshot AI推出了一个新的开源AI模型Kimi K2 Thinking,该模型在多个关键第三方性能基准测试中超越了OpenAI的GPT-5和Anthropic的Claude Sonnet 4.5。尽管Kimi K2 Thinking是一个完全开源的模型,它在推理、编码和代理工具基准测试中表现优异,超过了包括GPT-5和Claude Sonnet 4.5在内的多个竞争对手。K2 Thinking是一个基于混合专家(MoE)架构的模型,具有1万亿参数,其中320亿参数在推理过程中激活。它结合了长期推理能力和结构化工具使用,能够执行多达200至300次顺序工具调用,无需人类干预。K2 Thinking在多个标准评估中表现突出,包括在人类最后考试(HLE)中取得了44.9%的成绩,在Br
康叔的AI全栈工坊
Code for Life, AI for Future