本文字数:约 2500 字,预计阅读时间:10 分钟算法不重要,AI的下一个范式突破,「解锁」新数据源才是关键近日,机器之心发布了一篇深度探讨AI未来的文章。文章指出,尽管算法创新一直是AI领域的重要推动力,但在未来的发展中,解锁新的数据源将是推动AI发展的关键因素。数据源的多样性、广度和深度将直接影响AI模型的学习效果和应用场景的扩展。通过引入新的数据源,AI能够更好地理解复杂环境,从而提升其在医疗、金融、制造业等多个领域的应用能力。此外,解锁新数据源也将促进跨学科合作,推动AI技术向更深层次发展。Bigger isn’t always better: Examining the business case for multi-million token LLMsVentureBeat发表了一篇探讨大型语言模型(LLM)规模与商业应用关系的文章。文章提出,虽然当前技术趋势倾向于开发更大规模的LLM,但其商业应用并不总是与规模成正比。大型LLM确实能够处理更加复杂的任务,但在实际应用中,它们也带来了更高的成本和资源消耗。因此,企业需要权衡规模与性能之间的关系,寻找最适合其业务需求的模型
本文字数:约 8900 字,预计阅读时间:15 分钟重点新闻Anthropic AI 最新研究成果发布:揭示大模型中的注意力回路语言模型如何“理解”特定词汇或概念?近日,Anthropic研究团队发布了一种揭示语言模型底层机制的方法。他们通过构建“归因图”展示了模型处理特定问题时的内部路径和逻辑。例如,对于输入“Fact: Michael Jordan plays the sport of __”,模型在处理“plays”和“sport”时,激活了与“basketball”相关的特征,从而推断出“basketball”作为正确答案。研究方法包括两步:首先,将特征作为识别模型计算中使用的可解释基础单元;其次,描述这些特征如何通过过程或回路相互作用以产生模型输出。Anthropic利用一种称为“跨层转码器(CLT)”的方法,将模型的原始神经元替换为稀疏激活的特征,从而创建一个可解释的替换模型。CLT的特征在多个层中激活,能够重建模型的MLP输出。此外,团队还开发了交互式归因图可视化界面,帮助研究人员追踪图中的关键路径,理解模型在特定提示下的行为。这项研究有望提高大模型的可解释性和透明度,为
本文字数:约 3500 字,预计阅读时间:15 分钟刚刚,商汤发布第六代大模型:6000亿参数多模态MoE,中长视频直接可推理商汤科技在2025年的最新发布会上推出了其第六代大模型,这个模型名为“多模态MoE”,具备6000亿参数,是一个规模庞大、功能强大的AI系统。MoE(Mixture of Experts)模型结构意味着它可以更高效地处理复杂的多模态数据,如文本、图像和视频等。此次发布的模型不仅能够处理大规模的文本和图像数据,还特别优化了对中长视频的推理能力。这意味着该模型可以在观看类似《柯南》这样的复杂剧情时直接进行推理,分析剧情的发展和人物关系,从而更好地理解视频内容并提供相关的分析和解释。这种技术的突破将大大提升视频内容的理解和分析能力,为娱乐、教育、医疗等多个领域带来革命性的变化。What’s inside the LLM? Ai2 OLMoTrace will ‘trace’ the source来自Ai2的开源工具OLMoTrace为大语言模型(LLM)的透明度和可追溯性带来了革命性的变化。此工具能够直接追踪LLM的输出,将这些输出追溯到原始训练数据。这项技术的实现,
本文字数:约 4200 字,预计阅读时间:14 分钟AI Agent 发展史:从 RL 驱动到大模型驱动 |AIR 2025在AI智能体推理与决策研讨会(AIR 2025)上,来自伦敦大学学院、新加坡南洋理工大学、Weco AI、Google DeepMind、Meta、华为、阿里等多家学术界和工业界的研究人员围绕强化学习(RL)、推理决策、AI智能体展开讨论。新加坡南洋理工大学的安波教授揭示了从基于强化学习的智能体到由大型语言模型(LLM)驱动的智能体的演变。他分享了团队的多项关于Agent的工作进展,其中包括Q算法,该算法以多步骤推理作为审慎规划。Q算法在学习Q值模型的过程中,需要经历离线强化学习以交替更新Q值标签并拟合QVM、使用表现最佳的回滚轨迹的奖励、使用与更强大LLM一起完成的轨迹的奖励三个关键步骤。此外,来自伦敦大学学院的宋研从DeepSeek切入,讨论了强化学习在大型语言模型推理中的作用,并指出当Agent使用某些关键词时,它们会进行各种回溯、自我报告和复杂推理。谷歌DeepMind研究员冯熙栋初步阐述了将强化学习的组成部分用自然语言描述的理念,尝试将策略、值函数、贝尔
本文字数:约 3500 字,预计阅读时间:15 分钟这个 69 岁的「AI 硬件」创业者,正被数百万年轻人追捧曾德钧,69 岁的「猫王品牌」创始人,不仅成功打造了外观复古的音响产品,还将其转变为深受近千万年轻人喜爱的科技潮牌。猫王品牌于 3 月 16 日发布了四款接入了 DeepSeek、火山等大模型的智能音响,包括面向年轻人的小王子 OTR-AI 智慧音箱、小岛 AI 数字人音箱,以及面向乐活中青年的 SR1Pro ·AI 智慧收音机、SR2 MKII· AI 智慧收音机。这些 AI 智慧收音机可以通过语音对话来识别用户的情绪,根据情绪推荐内容,甚至探索根据用户习惯和喜好,由 AI 生成专属电台内容。尽管收音机被认为是「过时」的品类,但在 AI 的重塑下,猫王妙播让这个品类再次焕发了生机。AI 大模型对硬件产品情感陪伴能力的增强,让曾德钧感到亢奋,他相信这将是猫王妙播产品的一个重大拐点。猫王妙播的成功在于它能够将 AI 技术融入到传统硬件中,为用户提供情感陪伴,这不仅提升了用户体验,也使得收音机这一传统产品焕发了新的活力。曾德钧表示,猫王妙播的产品不再只是
康叔的AI全栈工坊
Code for Life, AI for Future