Code for Life, AI for Future
本文字数:约 3500 字,预计阅读时间:15 分钟刚刚,商汤发布第六代大模型:6000亿参数多模态MoE,中长视频直接可推理商汤科技在2025年的最新发布会上推出了其第六代大模型,这个模型名为“多模态MoE”,具备6000亿参数,是一个规模庞大、功能强大的AI系统。MoE(Mixture of Experts)模型结构意味着它可以更高效地处理复杂的多模态数据,如文本、图像和视频等。此次发布的模型不仅能够处理大规模的文本和图像数据,还特别优化了对中长视频的推理能力。这意味着该模型可以在观看类似《柯南》这样的复杂剧情时直接进行推理,分析剧情的发展和人物关系,从而更好地理解视频内容并提供相关的分析和解释。这种技术的突破将大大提升视频内容的理解和分析能力,为娱乐、教育、医疗等多个领域带来革命性的变化。What’s inside the LLM? Ai2 OLMoTrace will ‘trace’ the source来自Ai2的开源工具OLMoTrace为大语言模型(LLM)的透明度和可追溯性带来了革命性的变化。此工具能够直接追踪LLM的输出,将这些输出追溯到原始训练数据。这项技术的实现,
本文字数:约 4200 字,预计阅读时间:14 分钟AI Agent 发展史:从 RL 驱动到大模型驱动 |AIR 2025在AI智能体推理与决策研讨会(AIR 2025)上,来自伦敦大学学院、新加坡南洋理工大学、Weco AI、Google DeepMind、Meta、华为、阿里等多家学术界和工业界的研究人员围绕强化学习(RL)、推理决策、AI智能体展开讨论。新加坡南洋理工大学的安波教授揭示了从基于强化学习的智能体到由大型语言模型(LLM)驱动的智能体的演变。他分享了团队的多项关于Agent的工作进展,其中包括Q算法,该算法以多步骤推理作为审慎规划。Q算法在学习Q值模型的过程中,需要经历离线强化学习以交替更新Q值标签并拟合QVM、使用表现最佳的回滚轨迹的奖励、使用与更强大LLM一起完成的轨迹的奖励三个关键步骤。此外,来自伦敦大学学院的宋研从DeepSeek切入,讨论了强化学习在大型语言模型推理中的作用,并指出当Agent使用某些关键词时,它们会进行各种回溯、自我报告和复杂推理。谷歌DeepMind研究员冯熙栋初步阐述了将强化学习的组成部分用自然语言描述的理念,尝试将策略、值函数、贝尔
本文字数:约 3500 字,预计阅读时间:15 分钟这个 69 岁的「AI 硬件」创业者,正被数百万年轻人追捧曾德钧,69 岁的「猫王品牌」创始人,不仅成功打造了外观复古的音响产品,还将其转变为深受近千万年轻人喜爱的科技潮牌。猫王品牌于 3 月 16 日发布了四款接入了 DeepSeek、火山等大模型的智能音响,包括面向年轻人的小王子 OTR-AI 智慧音箱、小岛 AI 数字人音箱,以及面向乐活中青年的 SR1Pro ·AI 智慧收音机、SR2 MKII· AI 智慧收音机。这些 AI 智慧收音机可以通过语音对话来识别用户的情绪,根据情绪推荐内容,甚至探索根据用户习惯和喜好,由 AI 生成专属电台内容。尽管收音机被认为是「过时」的品类,但在 AI 的重塑下,猫王妙播让这个品类再次焕发了生机。AI 大模型对硬件产品情感陪伴能力的增强,让曾德钧感到亢奋,他相信这将是猫王妙播产品的一个重大拐点。猫王妙播的成功在于它能够将 AI 技术融入到传统硬件中,为用户提供情感陪伴,这不仅提升了用户体验,也使得收音机这一传统产品焕发了新的活力。曾德钧表示,猫王妙播的产品不再只是
本文字数:约 3540 字,预计阅读时间:10 分钟重点新闻> ## 微软的「50 岁生日」,过得真不容易微软在2025年4月4日迎来了它的五十岁生日,然而庆祝活动却因抗议者而草草收场,且正值美国总统宣布新的关税细节,导致股市大跌。尽管微软在移动互联网时代曾面临多次失误,如浏览器之战和错失移动互联网趋势,但近年来它持续位居全球上市公司市值前五,并在多个时间点登顶全球第一。微软的成功不仅源于其规模,更在于其在关键时刻做出的正确决策。在微软五十周年之际,让我们回顾微软历史上的一些关键转折点,如与IBM合作取得MS-DOS授权、Windows XP的成功、以及对游戏业务的豪赌。此外,纳德拉领导下的微软在AI和云计算领域的大胆押注,特别是对OpenAI的投资,为微软注入了新的创新基因。> ## 「9 块 9」AI 复活亲人,科技奇迹还是「情感幻觉」?清明节期间,人们开始思考如何利用AI技术复活逝去的亲人。通过整合聊天记录、语音样本和照片,AI可以生成一个模拟逝者的聊天机器人,甚至在视觉上复原逝者。尽管这些技术为生者提供了一种悼念逝者的方式,但也引发了关于伦理和心理健康的讨论。例如,
本文字数:约 3800 字,预计阅读时间:10 分钟AI 在移动影像领域,搞了场「无声变革」在移动影像领域,OPPO 引入了张磊和罗俊两位专家,他们致力于通过 AI 技术革新手机影像计算方式,实现了从传统 ISP 计算方式到 AI 计算方法的转变。张磊带领的团队擅长底层视觉技术和 AI 大模型,而罗俊则拥有丰富的影像工程经验,两人强强联合,成功将 AI 技术应用于手机影像,实现了在降噪、超分计算和色彩重建等方面的突破。特别值得一提的是,他们通过 AI 大模型成功实现了 60 倍长焦拍摄的图像清晰度提升,将原本不可能实现的光学极限突破。此外,他们在夜景人像拍摄上也取得了进展,通过引入丹霞原彩镜头,解决了夜间光线复杂带来的色温问题。这些创新不仅在 Find X8 系列中得到了应用,还将在未来的 LUMO 凝光影像系统中进一步升级,展示了 AI 技术在手机影像领域的巨大潜力和广泛应用前景。AI 正在重塑快手商业化体系快手利用 AI 技术革新了其商业化体系,将其磁力引擎打造为下一代 AI 智能商业引擎,覆盖从内容生产到投放、匹配的全链路。借助 AIGC 技术,快手不仅大幅降低了广告内容制作成本
康叔的AI全栈工坊