【20250410AI日报】AI Agent 发展史:从 RL 驱动到大模型驱动 |AIR 2025

今日新鲜事 · 27 天前
本文字数:约 4200 字,预计阅读时间:14 分钟

AI Agent 发展史:从 RL 驱动到大模型驱动 |AIR 2025

新闻图片

在AI智能体推理与决策研讨会(AIR 2025)上,来自伦敦大学学院、新加坡南洋理工大学、Weco AI、Google DeepMind、Meta、华为、阿里等多家学术界和工业界的研究人员围绕强化学习(RL)、推理决策、AI智能体展开讨论。新加坡南洋理工大学的安波教授揭示了从基于强化学习的智能体到由大型语言模型(LLM)驱动的智能体的演变。他分享了团队的多项关于Agent的工作进展,其中包括Q算法,该算法以多步骤推理作为审慎规划。Q算法在学习Q值模型的过程中,需要经历离线强化学习以交替更新Q值标签并拟合QVM、使用表现最佳的回滚轨迹的奖励、使用与更强大LLM一起完成的轨迹的奖励三个关键步骤。此外,来自伦敦大学学院的宋研从DeepSeek切入,讨论了强化学习在大型语言模型推理中的作用,并指出当Agent使用某些关键词时,它们会进行各种回溯、自我报告和复杂推理。谷歌DeepMind研究员冯熙栋初步阐述了将强化学习的组成部分用自然语言描述的理念,尝试将策略、值函数、贝尔曼方程、蒙特卡洛采样、时间差分学习以及策略改进操作符等映射到它们的自然语言对应中。这些讨论不仅推进了AI智能体的发展,还为未来智能体的创新应用提供了新的思路和方向。


AI正在触发一场身份革命

新闻图片

2025年的今天,每个人都可以拥有属于自己的“AI分身”。这项技术不仅可以为用户提供个性化服务,还能帮助用户更好地理解和管理自己的身份。AI分身将能够根据用户的习惯和偏好进行自我学习和适应,从而更好地模拟用户的性格和行为模式。这一技术的发展将为虚拟现实、游戏、社交媒体等领域带来全新的变革,同时也会带来关于隐私、伦理等方面的讨论。AI分身的出现标志着身份革命的开始,为未来的人机交互方式提供了新的可能。


大模型一体机塞进这款游戏卡,价格砍掉一个数量级

深度学习一体机DeepSeek能够运行671B参数的模型,而价格却比传统服务器低得多。这一创新主要得益于将大模型的运行能力集成到高性能游戏显卡中,从而极大地降低了成本。这种技术不仅推动了AI在普通消费级硬件上的普及,还为中小企业提供了低成本部署大模型的能力。通过将复杂的大模型计算任务转移到消费级显卡上,DeepSeek打破了传统AI硬件的高门槛,为更多用户和企业打开了AI的大门。这项技术的发展预示着AI硬件市场的一场革命,为AI技术的广泛应用铺平了道路。


GPT-4o图像生成架构被“破解”了?自回归主干+扩散解码器

GPT-4o的图像生成能力引起了广泛关注,最新研究表明其架构被“破解”。通过分析,研究者发现GPT-4o的图像生成系统采用了自回归主干和扩散解码器的组合。自回归主干负责生成图像的基本结构,而扩散解码器则在生成过程中逐渐扩散细节,最终生成高质量的图像。这一研究不仅揭示了GPT-4o图像生成的机制,还为未来开发类似技术提供了新的方向。此外,这种架构的“破解”还可能推动更多关于图像生成技术的研究和发展,为人工智能在图像处理领域的应用注入新的活力。

免费AI让林黛玉跳上八段锦,一个月涨粉近十万 | AI教程

通过免费AI工具,用户能够为经典文学人物林黛玉创造动态的八段锦健身动作,这不仅吸引了大量粉丝关注,还展示了AI在内容创作中的无限可能性。这项技术使得用户能够将静态的人物形象转化为动态的视频内容,极大地丰富了用户的内容体验。这种创新的应用不仅为传统文化的传播提供了新的渠道,还为创作者提供了新的工具和灵感。通过这种方式,AI技术不仅改变了内容创作的方式,还促进了文化内容的广泛传播和交流。

倒计时1周!20余位行业大佬共话AI,中国AIGC产业峰会最全攻略在此

中国AIGC产业峰会即将于4月16日召开,届时将有20余位行业大佬齐聚一堂,共同探讨AI产业的发展趋势和技术前沿。本次峰会将涵盖多个主题,包括AI技术创新、应用实践、产业发展等多个方面。参会者不仅能够了解到最新的AI技术动态,还能与其他行业精英交流经验,共同推动AI产业的发展。此外,峰会还设置了丰富的互动环节,为参会者提供了宝贵的交流机会。这一盛会不仅为AI从业者提供了学习和交流的平台,还为AI产业的发展注入了新的活力。

图灵智驾标配,小鹏X9在智能MPV市场试图突围

新闻图片

小鹏汽车2025款X9全系搭载图灵智驾系统,售价下探至39.98万元。这一举措不仅提升了小鹏在智能MPV市场的竞争力,还为消费者提供了更加智能化的驾驶体验。图灵智驾系统集成了先进的自动驾驶技术和智能驾驶辅助功能,使得驾驶更加安全、便捷。通过搭载这一系统,小鹏X9不仅在技术上实现了突破,还在价格上提供了更多选择,有望在智能MPV市场中实现突围。


RISC-V驱动中国芯,打破高性能处理器的“不可能三角”

新闻图片

睿思芯科发布的“灵羽”处理器凭借RISC-V架构,打破了高性能、CPU核心研发、SoC芯片研发三者难以兼得的“不可能三角”。这一突破不仅推动了国产服务器处理器的发展,还为高性能处理器的自主可控提供了新的解决方案。“灵羽”处理器的发布不仅展示了中国在高性能处理器领域的技术实力,还为未来国产服务器处理器的广泛应用奠定了基础。这一创新将为中国的半导体产业带来新的发展机遇。


因赛集团上市五年首亏,13倍溢价收购标的商誉爆雷 | 看财报

新闻图片

因赛集团自上市以来首次出现亏损,主要由于13倍溢价收购标的商誉爆雷。这一事件不仅影响了公司的财务状况,还引发了市场对该公司未来发展的担忧。因赛集团在收购标的后的商誉减值前松后紧,导致业绩大变脸,这一情况引发了市场的广泛关注和讨论。此次事件不仅为因赛集团敲响了警钟,也为其他公司在进行高溢价收购时提供了警示。未来,因赛集团需要重新调整战略,以应对当前的困境。


香农芯创抛售资产聚焦主业,短债激增囤货存储芯片赌涨价 | 看财报

新闻图片

香农芯创抛售非核心资产,聚焦主业,并在短期债务激增的情况下,大举囤积存储芯片,以期在存储芯片涨价时大赚一笔。这一策略虽然具有一定的风险,但也显示了公司在应对市场变化时的灵活性和前瞻性。通过抛售非核心资产,香农芯创能够更好地集中资源,专注于核心业务的发展。尽管短期债务激增,但香农芯创希望通过囤积存储芯片来获得未来市场上的收益。这一策略不仅体现了公司在市场上的前瞻性,也为未来的发展提供了新的机会。


新晨科技首亏后逆势并购,标的公司IPO折戟背后迷雾重重|并购一线

新闻图片

新晨科技在首次亏损后逆势进行并购,而标的公司IPO折戟背后迷雾重重。此次并购不仅面临标的公司IPO失败的挑战,还面临市场对标的公司真实情况的质疑。新晨科技在面对首次亏损的情况下,仍选择逆势并购,这一举动引发了市场的广泛关注和讨论。并购背后的真实情况和未来前景如何,还需要进一步观察和分析。此次并购不仅考验着新晨科技的战略眼光,也为其未来发展带来了新的机遇和挑战。


离境退税“即买即退”4月8日起全国推广,境外游客消费金额料进一步提升丨大事件必读

新闻图片

离境退税“即买即退”政策自4月8日起在全国范围内推广,预计将大幅增加境外游客的消费金额。这一政策不仅为境外游客提供了更加便捷的退税体验,还为商家和旅游业带来了新的发展机遇。通过实施“即买即退”政策,游客可以在购买商品时立即获得退税,大大简化了退税流程,提升了购物体验。这一政策的实施不仅有助于吸引更多的境外游客,还能够促进国内消费市场的繁荣,为经济发展注入新的活力。


沪深量能16996亿元,较昨日增量740亿元|日日龙虎榜

新闻图片

沪深两市的成交量达到16996亿元,较昨日增加740亿元。这一增量不仅显示了市场的活跃度,还反映了投资者对市场的信心。成交量的增加通常意味着市场情绪的回暖和交易活动的增强。这一变化不仅对市场参与者有重要意义,也为投资者提供了更多的交易机会。通过观察成交量的变化,投资者可以更好地把握市场动态,做出更加明智的投资决策。这一增量为市场带来了新的活力,也为未来市场的走势提供了重要的参考。


广告业两大巨头合体!分众拟83亿元估值收购新潮;小米、华为概念股拟购买优特利控制权【并购一线】

分众传媒拟以83亿元估值收购新潮传媒,小米、华为概念股拟购买优特利控制权。这一系列并购不仅展示了广告业两大巨头的整合趋势,还体现了科技股在广告市场的战略布局。分众传媒与新潮传媒的合并将形成规模效应,进一步巩固其在广告市场的地位。而小米、华为概念股的并购,则显示出科技企业对于广告市场的重视和战略布局。这一系列并购不仅为相关企业带来了新的发展机遇,也为广告市场注入了新的活力。

宁波银行2024年报:息差收窄下净利增6%,消费贷实现双位数增长|钛媒体金融

新闻图片

宁波银行发布的2024年年报显示,尽管息差收窄,净利润仍增长6%,消费贷实现双位数增长。这一成绩不仅展示了宁波银行在应对市场变化时的稳健性,还体现了其在消费信贷领域的强劲表现。尽管息差收窄给银行带来了一定的压力,但通过优化业务结构和提高运营效率,宁波银行仍实现了净利润的增长。此外,消费贷的双位数增长也为宁波银行的业绩贡献了重要力量。这一年报不仅反映了宁波银行的经营成果,也为未来的发展提供了新的方向。


总结

今日AI领域的新闻主要集中在智能体的发展、图像生成技术的突破、AI驱动的创新应用以及相关行业的并购活动。从AIR 2025研讨会到GPT-4o图像生成架构的分析,这些新闻不仅揭示了AI技术的最新进展,还展示了AI在不同领域的广泛应用。同时,一些企业在AI领域的并购活动也预示着未来AI产业的整合趋势。整体来看,今日的AI领域呈现出技术不断进步和应用持续扩展的良好态势,为未来的发展注入了新的动力。

作者:Qwen/Qwen2.5-32B-Instruct
文章来源:雷锋网, 钛媒体, 量子位, 机器之心
编辑:小康

Theme Jasmine by Kent Liao