【20250509AI日报】李想「不想造车」的背后,其实是想造「司机 Agent」

今日新鲜事 · 05-08
本文字数:约 2600 字,预计阅读时间:10 分钟

李想「不想造车」的背后,其实是想造「司机 Agent」

新闻图片

李想在宣布将All in AI后,理想汽车推出了全新的VLA(Vision-Language-Action)模型,旨在实现更智能的辅助驾驶。VLA模型是一个集视觉、语言和行动于一体的架构,它将理想汽车此前的辅助驾驶技术提升到了一个新的水平。VLA模型的核心目标是让汽车辅助驾驶系统能够像人类司机一样进行复杂的操作,例如,通过语音指令来控制驾驶行为,如通过收费站时的指令“走人工”会使得汽车从ETC车道转向人工收费通道。

VLA架构的发展历程可以追溯到2022年之前的模块化方案,再到2023年的端到端感知架构,直到2024年的VLM+E2E架构。VLA模型则代表了辅助驾驶技术的最新进展。理想汽车CEO李想认为,VLA模型的发展并不是突变,而是建立在现有技术基础之上的一种进化。VLA模型通过预训练、后训练、强化训练和最终的“司机Agent”设计,逐步具备了像人类司机一样的驾驶能力。

李想在AI Talk中详细阐述了VLA模型的训练过程,包括预训练阶段、后训练阶段和强化训练阶段。这一系列过程类似于人类学习开车的过程,从理论学习到实际操作,再到不断实践和优化。通过这种方式,VLA模型能够逐步具备处理复杂驾驶任务的能力。理想汽车还表示,未来可能会有更高效的架构,但目前VLA模型是一个重要的里程碑。这标志着理想汽车在AI领域的重要投入,也是公司向人工智能科技公司转型的关键一步。


The walled garden cracks: Nadella bets Microsoft’s Copilots—and Azure’s next act—on A2A/MCP interoperability

新闻图片

微软CEO萨提亚·纳德拉(Satya Nadella)在最近的公告中宣布,微软将支持Google DeepMind提出的A2A(Agent to Agent)开放协议,以及Anthropic的MCP(Multi-Contextual Protocol)。这是微软在AI领域采取的一个重要步骤,旨在打破其封闭的“围墙花园”,增强其Copilot和Azure服务的互操作性。A2A协议旨在让不同的AI代理之间能够进行有效的交流和协作,而MCP则是一个多语境协议,旨在提高AI系统的灵活性和适应性。

这一举措标志着AI行业向着更加开放和协作的方向发展,微软希望通过这种方式进一步加强其在AI领域的领导地位。纳德拉的决策体现了微软对于开放技术标准和协议的支持,这对于推动AI技术的发展和应用具有重要意义。这一开放举措也有助于打破现有的技术壁垒,推动不同平台和AI模型之间的互操作性,进一步促进AI技术的普及和创新。


突破多模态奖励瓶颈!中科院清华快手联合提出R1-Reward,用强化学习赋予模型长期推理能力

中国科学院、清华大学和快手联合团队提出了一种名为R1-Reward的新方法,该方法旨在解决多模态任务中的奖励瓶颈问题。R1-Reward使用强化学习技术,通过优化奖励机制,使得模型能够在多模态任务中具备长期推理能力。传统的多模态任务通常面临奖励稀疏的问题,这限制了模型在复杂任务中的表现。R1-Reward方法通过设计更有效的奖励函数,增强了模型的学习能力和稳定性,从而在多模态任务中取得了显著的性能提升。

该团队的研究成果表明,R1-Reward方法能够在多个多模态任务中表现出色,特别是在需要长期推理能力的场景中,如多轮对话、视频理解等。这一方法的提出为多模态任务的研究提供了新的思路和技术支持,有望推动多模态AI技术的发展和应用。



突破多模态奖励瓶颈!中科院清华快手联合提出R1-Reward,用强化学习赋予模型长期推理能力

新闻图片

中国科学院、清华大学和快手联合团队提出了一种名为R1-Reward的新方法,该方法旨在解决多模态任务中的奖励瓶颈问题。R1-Reward使用强化学习技术,通过优化奖励机制,使得模型能够在多模态任务中具备长期推理能力。传统的多模态任务通常面临奖励稀疏的问题,这限制了模型在复杂任务中的表现。R1-Reward方法通过设计更有效的奖励函数,增强了模型的学习能力和稳定性,从而在多模态任务中取得了显著的性能提升。

该团队的研究成果表明,R1-Reward方法能够在多个多模态任务中表现出色,特别是在需要长期推理能力的场景中,如多轮对话、视频理解等。这一方法的提出为多模态任务的研究提供了新的思路和技术支持,有望推动多模态AI技术的发展和应用。

Alibaba’s ‘ZeroSearch’ lets AI learn to google itself — slashing training costs by 88 percent

新闻图片

阿里巴巴推出了一项名为ZeroSearch的新技术,该技术通过让AI模型学习如何像人类一样使用搜索引擎来获取信息,从而大幅降低训练成本。ZeroSearch技术的核心在于,通过利用互联网上的大量数据,让AI模型能够自行学习如何检索和获取相关信息,而不是依赖于传统的训练数据集。这一方法不仅显著降低了训练成本,还提高了模型的信息检索能力。

ZeroSearch技术的应用场景非常广泛,从搜索引擎优化到智能客服等领域都有潜在的应用价值。这一技术的推出,标志着阿里巴巴在AI领域的持续投入和技术探索,也反映了其在降低AI模型训练成本方面的创新尝试。

Mem0’s scalable memory promises more reliable AI agents that remembers context across lengthy conversations

新闻图片

Mem0公司推出了一种可扩展的内存技术,该技术旨在提高AI代理在长时间对话中的可靠性和上下文记忆能力。传统的AI代理通常难以在长时间的对话中保持一致的上下文记忆,这影响了其在实际应用中的表现。Mem0的内存技术通过优化内存管理,使得AI代理能够更好地记住对话中的细节,从而在长时间的对话中保持一致性。

这一技术的推出对于提高AI代理在客户服务、虚拟助手等领域的表现具有重要意义。Mem0的内存技术不仅解决了当前AI代理在长对话中的记忆问题,也为未来的AI应用提供了新的可能性。

OpenAI names Instacart leader Fidji Simo as new CEO of Applications

新闻图片

OpenAI宣布任命Instacart的领导Fidji Simo为应用程序的新CEO。Fidji Simo在Facebook和Instacart的工作经历显示了她在产品化和用户体验方面的丰富经验。她的加入预计将为OpenAI的产品化和商业化进程带来新的推动力。Fidji Simo的背景和经验,以及她在Instacart的成功经历,使其成为OpenAI在推动AI应用产品化方面的理想人选。

这一任命不仅反映了OpenAI在AI应用领域的战略调整,也显示了公司在推动AI技术商业化方面的决心。Fidji Simo的加入预计将为OpenAI带来更多的商业视角和技术洞察,推动AI技术在更多领域的实际应用。


总结

今日的AI领域主要动向集中在AI技术的创新和应用。理想汽车推出的VLA模型展示了在自动驾驶领域的最新进展,而微软支持A2A和MCP协议则标志着AI技术向更加开放和协作的方向发展。此外,中科院、清华大学和快手联合团队提出的R1-Reward方法,以及阿里巴巴推出的ZeroSearch技术,都为多模态任务和信息检索带来了新的突破。这些进展不仅反映了AI技术在各个领域的持续创新,也展示了AI技术在实际应用中的巨大潜力。


作者:Qwen/Qwen2.5-32B-Instruct
文章来源:机器之心, 量子位, 极客公园, VentureBeat, 钛媒体
编辑:小康

Theme Jasmine by Kent Liao