【20250306AI日报】AI Agent 的「GPT 时刻」,Manus 炸醒整个 AI 圈!

今日新鲜事 · 9 天前
本文字数:约 4800 字,预计阅读时间:12 分钟

重点新闻

AI Agent 的「GPT 时刻」,Manus 炸醒整个 AI 圈!

新闻图片

2025年3月6日,Monica.im 研发的全球首款 AI Agent 产品「Manus」的推出,引起了整个 AI 圈的轰动。Manus 是一个真正自主的 AI 代理,能够解决各类复杂多变的任务,与传统 AI 助手不同的是,它不仅能够提供建议或答案,还能直接交付完整的任务成果。在 GAIA 基准测试中,Manus 在所有三个难度级别上都取得了新的最先进(SOTA)表现。其运行方式是基于独立虚拟机中的 Multiple Agent 架构,通过规划代理、执行代理、验证代理的分工协作机制,大幅提升对复杂任务的处理效率,从而真正模拟人类处理任务的流程,实现从任务规划到执行的全流程自动化。

例如,Manus 可以完成旅行规划、股票分析、教育内容创建、保险政策比较、供应商采购、财务报告分析、创业公司列表整理、在线商店运营分析等任务。它不仅能够提供详细的分析报告,还能根据用户的需求自动生成定制化的解决方案。Manus 的强大之处在于,它可以记住用户的偏好和需求,从而在未来的任务中提供更加个性化的服务。此外,Manus 的自主学习能力让它的能力提升逻辑更像真正的人类,尽管现阶段它可能还无法在某些特定领域达到专家级别的精通,但已经展现出巨大的潜力。随着自主学习能力的加入,AI Agent 的泛用性得到了巨大的提升。


其他新闻

OPPO Find N5:折叠屏轻薄到极致后,「蒸馏」出的是什么?

新闻图片
OPPO Find N5 在折叠屏手机形态探索中,通过极致轻薄的设计,不仅提升了用户的使用体验,还通过轻量化设计使得用户更愿意在日常每个精彩时刻顺手掏出 Find N5 按下快门。此外,OPPO Find N5 还搭载了「跨生态远程控制」功能,实现了对 macOS 设备的无缝远程操控,这在安卓阵营尚属首创。这种深度定制使得 Find N5 的远程控制不再停留于「能用」层面,而是真正达到了「高效生产力工具」的水准。

Nothing Phone (3a) Pro 首测:这可能是最有趣的 AI 手机

新闻图片
Nothing Phone (3a) Pro 在外观设计上延续了品牌一贯的极简风格,同时通过创新的 AI 功能 Essential Space,为智能手机市场注入了新的活力。Essential Space 的设计定位并非另一个大模型,而是充当用户的「第二记忆」,能够自动从屏幕内容中提取信息,并帮助用户完成设置事项提醒、备忘录等功能。此外,Nothing Phone (3a) Pro 还搭载了 5000 万像素主摄传感器和 3 倍潜望式长焦镜头,影像能力得到大幅提升。

How the A-MEM framework supports powerful long-context memory so LLMs can take on more complicated tasks

新闻图片
A-MEM 框架使用嵌入和 LLMs 创建动态记忆笔记,这些笔记自动链接以创建复杂的知识结构。A-MEM 框架使得 LLMs 可以处理更复杂的任务,因为它支持强大的长上下文记忆。这有助于 LLMs 在处理需要长时间上下文的任务时表现得更好,从而提高其在实际应用中的表现。

SimilarWeb data: This obscure AI startup grew 8,658% while OpenAI crawled at 9%

新闻图片
SimilarWeb 数据揭示了 AI 市场的动荡,其中 Deepseek(8,658% 增长)和 Lovable(928% 增长)主导市场。这种增长表明,尽管 OpenAI 等大型公司可能占据头条,但市场上仍然存在许多快速增长的初创公司,它们正在利用 AI 技术创造新的机会。

New open-source math model Light-R1-32B surpasses equivalent DeepSeek performance with only $1000 in training costs

新闻图片
新发布的开源数学模型 Light-R1-32B 在仅花费 1000 美元的训练成本下,性能超过了等效的 DeepSeek 模型。这意味着公司可以自由部署 Light-R1-32B 在商业产品中,同时保持对其创新的完全控制。开源模型的出现,降低了使用 AI 的门槛,让更多企业和开发者能够从中受益。

Nvidia’s GTC 2025 will feature AI’s brightest minds and draw 25K attendees in person

新闻图片
Nvidia 宣布 GTC 2025 将于 2025 年 3 月 17 日至 21 日在加利福尼亚州圣何塞举行。GTC 2025 是世界上首屈一指的 AI 会议,预计将吸引 25,000 名与会者。GTC 2025 将展示 AI 领域最聪明的头脑,为与会者提供了解最新 AI 技术和趋势的机会。

Enhancing AI agents with long-term memory: Insights into LangMem SDK, Memobase and the A-MEM Framework

新闻图片
AI 代理经常忘记指令,而改进记忆保留的方法将使代理更强大和有用。文章深入探讨了 LangMem SDK、Memobase 和 A-MEM 框架,这些工具和框架旨在增强 AI 代理的长期记忆能力。通过这些工具,AI 代理可以更好地保留用户指令和信息,从而提供更连贯和有用的服务。

Salesforce launches Agentforce 2dx, letting AI run autonomously across enterprise systems

新闻图片
Salesforce 推出了 Agentforce 2dx,允许 AI 自主运行在企业系统中,无需人工提示,这将为企业带来显著的成本节省和生产率提升。Agentforce 2dx 的推出,标志着 AI 技术在企业工作流程中的深入应用,将有助于企业提高效率和生产力。

总结

今日的 AI 领域主要动向集中在 AI Agent 的进步、AI 在手机和企业系统中的应用,以及开源模型的发布。从 Manus 的发布,到 OPPO Find N5 的轻薄设计和折叠屏创新,再到 Salesforce 的 Agentforce 2dx 以及 Light-R1-32B 的开源,这些新闻共同展示了 AI 技术在不同领域的广泛应用和持续发展,突显了 AI 对现代社会的深远影响。


作者:Qwen/Qwen2.5-32B-Instruct
文章来源:钛媒体, 极客公园, VentureBeat, 量子位
编辑:小康

Theme Jasmine by Kent Liao