本文字数:约 4250 字,预计阅读时间:10 分钟
扣子空间一手实测:字节的第一个 Agent,比 Manus 如何?
4月18日晚间,字节跳动的扣子空间正式开启内测,定位为通用Agent。与市场上其他类似产品如 Manus 相比,扣子空间采用了邀请码制,用户可以选择精通各项技能的「通用实习生」,也可以选择行业的「领域专家」,通过与AI的互动完成工作任务。
作为字节迈向Agent时代的一步,扣子空间的功能覆盖了多种场景,包括制定旅游攻略、一周穿搭等。极客公园上手实测了扣子空间的 Agent 功能,结果显示,制定旅游攻略和一周穿搭的任务顺利完成,但另一个专家助手的任务则出现了 Python 脚本调用失败、API权限异常等 Bug,任务未能成功执行。
扣子空间支持探索和规划两种模式,前者可一步到位输出结果,后者则允许用户亲自把控每个步骤。在制定日本旅行攻略时,扣子空间花费了15分钟以上的时间,通过推理过程的思维链与搜索深度结合,最终生成了包含行程安排、预算参考、旅行提示以及个性化策划节目的旅行攻略。
除了标准的通用Agent,扣子空间还内置了「用户研究专家」和「华泰A股观察助手」两个专家Agent。前者可提供调研问卷交叉分析、访谈纪要整理等服务,后者则每日跟踪复盘自选股和大盘情况,提供专业数据和框架观察。然而,专家Agent在实际操作中也遇到了数据获取问题,导致任务未能如期完成。
整体来看,虽然扣子空间在某些方面表现良好,但仍需进一步完善,以实现更稳定、更高质量的服务。字节在Agent赛道的快速推进,展现了其从技术突破到产品落地的迅速节奏,但在实际应用中,依然存在不少挑战。
深圳又出了个智能机器人:DeepSeek加持,全球首款全域全身VLA
深圳的智能机器人技术再次迎来新突破,DeepSeek 技术加持下,研发出全球首款全域全身VLA(虚拟定位算法)智能机器人。该机器人无需经过专门训练即可完成新任务,大大降低了使用门槛。
DeepSeek 是一种先进的机器学习技术,它通过深度学习算法,使机器人能够快速适应新的任务环境,并在没有详细训练的情况下完成任务。这种技术突破了传统机器人依赖预训练模型的限制,使机器人具备了更强的环境适应能力和任务执行能力。
全域全身VLA技术的核心在于其能够对机器人全身进行精确的定位和控制,确保机器人在复杂环境中能够准确执行任务。此外,VLA技术还可以实现多传感器融合,使机器人能够更好地感知环境,提高任务执行的准确性和稳定性。
随着人工智能技术的不断发展,机器人在各行各业的应用越来越广泛。DeepSeek加持下的全域全身VLA技术,将为机器人产业带来新的发展机遇,提高机器人在各种场景下的应用效果。
火山引擎发布 OS Agent 解决方案及AI云原生推理套件
4月17日,火山引擎宣布面向企业市场推出 OS Agent 解决方案及 AI 云原生推理套件。该解决方案旨在帮助企业更快、更省地构建和部署 Agent 应用,通过 AI 云原生推理套件大幅降低模型推理的成本和延迟。
在发布会上,火山引擎总裁谭待强调,要做好 Agent,技术上需要做好三个准备,包括更强的、支持多模态的模型,更好的架构和工具能够支持大模型操作数字和物理世界,以及通过 AI 云原生降低模型推理的成本和延迟。火山引擎推出的新解决方案和推理套件,正是针对这些需求提供技术支持。
火山引擎的 OS Agent 解决方案通过 AI 云原生组件(如 Sandbox)为企业提供了模块化的开发支持,显著降低了 Agent 应用的开发门槛。此外,火山引擎还支持 MCP 协议,这一协议类似于互联网早期的 HTML 和 HTTP,将加速 Agent 生态的发展,降低开发者的适配成本,推动行业标准化。
火山引擎正在通过垂直类 Agent(如 Data Agent)、通用 Agent 开发工具(如 OS Agent)及 AI 云原生布局,全面推进 Agent 生态建设。谭待提到,Agent 是 AI 为各行各业带来变革的必经之路,需具备深度思考模型支持的反思和规划能力,才能完成专业度高、耗时长的复杂任务。
字节豆包1.5·深度思考模型发布
字节跳动在4月17日的发布会上推出了豆包1.5·深度思考模型,该模型采用200B参数、20B激活参数的 MoE 架构,支持视觉推理和“边想边搜”,能够在数学推理、编程竞赛和科学推理等任务中媲美 OpenAI o3-mini,达到全球第一梯队。
该模型的极低延迟和多模态能力使其能处理复杂任务,如基于照片推测地理位置或解读企业项目流程图。此外,豆包1.5·深度思考模型还支持边想边搜功能,通过推理过程的思维链与搜索深度结合,践行“边想边搜”的理念。
OpenAI、谷歌、微软和亚马逊支持MCP协议
MCP协议被认为是未来AI生态的“标准USB接口”,3月底,OpenAI、谷歌、微软和亚马逊陆续宣布支持或深度集成MCP协议。国内的阿里云、腾讯云也陆续支持MCP服务部署与调用。MCP协议的广泛支持,将加速AI生态的发展,降低开发者的适配成本,推动行业标准化。
总结
今日AI领域的新闻主要集中在Agent技术的发展和应用上。字节跳动的扣子空间首次内测,展现了其在通用Agent和专家Agent方面的潜力,但同时也暴露出一些技术上的问题。火山引擎则通过推出OS Agent解决方案及AI云原生推理套件,加速了企业应用Agent技术的步伐。此外,MCP协议的支持者不断增加,预示着未来AI生态的标准化趋势。整体来看,Agent技术在各个领域的应用前景广阔,但也面临着技术和标准上的挑战。
作者:Qwen/Qwen2.5-32B-Instruct
文章来源:极客公园, 量子位, 钛媒体
编辑:小康