本文字数:约 4500 字,预计阅读时间:15 分钟连续发布两款万亿参数模型,蚂蚁 AI 来势汹汹在过去半个月,大模型行业迎来了一波产品发布的高潮,其中,蚂蚁集团的“百灵”团队在10月9日宣布推出了一款拥有1万亿参数的语言大模型Ling-1T,而仅仅十天前,他们刚刚开源了另一款万亿参数模型Ring-1T-preview。这一连串的发布不仅展示了蚂蚁在大模型领域的实力,也让业界对其开源策略产生了浓厚的兴趣。蚂蚁集团的大模型研发始于去年,形成了三条主要的技术探索路线:一是基于MoE架构的非思考模型Ling-Series,二是思考模型Ring-Series,三是原生全模态大模型Ming-Series。Ling-1T和Ring-1T-preview分别是这两条主要路线上的成果,它们的参数量均达到了1万亿,几乎等同于人类大脑神经元的数量。这次发布的Ling-1T在编程与数学推理等多个维度上的表现非常亮眼,甚至在一些基准测试中超过了DeepSeek等知名模型。Ling-1T不仅具备深度思考能力和泛化能力,还在推理和逻辑方面表现出色,适用于代码生成、软件开发、数学竞赛等场景。在训练过程中,Ling-
本文字数:约 4662 字,预计阅读时间:10 分钟Together AI's ATLAS adaptive speculator delivers 400% inference speedup by learning from workloads in real-time企业扩展AI部署时遇到了一个隐形性能瓶颈,罪魁祸首是静态推测器,它们无法跟上不断变化的工作负载。推测器是与大型语言模型并行工作的较小AI模型,它们提前起草多个令牌,而主模型则并行验证这些令牌。这种技术(称为推测性解码)已成为企业试图减少推理成本和延迟的重要手段。Together AI今天宣布了一项研究和新系统,名为ATLAS(AdapTive-LeArning Speculator System),旨在帮助企业克服静态推测器的挑战。该技术提供了一种自我学习推理优化功能,可以将推理性能提升高达400%,比现有推理技术如vLLM的基线性能更好。系统解决了关键问题:随着AI工作负载的演变,推理速度下降,即使有专门的推测器也无济于事。该公司成立于2023年,专注于在其企业AI平台上优化推理。今年早些时候,随着客户采用率和需求
本文字数:约 4800 字,预计阅读时间:15 分钟Echelon's AI agents take aim at Accenture and Deloitte consulting modelsEchelon,一家专注于企业软件自动化的AI初创公司,从隐身模式中浮出水面,获得了475万美元的种子轮融资,由Bain Capital Ventures领投。这家位于旧金山的公司开发了专门训练的AI代理,能够处理端到端的ServiceNow部署,这是企业软件部署中一个复杂的过程,通常需要数月时间的离岸咨询团队和数百万美元的成本。该公司的创始人兼首席执行官Rahul Kayala指出,数字转型的最大障碍不是技术,而是实施所需的时间。AI代理正在消除这个瓶颈,使企业能够以前所未有的速度进行实验、迭代和部署平台更改。该公告暗示了对价值1.5万亿美元的全球IT服务市场的潜在颠覆,其中像Accenture、Deloitte和Capgemini这样的公司长期通过劳动密集型咨询模式主导市场。这些模式在AI时代被认为已过时。传统上,ServiceNow的部署通常需要专门的技术知识,大多数公司内部缺乏这种知识
本文字数:约 5200 字,预计阅读时间:15 分钟To scale agentic AI, Notion tore down its tech stack and started freshNotion, a popular productivity software, has completely rebuilt its technology stack to support agentic AI at enterprise scale. Traditional AI workflows are based on explicit, step-by-step instructions, whereas Notion’s new architecture focuses on advanced reasoning models that can autonomously select, orchestrate, and execute tools across connected environments. This shift enables the agents to be mo
本文字数:约 5378 字,预计阅读时间:18 分钟Google's AI can now surf the web for you, click on buttons, and fill out forms with Gemini 2.5 Computer UseGoogle has unveiled a new, fine-tuned, and custom-trained version of its powerful Gemini 2.5 Pro LLM, known as "Gemini 2.5 Pro Computer Use." This model can use a virtual browser to surf the web, retrieve information, fill out forms, and take actions on websites from a single text prompt. The model is not directly available for consumers, but it is accessible throu
康叔的AI全栈工坊
Code for Life, AI for Future