本文字数:约 6000 字,预计阅读时间:15 分钟
华人团队提出「CoD」草稿链,减少 80% Token,AI 省钱第一名!
在 AI 领域,大规模语言模型(LLMs)展示了强大的推理能力。然而,这些模型在处理问题时通常生成长长的「思维链(Chain-of-Thought, CoT)」,导致计算成本和延迟较高。为解决这一问题,Zoom 研究团队提出了一种全新的推理范式——「草稿链(Chain-of-Draft, CoD)」。CoD 通过模仿人类简洁的思维过程来提升推理效率,显著降低成本。
研究显示,使用 CoD 能将 Token 使用减少 80%,大幅降低计算成本。尽管 CoD 在某些任务中的准确率略低于 CoT,但总体上保持了相近的水平。以算术推理任务为例,GPT-4o 和 Claude 3.5 Sonnet 模型在 GSM8k 数据集上的准确率分别为 91.1% 和 91.4%,而 CoT 的准确率分别为 95.4% 和 95.8%。尽管 CoD 的准确率略低,但将 Token 使用减少了 80%,延迟分别降低了 76.2% 和 48.4%。
通过「草稿链」,AI 模型可以生成极简的中间推理步骤,捕捉解决问题的关键信息。例如,解决算术问题时,CoD 可以简化为一个简洁的方程,答案放在响应的结尾,使用分隔符「####」,减少了 Token 数,同时保持透明性和正确性。
CoD 的出现可能改变企业部署 AI 的成本,让 AI 模型以更少的资源更便宜地思考。这尤其适用于成本敏感的场景,如实时支持、教育和对话式 AI 等领域,因为即使是短暂的延迟也会严重影响用户体验。目前,随着应用场景扩展,在不谈 AI 安全时,成本与速度越来越成为绕不过的关键指标。CoD 的出现,证明了人们依然在探索如何在保持大模型进步的前提下,进一步降低成本,加速 AI 的普及。
李开复力推DeepSeek!零一万物发布模型一体机,搭载华为GPU,自家产品也全线替换了
近日,零一万物发布了一款搭载华为 GPU 的模型一体机,标志着自家产品全线更换为 DeepSeek 模型。这一举措体现了李开复对 DeepSeek 的高度认可和支持。
DeepSeek 是一种专注于大规模语言模型(LLM)的推理技术,其核心优势在于高效处理复杂任务。与传统的 LLM 相比,DeepSeek 在推理过程中生成的 Token 更少,减少了计算资源的消耗。零一万物通过全面采用 DeepSeek 模型,展示了其对前沿 AI 技术的坚定承诺。
该一体机不仅在硬件上进行了升级,还优化了软件系统,确保了 DeepSeek 模型的高效运行。华为 GPU 的引入,为 DeepSeek 提供了强大的算力支持,确保了在复杂任务中的快速响应。
此次零一万物全面更换自家产品,不仅展示了其对 DeepSeek 的信心,还为 AI 行业树立了一个标杆,引领了 AI 技术的创新和应用。随着 DeepSeek 模型的不断优化,零一万物有望在未来推出更多基于 DeepSeek 的创新产品,推动 AI 技术的进一步发展。
ICLR 2025 | 四川大学提出Test-time Adaptation新范式,突破查询偏移挑战
四川大学的研究团队在 ICLR 2025 上提出了一种全新的Test-time Adaptation(测试时适应)范式,以应对查询偏移挑战。查询偏移是指在训练和测试阶段,数据分布存在显著差异,导致模型性能下降的问题。四川大学的这项研究通过引入动态调整机制,使得模型在测试时能够适应数据分布的变化。
研究团队设计了一种自适应框架,能够在测试过程中动态调整模型参数,以适应不同查询的数据分布。该框架通过引入可学习的权重,使模型能够根据当前输入数据的特征自动调整权重,从而提高模型在测试阶段的鲁棒性和泛化能力。
实验结果显示,该框架在多个基准测试任务上显著提高了模型性能。与传统方法相比,该范式能够有效解决查询偏移问题,为大规模数据集的应用提供了新的解决方案。
四川大学的这一创新范式为 AI 领域的查询偏移挑战提供了新的解决思路,未来有望在更多实际应用中发挥重要作用。
AI 大模型创业,悄悄盯上年轻人最爱的「谷子经济」
随着二次元文化的普及,AI 技术正悄然进入这一领域,为年轻人带来了全新的消费体验。「谷子经济」是指围绕二次元周边产品形成的一种消费市场,这些产品包括手办、徽章、海报、卡片、挂件、立牌、娃娃等。Neurobo 是一家致力于将 AI 技术与二次元产品结合的创业公司,它通过情境感知交互系统,让用户能够与虚拟角色进行深度互动。
Neurobo 的核心产品「智能娃包」内置了传感器、麦克风、扬声器等硬件设备,能够感知用户的动作和情绪,并根据这些信息调整角色的行为反应。例如,用户带着「娃包」出门时,它能够识别出附近有用户喜欢的店铺,并建议用户前往。这种深度互动体验,让虚拟角色成为用户生活的一部分,满足了用户对深度情感陪伴的需求。
通过将 AI 技术与硬件结合,Neurobo 为二次元文化提供了全新的消费模式,让虚拟角色具备了类似真实伙伴的陪伴能力。随着市场需求的不断扩大,AI+ 玩具有望成为大模型技术落地的一个关键机会。未来,AI+ 玩具可能会容纳一个充满情感价值与个性化体验的巨大商业空间。
600亿EDA龙头收购芯和半导体;汽车芯片大热股拟不超过2亿元购买上海类比半导体部分股权【并购一线】
3月17日最新并购信息显示,一家600亿市值的EDA(电子设计自动化)龙头企业宣布收购芯和半导体,后者专注于半导体设计与验证。同时,汽车芯片大热股计划不超过2亿元购买上海类比半导体的部分股权。
这些并购活动反映出半导体行业持续整合的趋势,尤其是在EDA和汽车芯片领域。通过并购,企业不仅能够扩大市场份额,还能获得先进技术,提高竞争力。芯和半导体的加入,将为EDA龙头公司在半导体设计与验证方面提供新的技术支持,而上海类比半导体则有望为汽车芯片大热股带来新的业务增长点。
这些并购不仅反映了半导体行业的动态变化,还预示着未来可能出现更多的整合与合作。随着技术的不断进步,半导体企业之间的竞争将更加激烈,通过并购来增强自身实力成为了一种趋势。
AIAgent爆发,RPA进入APA时代?
近年来,随着 AI 技术的迅猛发展,RPA(Robotic Process Automation)正在经历一场变革。40% 的企业反馈表明,目前对采用 RPA 结合 AI 技术持积极态度。RPA 结合 AI 技术的出现,标志着 RPA 进入了 APA(AI Process Automation)时代。
APA 通过将 AI 与 RPA 结合,实现了更高级的自动化流程。AI 技术的应用使得 RPA 能够处理更复杂、更灵活的任务,如自然语言处理、图像识别等。这不仅提高了 RPA 的效率和准确性,还扩大了其应用范围。
企业对于 APA 的积极态度表明,AI 技术在自动化领域的应用前景广阔。未来,随着 AI 技术的不断进步,APA 将成为企业自动化流程的重要工具,为企业带来更高的效率和生产力。
AI大佬到底怎么用AI? 中国AIGC产业峰会首批嘉宾曝光,速来围观
近期,中国 AIGC 产业峰会即将召开,首批嘉宾名单曝光,吸引了众多关注。此次峰会汇聚了 AI 领域的多位大佬,他们将分享各自在 AI 技术应用方面的经验和见解。这些嘉宾不仅包括技术专家,还有来自企业界和学术界的代表。
峰会将涵盖 AI 技术的多个方面,包括自然语言处理、机器学习、计算机视觉等。通过这次峰会,参与者可以了解到 AI 技术在不同领域的应用现状和未来趋势。此外,峰会还设置了专题讨论和圆桌论坛,为与会者提供了深入交流的机会。
此次峰会不仅展示了中国在 AI 领域的领先地位,也为业界人士提供了一个交流与合作的平台。通过共享经验和技术,推动 AI 技术的进一步发展,为未来应用提供更多可能性。
大厂掀起“反内卷”浪潮,突然强制下班,背后有个很隐秘的推手
最近,一股“反内卷”的新风突然吹遍了中国的大厂。海尔、大疆、美的等多家企业纷纷出手,要求强制下班和严禁加班,一夜之间仿佛按下了“反内卷”的启动键。这一举措背后,有着一个隐秘的推手——AI 技术的应用。
AI 技术的应用不仅提高了工作效率,还优化了工作流程。通过自动化工具和智能系统,企业能够减少重复性劳动,提高员工的工作满意度。强制下班和严禁加班的政策,正是基于这一技术背景,旨在提高员工的工作生活平衡,从而提高整体工作效率。
通过引入 AI 技术,企业不仅能够减轻员工的工作负担,还能提升企业竞争力。这一系列举措的背后,不仅反映了企业对员工福利的关注,也预示着未来工作模式的变革。随着 AI 技术的不断进步,未来的工作环境将更加智能和人性化。
预盈变预亏,赛隆药业频频“出错”,仿制药产品竞争力待考丨看财报
近期,赛隆药业公布的财务数据出现了大幅波动。两个月前,公司预期盈利,但最新数据显示,预计亏损千万元。赛隆药业的预计预告信息披露不准确,已不是首次。这一情况引发了市场对其仿制药产品竞争力的质疑。
作为一家制药企业,赛隆药业的产品线主要集中在仿制药领域。然而,随着市场竞争的加剧和技术的进步,仿制药市场的竞争愈发激烈。赛隆药业在产品竞争力方面的表现不佳,可能导致其市场份额和盈利能力下降。
通过财务数据的分析,可以看出赛隆药业在产品创新和市场拓展方面存在不足。未来,公司需要加强研发力度,提升产品质量和技术水平,以增强其在市场上的竞争力。同时,也需要提高财务信息披露的准确性,增强市场信心。
AIAgent爆发,RPA进入APA时代?
近年来,随着 AI 技术的迅猛发展,RPA(Robotic Process Automation)正在经历一场变革。40% 的企业反馈表明,目前对采用 RPA 结合 AI 技术持积极态度。RPA 结合 AI 技术的出现,标志着 RPA 进入了 APA(AI Process Automation)时代。
APA 通过将 AI 与 RPA 结合,实现了更高级的自动化流程。AI 技术的应用使得 RPA 能够处理更复杂、更灵活的任务,如自然语言处理、图像识别等。这不仅提高了 RPA 的效率和准确性,还扩大了其应用范围。
企业对于 APA 的积极态度表明,AI 技术在自动化领域的应用前景广阔。未来,随着 AI 技术的不断进步,APA 将成为企业自动化流程的重要工具,为企业带来更高的效率和生产力。
总结
今日 AI 领域的主要动向集中在技术优化和应用场景的拓展。Zoom 的研究团队提出了一种全新的「草稿链」推理范式,通过简化中间推理步骤,大幅降低计算成本。零一万物发布了一款搭载华为 GPU 的模型一体机,展示了对 DeepSeek 模型的全面应用。四川大学则在 ICLR 2025 上提出了一种全新的 Test-time Adaptation 范式,以应对查询偏移挑战。此外,Neurobo 通过将 AI 技术与二次元产品结合,为年轻人带来了全新的消费体验。这些技术的不断进步,为 AI 的普及和应用提供了更多可能性,预示着未来 AI 技术将更加高效和智能。
作者:Qwen/Qwen2.5-32B-Instruct
文章来源:极客公园, 量子位, 钛媒体, 机器之心
编辑:小康