本文字数:约 3300 字,预计阅读时间:15 分钟Korean AI startup Motif reveals 4 big lessons for training enterprise LLMsMotif Technologies,一家韩国的AI初创公司,最近发布了一个名为Motif-2-12.7B-Reasoning的模型,并分享了他们在训练企业LLM时的四大重要经验。这些经验对希望构建或微调自己模型的企业团队有着极大的参考价值。第一,推理能力的提升来自于数据分布而非模型大小。Motif发现,合成推理数据只有在与目标模型的推理风格匹配时才有效。这意味着企业内部团队不应简单地复制外部数据集,而应确保合成数据符合推理阶段所需的格式、冗长程度和步骤细节。第二,长上下文训练首先是一个基础设施问题。Motif在Nvidia H100级硬件上实现了64K上下文训练,这依赖于混合并行性、仔细的分片策略以及激进的激活检查点技术。这对于希望构建具有长上下文能力模型的企业来说是一个重要的提醒:长上下文能力需要在训练堆栈的早期设计中考虑。第三,强化学习微调需要数据过滤和重用。Motif的强化学习微调
本文字数:约 3000 字,预计阅读时间:10 分钟重点新闻Build vs buy is dead — AI just killed it传统的“构建还是购买”的决策模式正在被人工智能彻底改变。在过去的几十年中,企业普遍遵循的原则是,如果某项技术是企业的核心业务,就选择自行构建;如果非核心业务,则选择购买。然而,随着人工智能技术的迅猛发展,这一决策模式正面临颠覆性的转变。人工智能的发展使得构建软件的过程变得前所未有的简单。过去需要数周甚至数月才能完成的开发任务,现在只需要几个小时,甚至几分钟就能完成。这种转变不仅降低了开发成本,还大幅减少了所需的技术专业知识。非技术背景的员工也能通过使用人工智能工具,快速构建和修复软件。以作者的亲身经历为例,一名不熟悉编程的员工仅花费了两个小时就构建了一个可行的原型,解决了客户反馈中的一个技术问题。这一过程不仅迅速,还大幅降低了成本。这种新的构建模式不仅节省了时间和成本,还为企业提供了更多的灵活性。企业在决定购买之前,可以通过快速构建原型来验证需求,从而避免不必要的投资。这种新的构建模式不仅改变了企业的技术决策流程,还重新定义了技术团队与业务团队之间
本文字数:约 2700 字,预计阅读时间:10 分钟Why most enterprise AI coding pilots underperform (Hint: It's not the model)生成式AI在软件工程中已经远远超越了自动完成功能。新兴的前沿领域是代理编码:能够规划更改、在多个步骤中执行更改并根据反馈进行迭代的AI系统。然而,尽管对“能够编码的AI代理”充满期待,大多数企业的部署却表现不佳。限制因素不再是模型本身,而是上下文:被更改代码的结构、历史和意图。换句话说,企业现在面临的是系统设计问题:他们尚未设计出这些代理可以运作的环境。从辅助到代理的变化在过去一年中,从辅助编码工具到代理工作流程的转变迅速。研究开始正式定义代理行为:在设计、测试、执行和验证方面进行推理,而不仅仅是生成孤立的代码片段。像动态动作重采样这样的工作表明,允许代理分支、重新考虑和修订自己的决定,显著改善了大型、相互依赖的代码库的产出。在平台层面,GitHub等供应商正在建立专门的代理编排环境,如Copilot Agent和Agent HQ,以支持真实企业管道中的多代理协作。但早期的现场结果讲述
本文字数:约 4000 字,预计阅读时间:15 分钟IDCC 2025:全球进入算力效能竞争期,商汤大装置给出中国式解决方案第二十届中国IDC产业年度大典(IDCC2025)暨数字基础设施科技展(DITExpo)于北京举办,商汤科技大装置事业群智算中心总经理林海在会上发表了题为《从稳定保障到效率引领——商汤大装置算电协同创新实践》的主题演讲。林海指出,算力基础设施正迎来新一轮“算力效能”战略竞争,而商汤大装置给出了中国式的解决方案。从全球范围看,算力基础设施正迎来新一轮“算力效能”战略竞争,包括各大科技巨头通过自研AI加速器、数据中心液冷、可再生能源电力协同等方式不断提升算力效能。同时,以Palantir “Chain Reaction”等平台为代表,将算力调度、电力预测与芯片资源管理纳入同一体系,试图构建“国家级AI基础设施操作系统”。商汤大装置作为国内领先的AI基础设施,在算电协同领域的探索,以体系化设计给出了一套中国式“算力—能源”协同建设范式,为我国在下一阶段的AI基础设施竞争中赢得技术主动权。商汤大装置在算电协同领域的探索,以核心技术为驱动,以实战成效为验证,构建了与国际先进
本文字数:约 4600 字,预计阅读时间:15 分钟Nous Research just released Nomos 1, an open-source AI that ranks second on the notoriously brutal Putnam math examNous Research, a San Francisco-based artificial intelligence startup, has released an open-source mathematical reasoning system called Nomos 1. This AI system has achieved near-elite human performance on this year's William Lowell Putnam Mathematical Competition, a prestigious and notoriously difficult undergraduate math contest. The Putnam exam is known fo
康叔的AI全栈工坊
Code for Life, AI for Future