本文字数:约 4000 字,预计阅读时间:15 分钟Nous Research's NousCoder-14B is an open-source coding model landing right in the Claude Code momentNous Research, 一家由加密货币风投公司Paradigm支持的开源人工智能初创公司,于周一发布了一款新的编程模型,称为NousCoder-14B。该公司表示,该模型在仅用4天时间使用48个Nvidia B200图形处理器训练后,能够匹配或超越多个更大的专有系统。NousCoder-14B在LiveCodeBench v6上实现了67.87%的准确率,这是一个标准化评估,测试模型在2024年8月至2025年5月期间发布的竞争性编程问题上的表现。这一数值比其基础模型阿里巴巴的Qwen3-14B提高了7.08个百分点。此外,该模型的训练环境、基准测试套件和训练工具都已完全公开,这意味着任何拥有足够计算资源的研究人员都可以复制或扩展这项工作。与竞争对手的模型相比,NousCoder-14B的独特之处在于其训练方式。训练过程中,研究人员
本文字数:约 4300 字,预计阅读时间:15 分钟重点新闻Broadcom Secures $21 Billion AI Chip Deal with AnthropicBroadcom 宣布与 Anthropic 达成了一项价值 210 亿美元的 AI 芯片交易。这一举措标志着 Broadcom 在人工智能领域的进一步扩展。尽管公司文化备受批评,Broadcom 的自愿离职率却保持在相对较低的 2.9%,与 Nvidia 相当。公司通过给予资深工程师高额股票奖励,维持了工程师团队的稳定性,从而最大化生产力。此次交易不仅提升了 Broadcom 在 AI 芯片市场的地位,也展示了其在 AI 技术方面的持续投入。随着 Anthropic 对高性能 AI 芯片需求的增加,Broadcom 的芯片产品将广泛应用于各种 AI 应用,包括自然语言处理、图像识别和机器学习等领域,为 AI 技术的发展提供坚实的基础。AMD Unveils Faster AI Chip at CES Alongside Fei-Fei Li and OpenAI Executives在 CES 上,AMD 宣布了一
本文字数:约 2500 字,预计阅读时间:10 分钟The creator of Claude Code just revealed his workflow, and developers are losing their minds本次新闻报道了Claude Code的创造者Boris Cherny在X上分享其工作流程的帖子,引发了整个工程社区的轰动。Cherny的帖子揭示了其使用AI助手进行软件开发的革命性方法,使得他在开发过程中几乎可以单枪匹马地完成一个小型工程部门的工作量。Cherny通过并行运行五个Claude AI代理,显著提高了其工作效率。每个代理负责不同的任务,如测试套件运行、模块重构和文档编写等,这些任务通过iTerm2系统通知进行协调。此外,Cherny还强调了使用最智能的AI模型,即使其运行速度较慢,也能提高整体效率,因为他减少了后期纠正错误的时间。通过维护一个名为CLAUDE.md的文件,Cherny的团队解决了AI模型的遗忘问题,使得每次错误都能被记录下来,从而不断优化AI的表现。Cherny的工作流程展示了AI在软件开发中的巨大潜力,预示着未来软件工程师如
本文字数:约 3739 字,预计阅读时间:12 分钟智能体应用落地、可信平台升级,北电数智“数算模用”全栈赋能医疗数智化提质增效临床大数据难汇聚、难挖掘、难流通问题,长期制约着医疗行业从经验驱动向数据驱动的转型,也是精准医疗落地的核心瓶颈。北电数智在可信数据领域有着深厚技术积累,对医疗行业也有着深刻理解。12月27日,在第七届博鳌皮肤健康创新医学论坛上,由中日友好医院与北电数智共同开发的智能体应用“樱智医助”全新亮相,作为双方联合研发的“樱智α·皮肤专病大模型”的产品化应用,可深度嵌入从深度病例分析到安全用药指导的复杂临床决策全流程,目前已率先在博鳌超级医院投入临床应用并取得良好反馈。“樱智医助”具备临床思维、全程协同决策能力,区别于基于通用大模型的“答题式”辅助诊疗工具,深度嵌入临床工作流,辅助医生完成复杂诊疗决策。在实际应用过程中,“樱智医助”先辅助医生收集疾病信息,形成初步临床印象,再依据患者主诉、现病史症状及体格检查结果,构建鉴别诊断矩阵,清晰呈现各项诊断的支持与不支持依据,并附上决策路径建议,辅助医生进行下一步决策。在检查开具环节,“樱智医助”会基于模型的广泛知识结构,推荐经
本文字数:约 3000 字,预计阅读时间:15 分钟ControlNet作者张吕敏最新论文:长视频也能实现超短上下文ControlNet 是一个用于视频和图像生成的深度学习模型,它在图像生成和编辑领域取得了显著的进展。张吕敏在最新的论文中提出了一种新技术,能够在长视频中实现超短上下文的生成和编辑。这项技术突破了以往长视频处理中上下文长度的限制,使得视频生成和编辑的效率和效果得到了显著提升。通过使用新的上下文机制,该技术能够快速捕捉和应用视频中的关键帧信息,大幅降低了计算资源的消耗,并提高了视频生成的实时性。该技术的应用前景广泛,包括电影制作、游戏动画、虚拟现实等多个领域。通过进一步优化和扩展,未来可能实现更复杂、更细腻的视频生成和编辑,为内容创作者提供更多可能性。此外,该技术还可以应用于视频监控、自动驾驶等领域,提高对长视频数据的处理能力,从而推动相关领域的发展。LeCun在Meta还有论文:JEPA物理规划的「终极指南」在这篇论文中,Yann LeCun及其团队详细介绍了JEPA(Joint Embedding for Physics-Aware)模型,这是一种用于物理模拟和规划的深
康叔的AI全栈工坊
Code for Life, AI for Future