【20250411AI日报】刚刚,商汤发布第六代大模型:6000亿参数多模态MoE,中长视频直接可推理

今日新鲜事 · 04-10

本文字数:约 3500 字,预计阅读时间:15 分钟

刚刚,商汤发布第六代大模型:6000亿参数多模态MoE,中长视频直接可推理

商汤科技在2025年的最新发布会上推出了其第六代大模型,这个模型名为“多模态MoE”,具备6000亿参数,是一个规模庞大、功能强大的AI系统。MoE(Mixture of Experts)模型结构意味着它可以更高效地处理复杂的多模态数据,如文本、图像和视频等。此次发布的模型不仅能够处理大规模的文本和图像数据,还特别优化了对中长视频的推理能力。这意味着该模型可以在观看类似《柯南》这样的复杂剧情时直接进行推理,分析剧情的发展和人物关系,从而更好地理解视频内容并提供相关的分析和解释。这种技术的突破将大大提升视频内容的理解和分析能力,为娱乐、教育、医疗等多个领域带来革命性的变化。

What’s inside the LLM? Ai2 OLMoTrace will ‘trace’ the source

新闻图片

来自Ai2的开源工具OLMoTrace为大语言模型(LLM)的透明度和可追溯性带来了革命性的变化。此工具能够直接追踪LLM的输出,将这些输出追溯到原始训练数据。这项技术的实现,不仅为AI决策过程提供了透明度,也解决了企业对于AI决策的信任问题。OLMoTrace允许用户查看模型的决策依据,这有助于增强用户对AI系统的信任,并确保模型的决策过程符合伦理和法律标准。此外,OLMoTrace的开源性质意味着它可供研究者和开发者共同改进和验证,进一步推动了AI技术的透明性和可靠性。

DeepCoder delivers top coding performance in efficient 14B open model

新闻图片

DeepCoder-14B是一款高效的开源大模型,能够提供顶级的编程性能。这款模型的竞争水平堪比前沿的o3和o1模型,其权重、代码和优化平台均开源。DeepCoder-14B的设计旨在提升编程效率,减少开发者在编码过程中遇到的障碍。通过使用DeepCoder-14B,企业可以快速生成高质量的代码,加速软件开发过程。此外,开源的特性使研究者和开发者能够自由地改进和扩展模型,从而推动编程领域的发展。


华为云发布CloudMatrix 384超节点,已规模上线昇腾云

华为云在最新发布中推出了CloudMatrix 384超节点,这是一款专门为大规模AI计算设计的高性能计算平台。该平台采用了最新的昇腾芯片技术,旨在为用户提供强大的算力支持。通过CloudMatrix 384超节点,华为云能够满足企业和科研机构在AI训练、推理、图像处理等领域的高性能计算需求。此产品的推出将进一步巩固华为在AI计算领域的领先地位,并为企业和开发者提供更强大、更灵活的计算资源。

Writer unveils ‘AI HQ’ platform, betting on agents to transform enterprise work

新闻图片

Writer公司发布了名为“AI HQ”的新平台,该平台利用自主代理技术来执行跨系统的复杂工作流程,以期提升企业的生产力。AI HQ平台通过自主代理执行任务,可以减少人力需求,同时提高工作效率。Writer认为,通过将复杂任务自动化,AI HQ平台不仅可以提高企业的生产力,还能为企业的AI投资带来可衡量的回报。该平台的应用领域广泛,包括内容创作、数据分析和业务流程自动化等,有望成为企业数字化转型的关键工具。

ChatGPT’s memory can now reference all past conversations, not just what you tell it to

ChatGPT Plus和Pro用户现在可以使用更新后的“Memory”功能,该功能允许ChatGPT参考所有过去对话,而不仅仅是用户指定的内容。这意味着ChatGPT可以更好地理解和回应用户的请求,提供更连贯和个性化的对话体验。这一改进提升了ChatGPT的对话质量和用户体验,使其在客户服务、教育和娱乐等多个领域更具实用性。通过记忆功能的增强,ChatGPT能够更有效地利用历史对话数据,为用户提供更加精准和个性化的服务。

NTT launches physics of AI group and AI inference chip design for 4K video

NTT Research在一次活动中宣布成立了新的AI基础研究小组,名为“物理人工智能小组”,并推出了针对4K视频的人工智能推理芯片设计。该小组专注于AI的物理学研究,旨在探索AI算法和硬件设计的前沿技术。新推出的AI推理芯片设计能够有效处理4K视频,提升视频处理的效率和质量。通过这项研究和设计,NTT Research希望在AI硬件和算法领域取得突破,推动4K视频处理技术的发展。

Why security stacks need to think like an attacker, and score every user in real time

随着复杂攻击手段的不断出现,企业必须在其核心安全基础设施中跟踪和控制这些攻击,并从其SOC(安全运营中心)进行管理。这意味着安全系统需要具备实时欺诈检测能力,以应对不断变化的威胁。通过采用实时风险评估和用户行为评分,企业可以更有效地识别和应对潜在的安全威胁。这种从风险到实时欺诈检测的转变,将帮助企业在保护数据和系统方面变得更加主动和高效。

戴尔再裁中国区员工,曾称全面停用中国芯片|钛媒体AGI

针对戴尔在中国裁员等相关事宜,戴尔中国表示不予置评,戴尔全球暂未回应。这则新闻虽然提及了裁员事件,但与AI领域关联不大,因此主要关注点在于戴尔的业务调整策略,对于AI技术及其应用影响较小。

迅捷兴复牌首日逆势下跌,上市首亏之际开启并购前景待考

迅捷兴在复牌首日股价逆势下跌,这反映了资本市场对其并购计划的不确定性。尽管这则新闻涉及资本市场动态,但与AI技术及其应用无直接关系。

关税风暴中的“砂砾”生存记:当供应链撞上104%的关税

这则新闻主要关注供应链在高关税环境下的生存挑战,尽管涉及经济贸易问题,但与AI技术及其应用无直接关联。

汽车芯片制造产业流向中国

这则新闻讨论了电动汽车领域的优势如何带动上游产业流向中国,虽然涉及芯片制造,但与AI技术及其应用无直接关系。

65岁,中国芯片“投资教父”,再造英特尔

这则新闻关注的是中国芯片投资领域的人物事件,尽管与芯片产业相关,但与AI技术及其应用无直接关系。

总结

今日AI领域的主要动向涵盖了大模型技术的不断进步,如商汤科技发布的第六代大模型和DeepCoder-14B的高效编程能力。此外,AI透明度和可追溯性的工具(如OLMoTrace)及自动化企业工作的平台(如Writer的AI HQ)也得到了显著发展。这些进展不仅提高了AI系统的性能和效率,还增强了其透明度和可信赖性。在硬件方面,华为云的CloudMatrix 384超节点和NTT的AI推理芯片设计展示了AI硬件的持续创新。总体而言,今天的AI新闻展示了AI技术在多个领域的持续进步和广泛应用,为未来的发展奠定了坚实基础。


作者:Qwen/Qwen2.5-32B-Instruct
文章来源:VentureBeat, 量子位, 机器之心, 钛媒体
编辑:小康

Theme Jasmine by Kent Liao