【20250920AI日报】星巴克中国创新科技中心发布数字化成果;喜茶「超级植物茶」一周年卖出1亿杯;始祖鸟运动员刘洋携团队成功完攀卓木拉日三峰|消研所周报

今日新鲜事 · 25 天前
本文字数:约 2650 字,预计阅读时间:10 分钟

重点新闻

蚂蚁数科发布EnergyTS 2.0:以更高精度预测助力企业降低用能成本

蚂蚁数科近日发布了EnergyTS 2.0版本,这是一个基于时间序列预测的能源管理系统,旨在帮助企业降低用能成本。相比于1.0版本,EnergyTS 2.0的参数规模从1B扩展至7B,这意味着其在数据处理能力、模型复杂度以及预测精度上都有了显著提升。EnergyTS 2.0的核心在于通过深度学习技术,对企业的能源使用情况进行精准预测,帮助企业提前规划能源使用,优化能源管理策略,从而降低能源成本。此外,EnergyTS 2.0还提供了多种预测模型,包括长短期记忆网络(LSTM)、自回归模型等,以适应不同企业的用能特点。该系统的发布不仅为能源管理领域带来了新的解决方案,也展示了蚂蚁数科在AI技术应用上的强大实力。

超强开源模型Qwen3、DeepSeek-V3.1,都被云计算一哥「收」了

云计算巨头亚马逊云科技(AWS)近日宣布,已经成功“收集”了Qwen3和DeepSeek-V3.1两大开源AI模型。Qwen3和DeepSeek-V3.1分别是自然语言处理(NLP)和计算机视觉(CV)领域的先进模型,它们的加入将进一步丰富AWS的AI模型库。Qwen3是一个基于Transformer架构的大型语言模型,具备强大的文本生成能力;而DeepSeek-V3.1则是一个高性能的图像识别和处理模型,能够处理复杂图像识别任务。亚马逊云科技对这些模型的“收集”不仅展示了其在AI技术领域的持续投入,也为全球开发者提供了更强大的AI工具和服务。通过整合这些模型,AWS能够更好地服务于各类企业客户,助力其在AI应用方面取得突破。

攻克大模型训推差异难题,蚂蚁开源新一代推理模型Ring-flash-2.0

蚂蚁集团近日宣布开源其新一代推理模型Ring-flash-2.0,旨在解决大模型在训练和推理过程中的差异问题。Ring-flash-2.0通过一系列优化技术,提高了模型在推理阶段的性能和效率,使其更加适用于实际应用环境。具体而言,Ring-flash-2.0采用了更高效的参数压缩技术,能够在保持模型精度的同时,大幅降低模型的计算复杂度和存储需求。此外,该模型还引入了动态量化技术,能够在推理过程中实时调整模型的量化参数,以适应不同的计算资源和需求。Ring-flash-2.0的开源不仅为开发者提供了更高效的推理模型,也推动了大模型在实际应用中的落地。


其他新闻

超强开源模型Qwen3、DeepSeek-V3.1,都被云计算一哥「收」了

新闻图片

云计算巨头亚马逊云科技(AWS)近日宣布,已经成功“收集”了Qwen3和DeepSeek-V3.1两大开源AI模型。Qwen3和DeepSeek-V3.1分别是自然语言处理(NLP)和计算机视觉(CV)领域的先进模型,它们的加入将进一步丰富AWS的AI模型库。Qwen3是一个基于Transformer架构的大型语言模型,具备强大的文本生成能力;而DeepSeek-V3.1则是一个高性能的图像识别和处理模型,能够处理复杂图像识别任务。亚马逊云科技对这些模型的“收集”不仅展示了其在AI技术领域的持续投入,也为全球开发者提供了更强大的AI工具和服务。通过整合这些模型,AWS能够更好地服务于各类企业客户,助力其在AI应用方面取得突破。

华为超节点:用「一台机器」的逻辑,驱动AI万卡集群

华为近日发布了名为“超节点”的AI计算平台,该平台通过“一台机器”的逻辑,实现了对万卡集群的高效管理和调度。超节点的核心在于其独特的硬件架构和软件优化技术,能够将多个计算节点高效整合,形成统一的计算资源池。这不仅大幅提升了计算效率,还降低了系统的复杂度和运维成本。通过超节点,华为旨在推动AI技术在大规模计算环境中的应用,尤其是在深度学习和大规模数据分析领域。这一创新技术为AI应用提供了强大的算力支持,有助于加速AI技术的发展和普及。

5555被拒稿,AC接收但PC强拒,NeurIPS揭榜引争议

在近期的NeurIPS(神经信息处理系统大会)论文评审过程中,一篇编号为5555的论文经历了复杂且充满争议的评审过程。该论文首先被拒稿,随后被AC(领域主席)接收,但又被PC(程序委员会)强烈拒绝。这一过程引发了学术界的广泛关注和讨论。该事件不仅暴露了论文评审过程中的复杂性和不确定性,也反映了学术界在处理大规模评审任务时面临的挑战。NeurIPS作为AI领域的顶级会议,其评审结果对研究者的职业发展和学术声誉有着重要影响,因此,该事件也促使学术界进一步反思和完善评审机制。

关税还不够?美国盯上中国卖家“钱包”

新闻图片

美国政府近期再次加大对从中国进口商品的监管力度,不仅提高了关税,还开始关注中国卖家的资金流动情况。此举被认为是美国政府试图通过多种手段限制中国商品进入美国市场。对于中国卖家而言,这不仅增加了运营成本,还可能导致资金流动受限,影响其在美国市场的竞争力。这一举措的背后,反映了中美贸易关系的复杂性和紧张态势。对于中国卖家来说,如何适应新的监管环境,寻找新的市场机会,将是未来一段时间内的挑战。

从抖音的“大甲方”,到线下的“大乙方”:转转的2.0生存法则 | 巴伦精选

新闻图片

二手交易市场平台转转近期宣布进入2.0阶段,从线上走向线下,探索新的生存法则。转转作为二手交易市场的代表,一直致力于提供高效、可信的交易环境。在2.0阶段,转转将重点拓展线下渠道,通过开设实体店等方式,进一步提升用户体验。这一战略调整不仅反映了二手交易市场的快速发展,也展示了转转在面对市场变化时的灵活应对能力。通过线上线下结合的方式,转转有望进一步巩固其在二手交易市场的领先地位。

超强开源模型Qwen3、DeepSeek-V3.1,都被云计算一哥「收」了

新闻图片

云计算巨头亚马逊云科技(AWS)近日宣布,已经成功“收集”了Qwen3和DeepSeek-V3.1两大开源AI模型。Qwen3和DeepSeek-V3.1分别是自然语言处理(NLP)和计算机视觉(CV)领域的先进模型,它们的加入将进一步丰富AWS的AI模型库。Qwen3是一个基于Transformer架构的大型语言模型,具备强大的文本生成能力;而DeepSeek-V3.1则是一个高性能的图像识别和处理模型,能够处理复杂图像识别任务。亚马逊云科技对这些模型的“收集”不仅展示了其在AI技术领域的持续投入,也为全球开发者提供了更强大的AI工具和服务。通过整合这些模型,AWS能够更好地服务于各类企业客户,助力其在AI应用方面取得突破。

攻克大模型训推差异难题,蚂蚁开源新一代推理模型Ring-flash-2.0

新闻图片

蚂蚁集团近日宣布开源其新一代推理模型Ring-flash-2.0,旨在解决大模型在训练和推理过程中的差异问题。Ring-flash-2.0通过一系列优化技术,提高了模型在推理阶段的性能和效率,使其更加适用于实际应用环境。具体而言,Ring-flash-2.0采用了更高效的参数压缩技术,能够在保持模型精度的同时,大幅降低模型的计算复杂度和存储需求。此外,该模型还引入了动态量化技术,能够在推理过程中实时调整模型的量化参数,以适应不同的计算资源和需求。Ring-flash-2.0的开源不仅为开发者提供了更高效的推理模型,也推动了大模型在实际应用中的落地。


总结

今日的AI领域主要动向包括蚂蚁数科发布了EnergyTS 2.0,提升了能源管理的精度和效率;亚马逊云科技“收集”了Qwen3和DeepSeek-V3.1等开源模型,进一步丰富了其AI工具库;华为推出了超节点AI计算平台,旨在提高大规模计算环境中的性能和效率;NeurIPS评审过程中出现的争议事件,反映了学术评审机制的复杂性和挑战;蚂蚁集团开源了新一代推理模型Ring-flash-2.0,以解决大模型训推差异难题。这些新闻不仅展示了AI技术在不同领域的广泛应用,也体现了科技公司在AI领域的持续创新和投入。


作者:Qwen/Qwen2.5-32B-Instruct
文章来源:量子位, 机器之心, 钛媒体
编辑:小康

Theme Jasmine by Kent Liao