康叔的AI全栈工坊

康叔的AI全栈工坊

Code for Life, AI for Future

【20250403AI日报】2025美国最新奥数题，让大模型集体翻车，DeepSeek R1平均分也不到5%

本文字数：约 4500 字，预计阅读时间：15 分钟2025美国最新奥数题，让大模型集体翻车，DeepSeek R1平均分也不到5%2025年，美国最新奥数题引发了大模型的集体“翻车”事件，即便是最先进的DeepSeek R1模型，其平均得分也未能突破5%。这一结果揭示了当前大模型在解决复杂数学问题时存在的显著局限性。具体而言，这些奥数题不仅涉及高级数学知识，还要求模型具备复杂的逻辑推理和创新思维能力。这一事件引发了业界对于大模型在特定领域应用能力的深入探讨。虽然大模型在文本生成、图像识别等任务上已经取得了显著进步，但在需要深度推理和专业知识的领域，它们的表现仍然不尽人意。未来的研究方向可能将集中在如何增强模型的逻辑推理能力和专业知识掌握度，以应对更多挑战性任务。与此同时，这也为AI教育和培训领域带来了新的思考。在培养AI模型时，如何有效地融入高级数学知识和逻辑推理能力，是值得进一步探索的方向。此外，如何通过这些模型更好地辅助人类解决复杂数学问题，也是未来研究的一个重要方向。「Apple AI」中文版正式上线：还不太好用，但确实很「苹果」3月31日，Apple Intelligence

今日新鲜事 · 04-02

【20250402AI日报】全球狂卖 427 万辆，比亚迪给友商上了一堂「成本课」

本文字数：约 3500 字，预计阅读时间：15 分钟全球狂卖 427 万辆，比亚迪给友商上了一堂「成本课」比亚迪在2024年的财报中展现出了强大的增长势头，尤其在营收、净利润和现金分红三大核心指标上均创下历史新高。全年营收达到7771亿元，同比增长29%，首次超越特斯拉，标志着中国车企首次登顶全球新能源营收榜首。净利润达到402.54亿元，同比增长34%。比亚迪在回馈股东方面也不吝啬，拟向全体股东派发现金红利总额达120.77亿元，年度现金分红总额首次超过100亿元。尽管比亚迪在销量和营收上取得了显著增长，但单车售价的下滑仍是不可忽视的问题。2024年比亚迪单车的平均售价为14.45万元，相比2023年减少了约1.5万元。价格战的加剧导致整个价格体系下行，但比亚迪通过规模效应和运营效率的优化，反而实现了净利润率的提升，净利率达到了5.35%，同比增长0.36个百分点。比亚迪的电子业务表现尤为抢眼，收入达到了1596亿元，同比增长34.6%，增幅甚至超过了汽车业务的27.7%。在毛利率方面，尽管行业普遍面临价格战压力，比亚迪汽车业务毛利率达到22.3%，同比增长1.29个百分点。这一优势

今日新鲜事 · 04-01

【20250401AI日报】万字长文总结：DeepSeek 引发的 AI Infra 变革正在「加速」丨GAIR Live

本文字数：约 4150 字，预计阅读时间：14 分钟万字长文总结：DeepSeek 引发的 AI Infra 变革正在「加速」丨GAIR Live2025年3月22日，雷峰网、AI科技评论GAIR Live品牌举办了一场主题为“AI Infra变革进行时”的线上圆桌沙龙。圆桌主持人为3C AGI Partners创始人兼CEO王康曼，她一直专注于投资AI Infra赛道，其创立基金成立后仅一年多就已经成为英伟达全球VC联盟成员。圆桌还邀请了魔形智能创始人CEO徐凌杰、探微芯联CEO刘学和清程极智联合创始人师天麾共同开启了一场深度对话。深度对话中，嘉宾们围绕成本进一步压缩下，MaaS、一体机等AI Infra商业模式的前景、DeepSeek为国产芯片带来的启示、构建开源生态对于Infra的重要意义等多个方面发表了独到见解。目前，国内AI Infra初创的商业模式无非云上和线下两种，而DeepSeek之后有关云上MaaS能否盈利的讨论甚嚣尘上。深度对话中，嘉宾们围绕成本进一步压缩下，MaaS、一体机等AI Infra商业模式的前景、DeepSeek为国产芯片带来的启示、构建开源生态对于In

今日新鲜事 · 03-31

【20250331AI日报】防不胜防！成年人更容易「AI 成瘾」，为什么？！

本文字数：约 4250 字，预计阅读时间：12 分钟防不胜防！成年人更容易「AI 成瘾」，为什么？！人工智能已经无处不在，我们使用 AI 的方式，也逐渐从搜索引擎时期的「提问」，过渡到了 AI 聊天机器人时代的「对话」。这项研究揭示了成年人对 AI 的依赖已经到了病理级别，表现出典型的成瘾症状——沉迷、戒断反应、失控、甚至情绪被 AI 牵着走。研究团队收集了近 4000 万次的交互数据，其中包含 300 万次的对话，3600 万次对话话题的分类，4076 份参与者问卷。结果显示，与 AI 聊天的重度用户在现实生活中与朋友家人的联系越来越少，情感上对 ChatGPT 的依赖也水涨船高。研究发现，AI 成瘾的风险并不是平均分布，大部分人能保持理性，只有少数人会上头甚至成瘾。这种成瘾的苗头，在成年人中悄然滋长，尤其是在那些本就带着社交焦虑、渴望联结却又畏惧现实社交的人群。论文还指出，部分成年人对 AI 的依赖达到了病理层面，表现出了标准的成瘾迹象，比如频繁地、不自觉地打开 AI 进行对话，无法控制自己与 AI 互动的时间和频率。Beyond encryption: Why quantum c

今日新鲜事 · 03-30

【20250330AI日报】Google’s Gemini 2.5 Pro is the smartest model you’re not using – and 4 reasons it matters for enterprise AI

本文字数：约 3200 字，预计阅读时间：12 分钟重点新闻> Google’s Gemini 2.5 Pro is the smartest model you’re not using – and 4 reasons it matters for enterprise AIGoogle 的 Gemini 2.5 Pro 模型标志着其在基础模型竞赛中的重大飞跃，不仅在基准测试中表现出色，而且在易用性方面也有所突破。根据早期实验、基准数据以及开发者的实际反馈，这款模型值得企业技术决策者给予更多关注，特别是那些历史以来默认选择 OpenAI 或 Anthropic 的生产级推理任务的企业。以下是企业团队在评估 Gemini 2.5 Pro 时的四个主要收获：透明、结构化的推理能力：Gemini 2.5 Pro 提供了一种新的链式思考清晰度标准，能够展示其推理过程，使用户更容易理解和验证模型的决策过程。多样化的训练数据：模型在大量多样化的数据集上进行训练，这有助于提高其在各种任务上的泛化能力。性能优化：Gemini 2.5 Pro 在多个基准测试中表现出色，显示出比竞争对手更高的推理

今日新鲜事 · 03-29

Theme Jasmine by Kent Liao