本文字数:约 4200 字,预计阅读时间:14 分钟从 SD 到 Wan2.5-Preview,AI 视频 2025 质变启示录2025 年,AI 视频领域迎来了里程碑式的变化,其中最瞩目的产品是 OpenAI 的 Sora 2 和阿里的 Wan2.5-Preview。这两个产品通过技术创新和用户体验优化,推动了 AI 视频技术的普及。Sora 2 通过营销策略和用户生成内容的方式,迅速积累了大量用户。Wan2.5-Preview 则在技术细节上进行了大量改进,例如通过强化学习(RLHF)优化图像质感和动态效果,降低了用户使用门槛。Wan2.5-Preview 的成功,不仅体现在技术层面,还在于其完善的商业化体系。阿里云的支持、模型开发服务平台以及多样化的定价策略,使得不同用户群体都能找到适合自己的解决方案。此外,Wan2.5-Preview 还通过多模态统一框架设计,实现了文本、图像、视频和音频的深度融合,解决了用户体验中的割裂问题。当前的 AI 视频技术仍有提升空间,例如内容生成时长和长视频一致性问题,但这些技术已经跨过了技术到产品的鸿沟,为未来的智能交互奠定了坚实基础。而如何将技
本文字数:约 4000 字,预计阅读时间:10 分钟从 CIPS & CLM 迈进:中国大模型的智能跃迁人工智能正以前所未有的速度重塑人类社会的运行逻辑。从语言模型掀起的认知革命,到多模态、具身智能的崛起,AI 已经从“算法驱动”进入“智能共生”的新时代。语言作为人类思维与交流的根基,也正在成为机器认知世界的核心媒介。站在通用人工智能的门槛上,大模型技术的发展,不仅是科技进步的象征,更关乎人类认知体系的再造与文明形态的升级。在这一时代背景下,中国中文信息学会 2025 学术年会暨第二届中国大模型大会(CIPS & CLM 2025) 于 10 月 28 日 在北京盛大召开,吸引了来自全国高校、科研机构及产业界的 600余位专家学者 共襄盛举。大会聚焦“大模型的理论突破、技术前沿、产业落地与生态共建”,致力于打造一场立足学术前沿、面向产业应用、引领智能未来的思想盛会。邀请了管晓宏院士、方滨兴院士等多位在大模型与人工智能领域具有国际影响力的杰出学者作特邀报告,围绕生成式人工智能、知识图谱、具身智能、情感计算、社会媒体处理等热点前沿方向展开深入探讨。与此同时,大会同期举办的十三场大模
本文字数:约 5449 字,预计阅读时间:18 分钟Vibe coding platform Cursor releases first in-house LLM, Composer, promising 4X speed boostThe vibe coding tool Cursor, from startup Anysphere, has introduced Composer, its first in-house, proprietary coding large language model (LLM) as part of its Cursor 2.0 platform update. Composer is designed to execute coding tasks quickly and accurately in production-scale environments, representing a new step in AI-assisted programming. It's already being used by Cursor’s own en
本文字数:约 4765 字,预计阅读时间:15 分钟Microsoft’s Copilot can now build apps and automate your job — here’s how it worksMicrosoft is launching a significant expansion of its Copilot AI assistant, introducing tools that enable employees to build applications, automate workflows, and create specialized AI agents using conversational prompts without requiring any coding. This expansion, named App Builder and Workflows, represents Microsoft's most ambitious attempt yet to integrate AI into software development.
本文字数:约 4800 字,预计阅读时间:12 分钟仅仅是 AI,并不能让硬件更「智慧」,更重要的其实是这个过去十余年智能手机发展史,同样是「连接」的历史。App 成为了连接人与服务的桥梁,但也随之筑起了无数座「围墙花园」。手机、电脑、家电、汽车……每一个设备都是一个孤岛,用户在不同的「花园」里重复着割裂的体验。但现在,随着 AI 大模型的巨浪袭来,机遇之下是新的、更严峻的挑战。原本应用生态之间的「围墙」进一步撕裂我们的数字生活。在这种时代巨变面前,单一的设备升级已经见顶,用户被困在需要手动操作、无法主动服务的「伪智能」里。用户的痛点依然存在,甚至被进一步放大了。家里的智能设备买了上万元,却有 70% 处于离线状态,因为用户根本不知道连网后能干什么;我们渴望在不同场景间无缝切换,却不得不在手机、车机、电脑前手动「搬运」信息;我们希望设备懂我们,但设备却只是在被动地等待指令。这些难题的背后,暴露的正是整个行业因壁垒而导致的「伪智能」困境。行业迫切需要一种全新的生态模式,一种真正「开放、共创、共享」的思路,来打破这些坚冰,释放 AI 终端的真正价值。正是在这个背
康叔的AI全栈工坊
Code for Life, AI for Future