【20251219AI日报】Palona goes vertical, launching Vision, Workflow features: 4 key lessons for AI builders

本文字数：约 4000 字，预计阅读时间：20 分钟

Palona goes vertical, launching Vision, Workflow features: 4 key lessons for AI builders
Palona AI, a Palo Alto-based startup, has recently launched Palona Vision and Palona Workflow, which transform the company's multimodal agent suite into a real-time operating system for restaurant operations. Initially, the company aimed to build emotionally intelligent sales agents for broad direct-to-consumer enterprises. However, the shift to a restaurant and hospitality focus demonstrates a strategic move to solve high-stakes physical world problems. The company's multimodal native approach ensures the system can process vision, voice, and text simultaneously, enabling real-time analysis of operational signals and automated multi-step processes. Key lessons from this transition include the need for a flexible architecture that can adapt to the rapidly changing landscape of large language models (LLMs) and the importance of domain expertise to build deep systems that solve real-world problems. Palona's emphasis on reliability and custom memory architecture highlights the challenges and solutions in deploying AI in complex operational environments.

Anthropic launches enterprise ‘Agent Skills’ and opens the standard, challenging OpenAI in workplace AI
Anthropic has introduced the Agent Skills technology as an open standard, aiming to establish it as an industry norm. This move includes organization-wide management tools and a directory of partner-built skills from leading companies like Atlassian, Figma, Canva, Stripe, Notion, and Zapier. The concept of Skills involves folders containing instructions, scripts, and resources that enable AI systems to perform specific tasks consistently. This addresses the limitation of large language models (LLMs) in specialized professional work, such as creating PowerPoint presentations with preferred formatting conventions. Anthropic's approach, which incorporates progressive disclosure, allows extensive skill libraries to be deployed without overwhelming the AI's working memory. The strategy of releasing Skills as an open standard is seen as a way to foster ecosystem growth rather than proprietary lock-in, with OpenAI quietly adopting structurally similar architecture in its own systems. This convergence suggests the industry is moving towards a common solution for making AI assistants proficient in specialized work.

火山引擎的「火」，是怎么点起来的
火山引擎，作为字节跳动旗下的云服务平台，其迅速崛起得益于其对AI能力的深刻理解与应用。公司通过其「AI云原生」战略，不仅在内部使用字节跳动的基础模型，还连接着更广阔的真实世界需求，这正是其MaaS（模型即服务）业务高速增长的关键。火山引擎的「火」，实际上是通过不断的技术创新、场景落地和生态建设来点燃的。其最新的模型豆包1.8版本，不仅增强了工具调用和屏幕操控能力，还提供了Agentkit开发套件，涵盖从开发到部署的各个环节。此外，火山引擎在多模态（视频、语音、图像）的理解和生成能力上也取得了显著进展，成为MaaS增长的新赛点。这些能力不仅提升了模型的实用性和可用性，还为火山引擎带来了重要的战役制高点，使其在AI云服务市场中占据了不可忽视的地位。

GDPS 2025｜宇树、智元首次同台，上海如何以「应用」领跑具身智能竞赛？

GDPS 2025，作为全球首个全面对标世界技能大赛的具身智能赛事，展示了上海在具身智能应用领域的新进展。此次赛事的场景设计集中在真实应用环境中，如工厂、医院和家庭，挑战机器人在这些环境中的表现。通过这种竞技方式，GDPS 2025 不仅检验了技术的实用性，还通过评审机制和生态建设推动了具身智能从实验室走向市场。在这一过程中，上海展现了其在具身智能产业化进程中的独特站位和路径，以应用需求为导向，构建了适宜企业成长的系统性「沃土」。宇树和智元的同台亮相，更是证明了上海在这一领域的开放多元创新文化以及对具身智能企业的吸引力。

IF 2026 最大「黑马」：钢铁侠故事背后的温度和创新

Hypershell（极壳科技）在 IF 2026 上以其独特的消费类外骨骼产品吸引了大量关注。公司从技术突破出发，解决了传统外骨骼笨重和行动迟缓的问题，通过引入电驱技术，使其成为一种轻便且高效的设备。通过将目标用户定位在户外摄影师、背包客等硬核户外人群，Hypershell 成功改变了消费者对外骨骼的负面印象，打开了品类的市场空间。此外，AI 技术的应用，使外骨骼能够实现自适应地形和动作预测，进一步提升了用户体验。Hypershell 的成功故事展示了具身智能技术不仅能够增强人的能力，还能通过技术贴近真实生活，为用户提供更多的可能性。

人人都能当电影导演？万相 2.6 杀疯了：角色扮演、分镜控制，硬刚 Sora2

万相 2.6 的发布标志着阿里在多模态内容创作领域的重大突破，尤其是在视频生成方面。这款产品不仅在多镜头叙事、长视频生成以及角色一致性方面表现出色，还能通过音频驱动视频生成，实现高质量的内容创作。万相 2.6 通过支持角色定制和音色同步功能，解决了传统视频生成中的一致性问题。此外，其图像生成能力也显著提升，满足了设计圈的商用需求。通过一系列实测，万相 2.6 展现了其在内容创作领域的强大实力，为用户提供了更高效、更具创意的生产工具。

AI Emerges as a Key Accelerator in the Global Race for Longevity Breakthroughs, Say Industry Experts

行业专家认为，人工智能在生命科学领域的日益重要性正在重塑人们对如何快速有效实现人类寿命突破的预期。通过加速药物发现和使高度个性化的医疗干预成为可能，AI 正在成为全球长寿竞赛的关键加速器。专家指出，AI 在生命科学中的应用正在彻底改变我们对药物研发速度和效果的期望。这不仅有助于快速发现新药物，还为更精准的医疗干预提供了可能，从而推动人类寿命的延长。

北大发布 ManualVLA：首个长程「生成–理解–动作」一体化模型，实现从最终状态自主生成说明书并完成操纵

北京大学的研究团队发布了一种名为 ManualVLA 的全新模型，该模型能够实现从最终状态自主生成说明书并完成相应的操纵动作，是首个长程「生成–理解–动作」一体化模型。ManualVLA 的发布标志着在具身智能和多模态交互领域的重大进展，为解决复杂任务提供了新的工具和方法。该模型不仅展示了在生成说明文档方面的强大能力，还能够在实际环境中执行复杂的操作任务，为机器人和自动化系统在真实世界的广泛应用提供了有力支持。

Superintelligence Set to Disrupt the Job Market, Says Chinese AI Expert

中国人工智能专家指出，超级智能将对就业市场产生颠覆性影响。他建议学生和家长不要过于担心未来的职业前景，而是应优先发展好奇心和创造力。这些人类特质是AI无法复制的，未来将最有价值。专家强调，尽管AI技术的发展可能会取代某些工作岗位，但新的职业机会也将随之产生。因此，培养创新思维和解决问题的能力将成为未来成功的关键。

150分钟，有关AGI的一切，柴天佑院士、何小鹏给出答案

柴天佑院士和何小鹏在一场持续150分钟的对话中讨论了关于AGI（人工通用智能）的一切。他们分享了AGI的发展现状、未来前景以及潜在的挑战。两位专家认为，AGI的发展将极大地改变人类社会的运作方式，特别是在自动化、决策支持和智能服务等领域。他们还讨论了AGI技术在不同行业的应用，以及如何确保这些技术的安全和伦理使用。这场对话为理解AGI的未来提供了一个全面的视角。

AI 上车，教练下车？驾校这门老生意变天了

AI 机器人教练的引入正在彻底改变驾校行业。这种技术通过降低培训成本和提高效率，让学员以更低的价格学习驾驶。然而，这也引发了驾校行业的重新洗牌和分层。传统的教练角色被机器人取代，驾校需要适应新的商业模式和技术手段，以保持竞争力。尽管AI机器人教练为学员带来了便利，但也对驾校的运营模式和教练的职业发展提出了挑战。

持仓10年浮亏超10亿，华谊兄弟“坑惨”阿里创投

阿里创投在华谊兄弟的投资上遭受了重大损失。据透露，阿里创投在华谊兄弟的持仓超过十年，但市值缩水超过10亿元。这一事件不仅对阿里创投的财务状况产生了影响，也引发了市场对文化传媒行业投资风险的关注。华谊兄弟作为一家知名的影视公司，其经营状况的波动直接影响了投资方的利益。

CES 2026钛媒体C位登场，邀你加入AI产业化元年的中国创新全球秀

作为CES 2026的官方合作媒体，钛媒体将在主馆中心区独家亮相，举办「Talk to the World Forums——对话世界」系列论坛及“中国创新之夜”高端闭门酒会。这将为中国创新科技提供一个展示给全球观众的舞台。钛媒体希望通过这一系列活动，展示中国在AI产业化领域的最新成果和创新思路，促进国际交流与合作。

不卖「工具」卖「生产力」，百融云创如何用「硅基员工」打破AI落地僵局？

百融云创通过引入「硅基员工」（AI助手）来提高生产力，打破传统AI工具在企业落地的僵局。该公司的AI助手不仅能够完成基础的办公任务，还能在复杂场景下提供决策支持。通过这种方式，百融云创为企业提供了更高效的解决方案，改变了以往AI工具在企业应用中的局限性。这些「硅基员工」的应用，为企业的数字化转型提供了新的思路和可能性。

与Physical Intelligence同日发声：深度机智亮出「情境数采」杀手锏，具身智能的通用性天花板要被捅破了？

深度机智在与Physical Intelligence同一天发布的「情境数采」技术，展示了在具身智能领域实现通用性的新突破。通过这一技术，深度机智能够更好地采集和处理复杂情境下的数据，为具身智能系统的决策提供更准确的依据。这项技术的应用有望推动具身智能在更多领域的应用，打破现有的通用性天花板，为智能机器在实际环境中的应用提供新的可能。

总结

今日的AI领域新闻主要集中在企业如何利用AI技术解决具体行业问题和提升用户体验上。Palona和Anthropic展示了如何通过AI技术解决餐厅运营和企业内部工作流程优化的问题。火山引擎和GDPS 2025则体现了AI技术在多模态应用和具身智能领域的进展，以及如何通过开放标准促进生态发展。此外，Hypershell和万相2.6等企业的案例展示了AI技术在具身智能和多模态内容创作领域的最新应用。总体来看，AI技术正不断向实际应用领域深化，通过解决具体问题和提升用户体验，推动行业的进步和创新。

作者：Qwen/Qwen2.5-32B-Instruct
文章来源：钛媒体, 机器之心, 量子位, VentureBeat, 极客公园, 雷锋网
编辑：小康