【20260101AI日报】独家丨OpenAI、Meta都在押注的摄像头AI耳机,被这家中国明星创业公司抢先发布

今日新鲜事 · 14 天前
本文字数:约 8000 字,预计阅读时间:16 分钟

独家丨OpenAI、Meta都在押注的摄像头AI耳机,被这家中国明星创业公司抢先发布

光帆科技,一家中国创业公司,于近期宣布即将发布全球首个搭载摄像头的AI智能耳机,这标志着公司在AI硬件领域取得的突破性进展。由前小米自研手机及汽车OS负责人董红光离职创办,光帆科技聚焦于面向下一代人机交互的AI可穿戴硬件及通用AI Agent。在短短一年内,光帆科技完成了多轮融资,估值达到10亿元人民币。

与谷歌、苹果和Meta等巨头相比,光帆科技的这款AI耳机搭载了摄像头,能够实现环境感知和多设备联动。除了耳机本身,光帆科技还开发了自研的AgentOS系统,旨在为用户提供即时、主动和情境感知的AI服务体验。这款AI耳机将涵盖从点外卖到订机票等日常生活和办公场景的应用,几乎可以覆盖所有需求。

相比AI眼镜,AI耳机因其轻便性、佩戴接受度以及成熟的技术应用,成为AI可穿戴设备的新探索方向。光帆科技的选择也反映出行业对于多模态AI可穿戴设备的未来发展方向存在较大争议,但搭载摄像头的AI耳机正在逐渐成为一种共识方向。


圆桌论坛:关于“世界模型”突破方向的六个猜想 | GAIR 2025

在第八届GAIR全球人工智能与机器人大会上,彭思达、胡文博、王广润、韩晓光和修宇亮五位学者针对“世界模型”进行了深入探讨。彭思达认为,基于查询的基础模型将是2026年的趋势,而自监督学习的突破将是未来的重要方向。胡文博提到,当前的3D范式存在上限,需要新的范式来突破,这可能与世界模型的构建密切相关。

王广润则强调了世界模型在具身智能中的应用,认为VLA任务中3D重建与预测的引擎可能成为未来的重要发展方向。韩晓光指出,可交互性是世界模型的关键,而修宇亮认为数字人需要提供情绪价值,才能更贴近人类的需求,这涉及语音、表情和体态等多个模态。

会上,学者们还讨论了视频生成模型面临的范式天花板以及如何将不同模态的感知信息协调一致,形成整体感觉以打动人心的问题。此外,他们提出了建立世界模型技术联盟或发布倡议书的建议,以促进这一领域的进一步发展。


之江实验室薛贵荣:当AI开始做科研,我看到了大语言模型的天花板丨GAIR 2025

之江实验室的薛贵荣博士指出,尽管大语言模型(LLM)在多个学科研究中展现出潜力,但其本质上仍受限于“语言的边界”。为解决这一问题,薛贵荣团队研发了021科学基础模型,该模型超越语言空间,以理解多类型科学数据为目标。通过科学数据的Token化,021模型能够将不同类型的科学数据统一到一个高维空间中,从而实现跨学科知识融合和科学推理与发现。

021模型涵盖从基因组学到临床医学的全链路科学知识,支持全球204种语言的应用。薛贵荣还提出了推动科学基础模型发展的三种路径:种子班、科学家工作坊和开放研究平台。他希望这些努力能够加速科学的人工智能时代的到来,推动科学研究范式的变革。



京东副总裁郑宇:未来管理智慧城市,会像玩游戏一样简单丨GAIR 2025

京东集团副总裁郑宇教授在GAIR大会上介绍了时空AI的发展历程及其在物理世界中的应用。他强调了时空AI在解决物理世界问题时面临的挑战,包括数据稀缺、模型时空能力弱以及智能方案闭环难等。郑宇指出,城市计算可以作为具身智能的方法论,而具身智能将成为城市计算的核心组件。未来城市有望成为“巨大的具身智慧体”,管理城市就像玩游戏一样简单。

微分智飞高飞:我们正处于通用飞行智能爆发前夜丨GAIR 2025

微分智飞的高飞教授在GAIR大会上分享了智能飞行机器人研究进展及产业应用。他认为通用飞行智能已到爆发前夜,并介绍了飞行机器人的技术进展,包括环境感知、小脑本体归控、大脑端侧决策和群体协同智能等。高飞团队致力于打造敏捷、轻量、多任务的本体运控小脑,以及分布式的群体协同技术,以实现更智能的飞行机器人。

腾讯 ARC Lab 胡文博:“如何实现三维感知的视频世界模型,这非常值得探索”|GAIR 2025

腾讯ARC Lab高级研究员胡文博在GAIR大会上介绍了如何实现三维感知的视频世界模型。通过从二维视频中重建三维信息,并将重建的三维信息融入视频扩散模型,胡文博团队实现了对静态和动态场景的探索,以及支持在四维场景中同时进行探索与交互。这些技术进展有助于提高视频生成的质量和三维感知能力。

对话微分智飞高飞:看具身智能如何引发飞行认知革命 | GAIR 2025

在与AI科技评论的对话中,微分智飞创始人兼CEO高飞讨论了具身智能在飞行机器人领域的应用。他强调了飞行具身智能与传统无人机智能的本质区别,并介绍了团队在分布式集群技术上的进展。高飞认为,具身智能是重新定义机器人的关键,能够实现从信息输入到自主学习和任务执行的闭环。

超DeepEP两倍!无问芯穹FUSCO以「空中变阵」突破MoE通信瓶颈,专为Agent爆发设计

无问芯穹的FUSCO模型通过创新的“空中变阵”策略突破了MoE通信瓶颈,其性能超过DeepEP模型的两倍。该模型专为Agent的爆发性需求设计,提高了计算效率和通信效率。

「视频世界模型」新突破:AI连续生成5分钟,画面也不崩

在视频生成领域,最新的“视频世界模型”取得了突破性进展,能够连续生成5分钟的视频而画面保持稳定。这一进步标志着AI在视频生成方面的能力显著提升。

刚刚,稚晖君发布的人形机器人Q1,小到能塞进书包

稚晖君发布的新款人形机器人Q1,具有小巧的体积,能够轻松放入书包。这一设计使得人形机器人更加便携,拓宽了其应用范围。

打造“真机数据引擎”,睿尔曼智能摘得“2025年度中国商业创新金鼎典范企业”

睿尔曼智能凭借其“云领计划”在商业创新方面的突破性实践,摘得“2025年度中国商业创新金鼎典范企业”荣誉。该计划通过构建远程劳动力网络,实现劳动力资源的跨时空高效配置,并积累真实场景数据,推动具身智能技术的迭代。

总结

今日AI领域的新闻覆盖了从硬件设备(如摄像头AI耳机)、软件模型(如021科学基础模型、视频世界模型)到具体应用(如智慧城市、飞行机器人)等多个方面,展现了AI技术在不同领域的快速发展与创新。无论是创业公司的突破性产品发布,还是学术界关于“世界模型”的深入探讨,都揭示了AI技术在推动社会进步和产业升级中的重要作用。未来,随着更多创新技术的涌现,AI将在更多领域实现智能化应用,为人类社会带来更多的便利与可能性。

作者:Qwen/Qwen2.5-32B-Instruct
文章来源:钛媒体, 雷锋网, 机器之心, 量子位
编辑:小康

Theme Jasmine by Kent Liao