
《科创板日报》6月29日讯(记者 张洋洋)在“具赋新能 智驱未来”青年科学家成果转化暨具身智能高质量发展研修会上,千寻智能具身智能部负责人解浚源对行业现状与前景作出研判分析。他把当前具身智能发展水平类比于GPT1至GPT3之间,而视觉-语言-动作(VLA)模型的兴起,正为该领域开启遵循“Scaling Law”(规模法则)实现能力跃升的可能性。
解浚源分析,具身智能涵盖“本体”(小脑)与“运控”(大脑)两大核心。虽然本体机械性能已相当成熟,但“大脑”层面的智能算法曾长期遇阻。
VLA模仿学习路线的兴起成为关键转折点。Diffusion Policy生成模型,有效解决传统行为克隆的“多模行为平均化”难题,支持从随机状态生成多元路径。
VLM与Diffusion Policy结合(VLA范式),借助互联网海量数据预训练赋予模型“世界先验知识”,显著降低对真机数据的依赖,实现强泛化能力。
受大模型训练范式启发,千寻智能也是采用了类似的方式,利用互联网数据预训练,建立基础认知;真机数据模仿学习,学习具体动作;强化学习优化,将成功率从95%提升至99%以上,补足最终精度缺口。
解浚源预判,若Scaling Law在具身智能领域成立,伴随量产与基础设施完善,机器人数据量有望按每年一个数量级递增,例如今年百台级,明年千台级,后年万台级。据此推测,未来3至5年内,具身智能技术效果有望实现从GPT1到GPT4级别的跨越式发展。
值得关注的是,千寻智能创立于2024年2月,发展势头迅猛。成立4个月内即完成近2亿元种子轮+天使轮融资;今年3月再宣布完成5.28亿元人民币Pre-A轮融资。成立半年累计融资已超7亿元。
资方阵容强大,Pre-A轮由沙特阿美风险投资旗下Prosperity7 Ventures(P7)领投,招商局创投、广发信德、靖亚资本、东方富海、华控基金、达晨财智、柏睿资本、弘晖基金等多家头部机构参投。
创始团队上,两位联合创始人背景深厚——韩峰涛曾任珞石机器人联合创始人&CTO,拥有丰富机器人制造与量产经验,高阳曾是清华大学交叉信息研究院助理教授,现兼任公司首席科学家。
