曾来到混沌创新院第三模块的线下课堂,为大家做了主题为「具体智能:舍九取一的战略思考」的精彩分享。
一年时间,60人团队,维他动力如何完成从战略抉择到产品量产面市的全流程突破?
维他动力的成功之道在哪里?如何在内卷的机器人赛道中独辟蹊径,找到属于自己的「精准点位」?
先简单介绍一下我个人的背景。我读书的时候学的是模式识别与人工智能,主要研究方向是计算机视觉与机器学习,整体上比较偏学术。
2012年博士毕业后我加入百度,负责图像与互联网搜索相关技术。那段时间,正是以深度学习为代表的AI 1.0技术浪潮兴起的时期,像卷积神经网络、循环神经网络、LSTM(Long Short Term Memory,长短期记忆)网络等一系列模型快速发展,推动人工智能迎来第一轮爆发。
2015年,我从百度离开,跟随前老板余凯一起创立了地平线机器人,它是一家以AI芯片与智能汽车为主要业务的公司,而我主要负责自动驾驶相关的产品与技术研发工作。
我在去年年底离开了地平线,在地平线的十年里,我既见证了公司从初创到港股成功上市的历程,也完整见证了从AI 1.0技术爆发到第一个AI产业周期的全过程。
而我们当前无论是大模型、Agent智能体还是具身智能的发展,我认为都已经明确标志着AI 2.0时代的到来,也就是人工智能的第二个大周期。
这一周期大约从2017、2018年开始萌芽,直到ChatGPT的出现后真正引爆,如今我们正处在其高速发展的爆发阶段。与之伴随的是,产业增速也处在一个极高的水平。在投资领域,几乎所有的项目都与“AI+”紧密相关。
而这一现象背后,是技术革命内在的耦合逻辑:一项原理级技术的突破,往往会催生全新的产业浪潮。从蒸汽机、电力,到信息化与半导体,每一次都重塑了经济与社会结构。
AI作为一种全新的底层技术,必将深度重构互联网、软硬件乃至线下实体等各个领域。在这个宏大进程中,哪怕只找到一个细分的切入点,都可能孕育出重构行业格局的巨大机会。
我们正站在新技术大爆发的起点,新终端、新场景不断诞生,而这正是我们共同面对的时代机遇。
而具身智能作为人工智能领域中的重要一环,它同样正在迎来历史性的机遇期。接下来,我会从以下几个维度给大家分析阐释。
首先我认为算力、电力和智力等核心能力的成熟,奠定了今天机器人行业爆发的最核心基础。
第一,电力。电池的能量密度用10年的时间提高了一倍左右,而且这个速度还在加快;例如在电动汽车的续航里程方面,从十年前的百余公里,轻松突破至如今的千公里级别。
第二,算力。算力方面仍然遵循摩尔定律,速度非常快。目前全球最先进的半导体制程已经逼近了3纳米,而当制程微缩至1纳米时,量子隧穿效应将导致现有的半导体技术失效。
不仅如此,现在行业正在从2D平面制造转向3D堆叠架构。例如,近期备受关注的HBM(高频宽记忆体)存储技术,便是通过立体堆叠,在突破带宽瓶颈的同时,延续着半导体性能的攀升曲线。
第三,AI算法。根据一些benchmark(基准测试),基本上每100天,AI算法的性能便会提高一倍。这意味着,每100天后出现的新模型,性能可与此前顶尖模型媲美,所需算力却仅需一半。
如果我们把电力、算力以及算法这三条增长曲线叠加,以十年为周期,便会发现整个行业正以几千倍、乃至上万倍的速度在进步。在此变量下,我们必须突破现有认知框架,去构想未来技术全面成熟后可能诞生的新形态,并据此思考当下的行动方向。
同时,在技术架构上,AI也经历了显著演进。以自动驾驶为例,十年前大多采用分段式模型,大概在三年前开始转向端到端架构,而当前的趋势则是进一步走向多模态大模型,将图像、文本、语音等信息在一个模型中进行协同学习,迈向技术架构的“大统一”。
除了模型范式,训练方法同样经历了显著跃迁——从需要很多人工标注的监督学习,到大模型环境下的无监督预训练,直至当下,基于模仿学习、强化学习和世界模型的训练架构。这些突破性进展,都密集发生在短短十年间。
与此同时,需求侧也在变化。以我国市场为例:人口老龄化进程加速,劳动力人口占比持续走低,家庭服务消费比重逐年攀升。数据显示,65岁以上老年群体对居家服务的需求正呈指数级增长。另一方面,55%的年轻消费群体更倾向于付费省时。对这些年轻消费者来说,过去亲力亲为的事务,如今更愿通过购买服务解决。
正因如此,从国家层面到资本市场,再到各类企业,都高度重视这一领域,并持续投入资源。加之中国显著的工程师红利,具身智能已然成为一个受到全社会关注的焦点议题。
尽管AI的前景令人振奋,但事实上,路还是得一步一步地走。当我们真正落实到具体的业务中时,依然会面临诸多挑战。
表面上,它什么都能做,但对每个企业乃至个人而言,这反而带来了新的命题:当技术几乎无所不能时,我们该如何选择?因此真正的挑战不再来自「能不能」,而是来自「该做什么」与「先做什么」的战略抉择。
面对一个庞大的产业,其实我通常把它拆分成三个维度来审视,且每一个维度上都存在诸多变量。关键在于,如何在这个三维空间中找到属于你自己的那个「小立方体」——这一点至关重要。
第一,用户维度。本质上代表的是它背后的场景,即我在什么地方,为什么人,提供什么样的服务?
第二,技术路径。既要看到技术未来的可能性,也要清醒认识其当前阶段,我们需要从现状出发,勾勒出一条通往未来的技术发展路径,从而明确当下应聚焦的方向。
第三,产品定义。产品是连接用户场景与技术能力的桥梁。我们需要思考,运用哪些技术,通过何种产品形态,最终为什么场景下的用户实现何种价值。
所以,我们需要把以上几个方面整合在一起来看,再结合自身的资源和条件,我们才能在那个广阔的三维空间中,找到最适合自己切入的精准点位。这个点位或许很小,但对任何人或企业而言,如果真的能选得准,便已足够奠定成功的基石。
刚才讲的是如何从理论层面做创业方向的抉择。接下来,我就以我自己所从事的具身智能这一领域为案例,分享我的思考与分析框架。
尽管机器人看似无所不能,但如果一开始就定位为「全能型」产品,那最终做出来的东西很可能什么都干不了。因此,我们首先要对用户场景进行细分。
第一层,分行业。想清楚是要做工业的、服务业的抑或是面向消费端的机器人。我们最终选择了消费端,因为它的市场规模最大、产业升级的需求也最为迫切。
第二层,拆场景。在消费端内部,我们进一步根据使用场景将其划分为室内与室外两大类。
室内场景,例如生产线上的工业机器人或者家庭里的洗碗机,它面对的环境是比较单一的,任务重复性也高,因此它的数据多样性就会比较低。
然而,如果你希望机器人能在未来真正具备AGI的能力的话,就必须得让它面对足够多样、复杂的数据环境。因此,我们认为室外这种开放型的场景对于数据的多样性而言会更有助益。
在技术的选择方面,如果将过去二十年的技术演进及其产品化进程进行对照,便会发现二者之间存在明显的时间错位:通常,当原理性技术趋于开元体育 开元体育官网成熟后,大约需要五年左右时间,其商业化与工程化的技术就会成熟。
如果大家现在关注机器人的话,就会在网上看到很多视频,比如机器人叠衣服、拿杯子等等,当我们看到很多类似的demo(样本)的时候,它其实代表的是这些产品背后的原理性技术开始慢慢变得成熟,而不是这个产业已经成熟了。而这时其实就是入局的很好的时间点。
说实话,虽然经常看到一些机器人活蹦乱跳的视频,但仍有部分技术还处于攻坚阶段,例如双足行走在非平整路面容易失稳,五指灵巧手也仍是待解的难题——Tesla Optimus 3.0在灵巧手方面遇到的挑战便是一个例证。
因此,对创业公司而言,理想的技术切入点是选择那些原理已获验证、工程化路径初步显现,但尚未完全成熟的「中间地带」。选择过于超前的技术,商业化周期过长、风险过高;而选择已完全成熟的技术,则难以建立竞争优势。把握这一「中间点位」,是技术选择中的关键策略。
具体到产品选择时,我们可以观察到,不同场景的落地速度也存在着一定差异。例如,无人机、割草机、酒店配送机器人等产品已快速涌现并实现商业化;而自动驾驶尽管历经了十年的发展,但至今仍然没有被广泛地使用。
场景的失效成本:它可以理解为任务失败所带来的后果严重性。例如,服务机器人递咖啡时如果失手了,只需要清理现场;但如果自动驾驶车辆发生事故,就有可能导致人身伤害或重大财产损失;而家用扫地机轻微地碰撞桌角,则几乎没有什么额外成本。事实上,很多领域大家也投了很多钱、付出了很多人力,却始终没有击穿,它背后的原因往往都出现在场景的失效成本过高上面。
基于这个框架,我们在去年底对市场上的相关公司进行了系统性梳理,发现一个清晰的共同逻辑:几乎所有具身智能企业都围绕「AI大脑」这一核心展开,通过附加不同身体形态实现功能分化——搭载轮子成为自动驾驶车,安装机械臂成为操作机器人,组合四肢则走向人形机器人。大家的终极目标趋于一致:构建通用的感知、交互、移动与操作能力。区别在于不同的公司,大家会选择怎样的一个点位作为自己的出发点。
这就像爬珠穆朗玛峰,如果是人形机器人是顶峰,而当前的关键决策在于你要从哪里开始爬,并规划阶段性路线。这种选择本身并无绝对对错,但企业必须做出明确且唯一的路径判断,并坚定推进。
接着是市场维度。我们曾系统分析过什么样的行业比较适合应用机器人。从我们的研究结果来看,目前教育行业是机器人应用的第一大产业,其次是开元体育 开元体育官网巡检、物流等基础服务的场景。家庭服务场景虽是许多机器人公司的长期愿景,但实现难度最大。
此外,制造业,如汽车厂、3C代工等企业也非常需要机器人去降本增效,因为对今天的制造业而言,工人的人力成本、稳定性、可靠性都是很严重的挑战。
还有娱乐场景,例如商场、公园等,许多商家会租用机器人做表演引流,对许多C端消费者来说,这也是他们接触机器人最频繁的场景。
面对众多选择,我们建立了以两个核心维度为依据的分析框架:一是价值属性,从纯娱乐性到强功能性,到底是好玩还是有用;二是用户类型,从ToB商用至ToC个人消费。
我们把前面提到的各类机器人场景都放置于这个坐标里,可以清晰看到市场的分布格局——去年底时,创业公司高度集中在科研、教育、巡检、军事与商演等领域,而功能性强且面向个人消费者的右上角区域,几乎完全空白。
基于这一发现,我们创业时便瞄准了这一空白地带,并重点评估了三种可能的机器人形态:
一是四足,强调运动与交互能力,适合户外伴随场景,如徒步、露营及日常外出;
二是家用机械臂,可视为扫地机的升级版,加上两个机械臂,从而让它完成更多的家务,但技术挑战与落地难度都极高;
三是人形,虽被寄予了“无所不能”的期望,但目前最具现实落地能力的场景仍是商演。
在决定具体切入方向时,我们最终选择了四足机器人这一形态,主要基于以下几方面考量:
从技术成熟度来看,四足机器人硬件已发展到较高水平,处于「中间点位」——既避免了技术过于早期导致的长周期孵化风险,也绕开了技术完全成熟后竞争激烈的红海。同时,它在软件算法方面已有良好基础,供应链也相对成熟,具备成本可控的产业化条件。
在场景适配性上,四足机器人具有良好的户外移动与承载能力,无论是小区散步、露营出行或是日常购物等场景,它所具备的运动能力、负重性能还有交互潜力都可以高度适配。
进一步聚焦到人群的选择上,我们发现现代家庭,尤其是五口之家的行为模式具有高度的规律性:工作日父母上班、孩子上学,周末至少一天全家外出,老人则有固定的买菜、做饭与散步习惯。
我们可以看到,无论是使用场景还是人群选择,它的画像都非常地清晰且收敛,因此,我们就决定围绕家庭场景推出了首款四足机器狗产品。从功能上讲,它可以负重、拍摄、牵引,还可以跳舞,本质上是一个面向家庭的“智能伙伴”。
而这里又有一个很核心的问题,那就是我们研发的四足机器狗应该在家里扮演怎样的角色呢?
在产品角色定义阶段,我们找了一个小学去调研,发现约40%的孩子希望家里的机器狗扮演「哥哥」的角色——既能保护自己,还可以陪伴玩耍,并在需要的时候提供支持。
基于此,我们就把四足机器狗的产品形象给明确为「家庭中的小哥哥」,核心价值定位为温暖、安全、好玩、勇敢、有丰富的动作语言。
在功能层面,它可以作为「小跟班」为孩子背包负重、一键跟随并拍照记录。对家长而言,它也可作为「小看护」,通过内置的48小时DVR系统,让父母随时了解孩子的动态,增强外出时的安全感。
综上,我们通过系统性地分析行业、市场、产品、用户以及技术等多个维度,逐步收敛定位,最终聚焦于一个具体的产品点位。
接着,我们再套用一下混沌的课程逻辑,对我们的四足机器狗这一产品进行价值建模。
在价值建模过程中,关键就在于在多维度中找到一个真正属于自己的精准切入点。而我们建模主要就从两个维度展开:
一个是AI维度,即通过AI让所有的设备开始具备智能的能力,并把它变成一个智能体。
二是机器本体维度。当前大多数AI产品仍然是基于已有的硬件进行增强,走的是“Something + AI”的路径,这在过去十年里一直是行业的主流方向。
然而,随着AI能力的持续进化,我们认为有必要为AI打造一个原生的硬件载体——一个过去并不存在、因AI而生的全新本体。我们此前所探讨的几种机器人形态,正是这一方向的体现,而在其中我们选择的点位是「有生命力的机器人」。
我们的第二个关键策略是错位竞争。纵观当前机器人行业的竞争格局,我们会发现绝大多数公司仍然集中在「右上角」的热门领域,而在我们所瞄准的方向上,去年几乎没有竞争者,今年竞争者也很少。因此,我们果断选择了一条少有人走的路。
接下来是单点击穿的执行逻辑。机器人行业的涵盖范围广阔,从行业应用到生产到商演再到ToC,我们坚定地选择了C端市场——因为未来市场潜力巨大且当前参与者较少。
在C端机器人中,我们进一步聚焦于户外场景,而非室内服务型机器人;在户外形态中,我们在人型、轮式地盘、轮足和四足之间选择了四足,因为它更接近宠物的形态,家庭接受度更高;而在产品定位上,我们并未局限于「工具」或「玩具」的二元选择,而是将其定义为「家庭成员」——成为孩子身边的「小哥哥」,融入到家庭的一份子。
由此可见,如果将整个机器人行业展开为一个庞大的选择网络,其实每个末端节点都蕴含机会。但对任何一家公司而言,要想在短期内在市场中崭露头角,就必须做出清晰、坚定的战略选择。我们正是通过这样层层收敛的路径,最终锚定了自己的方向。
就我自己的体验而言,做机器人这件事情和我之前所从事的自动驾驶领域其实存在着一定的差异。自动驾驶是一件非常hard code(硬编码)的事情,它对安全性的要求极高,在正式上新一个方案之前需要通过数百万公里的严苛测试,而用户对它的感知度却非常低的,只关心这个车开得好不好,会不会撞的问题。
但对于一个机器人来说,用户会看到它的外观、行为、表演与交互等多种要素,它里面其实蕴含着更多的人文要素。因此,我们提出了「用科学的思维控制精度,用艺术的思维塑造灵魂」的理念,这也正是公司名称维他动力(VitaDynamics)的由来,即智能生命与机械动力,通过AI技术创新,打造真正融入生活场景的智能伙伴。
而我们的目标是在五年内,推动机器人规模化进入家庭与服务场所,为用户提供高质量、全天候的陪伴与服务。目前,我们的产品已进入预售准备阶段,将于下月中旬正式开启发布和预定,并于明年第一季度实现首批量产交付。
首先,我们正迎来一场巨大的技术变革,毫不夸张地说,这是一场堪称「第四次工业革命」的巨变。十年以后,所有的公司都将是AI公司,就像我们今天用电一样习以为常,这是第一个大背景。
其次,在如此巨大的变革浪潮中,机会实在是太多了,但这更需要我们去冷静地看待市场。我们必须系统审视当前与未来几年的市场格局、真实的用户需求、技术成熟度以及产品工程化能力。在众多的二维选择中持续做出决策,先决定好走哪边,再逐步收敛,直至找到那个唯一值得全力投入的切入点。
到现在为止,我们公司成立仅一年时间,团队也才60人,几乎每一个部门、每一个环节都做到了极致精简。而我们之所以能够在这么短的时间内做到机器人量产上市,原因无他,不过是极致的聚焦,所有人的目标都朝着一个点去击穿。
那这个点是什么呢?最终我们思考的结果是「用户满意度」。无论产品定价多少,哪怕只有一位用户,只要ta认可这款产品与众不同、体验出色,我们的努力便有了价值。
说了这么多,其实我的核心感悟就是:尽管外界机会纷呈、选择众多,但只要思路清晰,把聚焦这件事情想清楚,集中所有力量在一个关键点上持续深耕,即使规模有限、时间紧迫,也能在一年内做出令人信服的成果。
作为全球首款无需遥控的消费级具身智能机器狗,Vbot超能机器狗既是Vbot维他动力技术实力的集中展现,也标志着具身智能向丰富多元的消费场景迈出了关键一步。
祝贺维他动力!期待更多和维他动力一样的中国创新企业,始终勇立潮头,以科技之光点亮无限可能!
来混沌创新院,参与更多优质企业参访活动、与各行业领军人物对话交流、系统学习底层商业认知方法论!
0538-33085520
全国服务热线