专访Rokid CEO祝铭明:人工智能领域的抢跑者与长跑者

rokid
最新动态

(大发) #1

001

转自:商业与生活 | 朱晓培

   

600块一瓶的香槟,6分钱一只的一次性纸杯。

Rokid CEO祝铭明(Misa)有点儿兴奋,他靠着长条桌,举着纸杯对面前的二十几个博士们喊道:来吧,先庆祝一下。他一饮而尽,人们跟着一饮而尽。

这里是Rokid的北京实验室,A-lab,主要负责语音交互系统的开发。由于成员全部是博士,在公司内部又被称为“博士团”。在硅谷,Rokid还设有另一个实验室,负责AR、应用等,称为R-lab。

两个小时前,祝铭明刚从美国飞回北京。

落地后,打开手机的那一刻,立刻涌进了上百条的信息和未接来电提示,有人恭喜他拿到了融资,也有投资圈的朋友抱怨他不提前通知又悄悄的完成了一轮融资。

虽然他之前签了一大堆协议,但联合创始人兼CFO王舜德是一个谨慎的人,投资人没签协议前也不会跟他讲哪天会完成。对于创业公司来说,融资签完Term后,因为种种原因不了了之的也大有人在。

“融资搞定了。”祝铭明想。 他决定改变行程,不回酒店了,先去公司跟博士们庆祝一下 。这个圈子太小,人才竞争太激烈了。祝铭明对《商业与生活》表示,这一次之所以公开融资的信息,也是为了以后招聘人才考虑。

他给HR打电话,要弄两瓶香槟。HR跑遍了东升科技园里的便利店,最后在全家真的找到了,只有两瓶,瓶盖上都已经落满了灰尘。它们仿佛就是跟Rokid准备的,在等待着被人开启庆祝的一刻。

据媒体报道,Rokid又完成了将近1亿美元融资,由淡马锡领投,瑞士信贷、CDIB、IDG资本等机构跟投。

香槟喝完了,A-lab的负责人高鹏带着新入职的同事一个一个的开始自我介绍。听到有一个职位是PM(项目负责人)时,祝铭明更加高兴,说:这帮博士就交给你了,我们就需要你这样有经验的人,但是在Rokid工作也不容易,你得特别的tough。

话讲完了,祝铭明拍拍手,说,你们去干活吧。然后,他坐下来,又开始一个一个的签文件。

002

Rokid CEO祝铭明(Misa)

   

提前起跑

2014年7月,祝铭明最后一次以员工的身份参加阿里会议。想到过几天要和几个朋友沟通自己创业的想法,觉得不能空手去,他便在茶歇时候画了一个桌面机器人的草稿,椭圆形的,像颗“蛋”。

7月18日,他度过了在阿里的最后一天,之后便和王舜德(CFO Eric)、高鹏、徐剑等创建了一家人工智能方向的公司。

王舜德此前曾担任过金山软件CFO、好孩子集团CFO、阿里财务VP,祝铭明说自己到现在也没有想清楚是怎么说服王舜德加入的。高鹏之前一直在中科院自动化所,研究模式识别与智能系统,他觉得所里的生活太安稳了,得知祝铭明有创业的想法后,立即表示愿意加入。

祝铭明在阿里工作了4年。2010年6月,他创办的公司猛犸科技被阿里收购,他随之加入阿里,并牵头启动了阿里巴巴M工作室。刚进入阿里时,老板有次问他:“如果我们不买下你的公司,你会怎么继续走下去?”他回答:“应该会做人工智能产品有关的探索”。他提出离职申请时,老板又问他有什么想法,他依旧回答: 做人工智能产品有关的探索

祝铭明觉得,接下来的两到三年后,人工智能会有突飞猛进的发展。必须要提前起跑,才能在那时候有能力和实力强的企业同台演出。

两年后,京东、小米、天猫、腾讯、百度等国内的科技巨头纷纷宣布进军智能音箱领域。虽然在资本上,Rokid无法和这些巨头抗衡,但在技术研发上,却已经有了2年多的先行优势。

2014年是一个投资、创业的大年。人人都在谈论“风口上的猪”,资本纷纷砸向O2O、共享经济、互联网金融和智能穿戴设备。但是,人工智能仍是一个冷门的创业方向。

祝铭明一开始也没打算去找投资,自己从阿里出来的时候还有一些积蓄。几个朋友愿意支持他的想法,他就带着自己画的那幅“蛋”去见了IDG的楼军、MFund的胡泽民和自己的阿里的老领导吴泳铭等人。这样下来,天使轮还超募了。

IDG资本董事楼军曾表示,打动IDG投委会的,是Rokid符合IDG一贯的理念,“有的项目可能失败率很高,但一旦成功就能为人们的生活带来很大的正向的改变,我们愿意和创业者一起赌一把。”

“第一天起,Rokid的定位就是一家人机交互的革命公司,要做一家改变世界的公司,要做一个能够让大家刮目相看的伟大的事业。”祝铭明对《商业与生活》说, Rokid的目标就是要做人机交互的个人消费品

“如果观看科技发展的历史,会发现,每一次时代科技的变革都是交互的迭代。”Rokid的团队有一个感觉,科技进入AI的时代之后,会有一个跟过去完全不一样的变革,人和机器可以变得非常融洽,机器开始懂人类,开始符合人类的习惯和需求。

iPhone设计师、Nest前CEO托尼·法德尔也有类似的观念,认为“下一代iPhone”根本不是手机,而是其他形态的交互产品,比如亚马逊的智能音箱Echo、或者是谷歌的AR眼睛 Google Glass。

虽然祝铭明画的那副“蛋”,在设计团队的第一次会议就被否掉了,但是设计团队还是保留了他一开始提出的“椭圆形”的想法。

2014年11月15号,Rokid的第一个原型,Rokid Alien被点亮了。演示通过的时候,很多员工高兴的留下了眼泪。那也是祝铭明最动情的时刻。

Rokid Alien几乎包含了所有的人机交互方式,包括显示、摄像头、麦克风等。由于功能太过复杂,对硬件的要求过高,他们发现都没有一家代工厂能够完整的生产这个产品,最后是分了两个,由富士康和英华达共同生产完成。

“Alien到现在,仍代表了制造工艺的最高水平。这次CES展会上让很多人大吃一惊,虽然它已经推出快三年了。”祝铭明说。

003

按自己的节奏走

在AI创业公司中,祝铭明和Rokid一开始显得很另类。

他们的爱好,看起来没那么“技术”。刚创业的那一阵,他们开了一个咖啡厅,还手工设计、制作了一批15寸的电脑文件包,在朋友圈里售卖。

他们对自己的“技术”也很开放。会邀请对Rokid感兴趣的朋友到公司参观,不介意到访者旁听公司内部会议。每一个投资人都被祝铭明拉进了公司的工作微信群,可以看到团队对每一个产品细节的讨论。

“如果你对这家公司感兴趣,你一定要来这家公司,深入了解这个团队,我会对你开放所有的东西。你什么都可以来了解,但是一定要亲身来体验产品,了解团队,多听我们讲我们的未来,然后再耐心观察一阵子,然后你再来决定。”祝铭明说,Rokid找投资人的要求非常简单,就是要非常理性,一但决定了,能够有耐心的跟着这个公司走下去,“ 我非常不喜欢那种追行业的投资人 。”

负责融资事宜的王舜德提到,淡马锡在2017年初开始关注Rokid,2017年中开始就投资进行实质性讨论,光尽职调查就花了3个月时间。

一直以来,淡马锡和瑞信的投资都偏向于稳定回报的后期投资,因此,很多人看到淡马锡和瑞信的名字,都问祝铭明,“是不是要IPO了?”

“人工智能一定要有耐心,做好几十年的一个准备。”祝铭明说,Rokid就是一个客观冷静的按照自己的节奏在走的一家公司,“我相信,这是我们这次的投资人愿意去投Rokid的一个根本原因。”

Rokid在人工智能领域冷门的时候也没少拿钱,在热得一塌糊涂的时候也没多拿钱。

“骄傲的一个地方就是,我们没有左顾右盼。”2016年下半年,人人都在谈论资本寒冬的时候,祝铭明和王舜德也曾讨论过一次资本寒冬。有一次,他们两个人吃晚饭,聊起融资形势的恶化,祝铭明递过去自己的手机,里面有一条信息是抵押自己的资产,为万一有问题准备的资金。王舜德便拿出手机给祝铭明看,也是抵押自己资产准备的资金。那也是他们唯一一次谈论资本寒冬。

2017年双11前后,国内的智能音箱产品曾短暂的开启了一场价格战,天猫精灵通过预售的方式,把价格一度拉低到99元。而同期的Rokid的智能音箱产品若琪没有选择跟进降价,反而在电影院选择了《雷神》、《正义联盟》、《星球大战》三部电影做了贴片广告,做品牌建设。

“我们是个小公司,只有拼。”祝铭明在朋友圈里写道。他清楚的知道, 作为创业公司,Rokid还没有能力去教育市场“就让大品牌去教育市场,这个你必须要接受,这个是事实 。你唯一能做的就是,等教育市场成熟后,用户开始理性的挑选符合他身份和自己要求的产品的时候,我们出现在他面前就好了,所以耐心一点。”

“今天的Rokid,跟很多产品并不竞争。它的价位、目标人群,到今天我觉得都并不竞争。”祝铭明说,从销售上也发现,哪怕同行业推出一些相对低价产品的时候,Rokid销量也没有受到影响,反而同比在增长。“ 大家来教育市场,我们去收割中高端用户,这个是我们期望看到的一个结果。

Rokid对产品提出了比同行业更高的要求。在研发智能音箱若琪时,曾有同事提出,唤醒词使用“若琪若琪”,但祝铭明坚持要将激活词缩短到两个字。

目前,市场上广泛采用的是四字激活词,如“叮咚叮咚”,“小雅小雅”、“天猫精灵”等;少数采用三个字激活,如“hey siri(嘿瑟瑞)”,但两个激活词全球目前仅有Rokid一家。

A-lab实验室负责人高鹏对《商业与生活》表示,通过语音激活智能设备,容易出现不识别、错误识别等问题。唤醒词的字数越多,设备可以辨别的关键词也就越多,越容易激活。而每减少一个字,难度都呈10倍上升。从4个字到3个字,北京的博士团队前后就更换了3个方案,耗时9个月。此后,又经过将近一年的学习,两个字的“若琪”在激活率和误激活率上才达标。

“Rokid应该是挑战了业界的一个极限,因为两个字基本上它的特征值就是可分辨的极限。”祝铭明觉得,这两年的时间并不是白白的浪费,当同行业还在为三个字、四个字拼命努力的时候,对Rokid已经不是问题。但Rokid这么做,主要还是希望从用户感觉的一个角度尽量能够利用业界最新的技术,让用户更舒服。“从用户体验的角度出发,这个坚持还是比较划算的。”

004

丑陋的产品一定是错误的

祝铭明随身带着一块Rokid的开发套件。这个小小的黑色圆柱体里,含有WiFi、蓝牙、Type-c调试、HDMI、USB、GPIO、红外接收、自定义按钮、4排麦克风阵列和12颗指示灯。

他说喜欢那种从口袋里掏出来就可以开发的体验,自己在编写Lego的接口。他说,自己喜欢写代码,希望可以一直写下去。高鹏透露说,祝铭明还有一个爱好,看论文。

论文有同一个的格式:存在的问题,怎么去解决,得出什么结论。祝铭明觉得,看论文的序言和结论是获取最新知识的最有效的方法。

不过,同事给他看开发版的第一版设计的时候,祝铭明并不满意。他对同事说:谁说开发者就要忍受丑陋的开发板和糟糕的体验?工程师的体验也应该被尊重。至少让大家知道,工程之美也是一种可以被体会的到的美。

“我们公司有一句口号,叫做丑陋的东西一定是错误的。”祝铭明说,一个东西丑陋意味着它背后有一些错误,只不过这个错误今天没有办法第一时间去发现它。“所以,我们一直会以打造漂亮的、精制的产品为出发点,而不是追求廉价或在其他方面上牺牲用户体验和品质。”

公司有几位高管和硬件团队成员的手机壁纸是第二代产品Pebble(月石)的内部线路版实拍图。

三年前,公司硬件团队完成了Rokid核心板原型设计,在讨论问题的时候突然拿给祝铭明,打算给他一个惊喜。结果,他说:“这么烂的设计就别拿出来了,什么时候你们自豪到恨不得刻上自己的名字再拿给我。”其实,那块板子已经很好看了。但他仍要求,要让线路板的内部结构美观到可以用作手机壁纸、发朋友圈。

在语音方面,Rokid花费大价钱请了约100位女演员试音,最后签下其中一位为Rokid旗下产品配音。此后,又进行了5次不同方式的语音录制,再由技术完成词语拆解和句子生成。

眼下,虽然智能音箱产品层出不穷,但都面临着同样的问题,应用场景有限,最常用的场景无非是音乐、问答、读书等。Rokid同样受困于这个问题。

“Rokid创业的第一天,要解决的第一个问题就是场景的需求。” 前不久,Rokid宣布跟腾讯云合作,把QQ音乐的1700万首歌曲放在Rokid产品里面。

“当然不仅仅把它放在里面,我们也在探索,通过语音这种新的AI方式,听音乐会有什么不一样。”祝铭明说,位于硅谷的R-lab,有两个小组,一个是研究在此次CES展示的AR眼镜,另一个叫做叫Product team,产品研究组。

据说,R-lab成员的性格和A-lab成员的性格完全不同。如果说A-lab是典型的沉默腼腆博士生,那么R-lab的成员则要天马行空。

产品研究组的本质就是探索一些人机交互的新的场景和应用方式,包括AR、语音,希望利用这些技术打造一些新的交互方式和一些新的应用领域。他们在家庭游戏方面做了一些探索,包括“一夜狼人杀”、“数学家”、“音乐达人”等。

“你看Rokid不简单是从技术层面做研究,它本身还有非常深的产品研究文化。”祝铭明说。

005

单个产品不能赢得AI战争

从美国CES展返回北京时,祝铭明特地带了一副Rokid的AR眼镜回来。他像带宝贝一样,把平时不上锁的行李箱,“不小心”锁了起来。

在刚刚闭幕的2018CES上,Rokid发布了这款新产品:消费级增强现实(AR)眼镜Rokid Glass。结果,观众反应强烈,直接带上体验的就超过了1000人,也让Rokid团队始料未及。

AR Glass并不新鲜。早在2012年,谷歌就发布了一款“增强现实”眼镜,Google Glass,具有和智能手机一样的功能,可以通过声音控制拍照、视频通话和辨明方向,以及上网冲浪、处理文字信息和电子邮件等。然而,在引起短暂的轰动后,由于体验不佳、应用场景受限等原因,2015年1月19日,谷歌停止了这个项目。

这家公司有点儿不信邪,强调批判精神。祝铭明喜欢问员工三个问题:别人做不到,我们怎么能做到?怎么能够把它做的更好?怎么做的不同?Rokid Glass就是受Google Glass的启发,但又走了完全不同的一条路。

Rokid Glass把光学、成像、视觉、语音、内容、制造、工艺、材料等功能,都集成在一个普通眼镜大小的一台设备里。人们忽然发现,原来一个头盔一样的AR Glass,可以做得像一个真正的眼镜。

“很多人在问我们,为什么我们做了语音,还要做显示、视觉这方面的东西?”祝铭明说,本质上,就是希望,让人和科技更友好、更自然的进行交互。

过去三年多,Rokid进行了多方面的尝试,包括图象、视觉、语音等。实际上,R-lab已经悄悄对Rokid Glass进行了两年的研究,从光学材料、呈像等各方面进行研究。

在AI时代,没有人能够通过单个产品赢得整场战争,因为AI本身并不是一个商品 。”祝铭明说。今天,已经没有人说自己是一家互联网公司,因为每一家公司都是互联网公司,AI迟早会像互联网一样,成为一个通用的对产业的整体赋能的技术。

这也是Rokid推出开发者平台的一个原因。

2017年10月12日,祝铭明在云栖大会上宣布,Rokid将与阿里云共同推出全栈语音开放平台,为业界提供一站式语音解决方案。Rokid 发布了两套分别搭载 Linux 和 Android 操作系统的开发套件,根据需要选择阿里云或 Rokid 的语音服务。

开发平台发布一个月后,开发合作伙伴达到400多,Rokid新增应用技能800多个,上线了80多个应用。祝铭明对这个数据感到很满意。

“AI 技术有一个特点,当你打造完一个产品以后,如果一家公司做端对端的细节打磨会沉淀出一个全栈的技术能力,这个能力一定是过剩的。”祝铭明说,AI 时代,无法像手机时代一样靠单一的产品形态去赢得整个战场。一家公司能够做好自己的1到2个产品就是非常不易了。

据说,BAT都曾表达过要投资的意向,但祝铭明认为,现阶段,Rokid应该先保持独立。人工智能是一个内容和服务综合性的市场,做终端产品,尤其是ToC的产品,一定是一个综合性的体验的产品。国内的几大阵营,阿里、腾讯\百度、京东或者是小米,其实都有Rokid需要的东西。“Rokid作为一个创业公司,还是希望保持跟所有人能够有合作的心态去做事情,这是我们的思考。”

AI可以做几十年,甚至上百年。Rokid既然想做一个伟大的事业,就不要一开始把自己框的特别小,“我更愿意先撒开缰绳让它跑一跑,看看会做成什么样,然后再慢慢往里渗。”所以,Rokid真正开始对产品、市场、营销各方面有比较清晰的规划反而是在2017年,前面两年基本上还在打磨产品跟摸索时机。

接下来,Rokid的重点工作是让更多的人知道Rokid的产品,全面的引进各个方面的人才,以及更重要的,还是技术研究。“这是未来产业,技术发展还非常非常早期,我们不能够吃老本,它一定要不断地跟进最新的技术研究。”祝铭明说。


(大发) #2

(大发) #3

(艺多) #4

比心 misa