清芬领航企业(十二)捷通华声——张连毅

清芬领航企业(十二)捷通华声——张连毅

IIIF 清华大学产业创新与金融研究院

“人工智能技术是中国为数不多的与世界同步发展的技术领域。经过数十年国内无数优秀科学家、学者、以及众多企业工程师的不懈努力,中国无论在技术研究还是应用水平,在人工智能领域都与发达国家不分上下。”作为一名将人工智能技术应用于产业实践的创业者,北京捷通华声科技股份有限公司原董事长张连毅曾经率先在国内推出全方位人工智能技术开放平台—灵云(AIcloud.com)。


 

高瞻瞩布局全方位人工智能技术 

2011年,捷通华声正式对外发布“灵云”时,给它的释义是“全方位的人机交互平台”,但今天已更新为“全方位的人工智能开放平台”。发布会上,张连毅宣布捷通华声的定位由原来的多项人机交互技术到全方位的人机交互技术;公司的核心技术从原来的2项拓展为12项:在原有语音合成和手写识别的基础之上,增加了语音识别、语音唤醒、麦克风阵列、图像识别(OCR)、语义理解、机器翻译、数据挖掘、声纹识别、人脸识别、指纹识别等10项核心技术能力。

张连毅说,他梦想中的灵云,可以为任何“云+端”的应用提供一种双向的感知能力——信息端感知人、人感知终端信息。灵云的后台可以实现对大量数据、信息的整合、分析与处理,所以整个灵云系统可以让手机、电脑等数字设备在与人交互的过程中,实现“能说会听、能写会看、能辨音会认人、能思考会判断”,感知并完成人们过去通过键盘、鼠标发出的操作要求,从而使机器设备具有全方位、多样化的人机交互能力,使之与用户之间的交互变得轻松、简单、自然,更回归人性,促进人与机器之间的和谐互动。

技术发展需要一步步积累,张连毅坦言说,捷通华声发布灵云时,还没有完全掌握这些核心技术,“构建灵云平台初期我们通过整合自我与引进技术提供服务,向业界传递灵云是一个怎样的平台,将会为产业提供怎样的服务。但是在接下来的两三年,捷通华声在清华大学的支持下,全面掌握了灵云平台上所有的人工智能技术能力”。

张连毅说,当时他做出这一决定的时候,不仅外界,公司内部也有一些人产生质疑,这预示着公司要做出一次巨大转型。“但我们没有因此放弃或是丝毫放慢脚步,今天来看这次转型是成功的,所有的努力都得到了回馈。”

 

28年前的初心:实现人工智能技的融合

早在1990年,张连毅及其创始团队还在清华大学科技开发总公司(紫光集团前身)时,就已经在进行人工智能相关的技术与应用研究了,希望实现人工智能各项技术的融合应用。

1989年,张连毅清华大学毕业后,留校任职于清华大学科技开发总公司(紫光集团前身)。出于工作需要,他经常要在清华大学寻找一些可以商品化的人机交互技术。张连毅跑遍了清华计算机系、电子系、自动化系等,发现几乎每个系都在国家扶持下,做一些诸如语音合成、语音识别、语义理解、机器翻译、OCR文字识别等项目研究,但每个系的研究方向都很单一。“人类一直梦想能够造出一个和自己一样的机器,但是在很多方面都很难实现,首先人对自己的认知不清楚,其次是硬件技术、算法技术都有很大的局限性。另外,每一项人工智能技术的背后都不是单纯的计算机技术,比如语音合成涉及语言学、社会科学,甚至哲学等。因此很难一下子就把人的所有功能都创造出来,却可以将功能分解,比如先让它能听懂人说话,然后让它能说话等。”张连毅很早就朦胧地意识到这些人工智能技术在未来应该向融合应用方向发展。

在这种懵懂的认知下,1992年,张连毅离开紫光,在当时国家科委“863计划”的支持下,与清华大学电子工程系丁晓青教授联合创办了清华文通公司,主要提供OCR技术服务。2000年,张连毅又与专注于研究OCR技术的清华校友陈明博士,在中科院声学所吕世楠、北京大学顾小凤两位专家支持下共同创办了北京捷通华声科技股份有限公司,公司定位于提供多项人工智能技术,并开始自主研发语音合成和手写识别技术,之后便一直在此领域深耕,直至2011年。

在此期间,捷通华声取得了不菲的成绩:拥有自主知识产权的中文语音合成、手写识别,在国内语音、图像识别技术市场上的占有率达到50%,并逐步发展成为国内第一家同时提供语音合成、语音识别、手写识别、OCR等多项人工智能核心技术的企业。在金融、电信、交通、能源、军事、政府、医疗、教育等领域都有广泛应用。特别是金融领域,其产品在80%以上的企业客户服务中心平台得到了普遍应用,如中国银行、中国建设银行、中国农业银行等;在2008年奥运会、2010年世博会、全国各地的高铁项目上,也均采用捷通华声语音合成技术及产品。


 

驾马车助力人工智能跨越

正是有这样的发展沉淀,张连毅2011年提出捷通华声要布局12项人机交互技术时,虽然有人质疑,但张连毅和他的团队仍然充满信心。回看当初的选择,张连毅认为无论是在人工智能学术界还是产业界都是大势所趋。

“一是GPU服务器的产生,二是云计算的成熟,三是大数据的出现。这些新技术为人工智能提供了可能。GPU服务器和云计算好比让我们有了一个灶台,大数据提供了很好的食材,与此同时,机器学习也趋向成熟,也就相当于有了更好的菜谱。”“在这样天时地利均具备的条件下,人工智能技术获得了史无前例的突破,而其更大的意义在于,只要掌握了工具、材料、方法这三个要素,人工智能从此不再因神秘而高不可攀。”人工智能技术成熟意味着开始实际应用,未来几年,人工智能终将全面爆发,“人工智能的发展还会有起伏周期,但我相信不会再出现大起大落,也许会有调整,但产业增长已大势所趋。”

对此,张连毅坚信不疑,“人工智能的概念已经提出60年了。以前也会出现发展高潮,但是没过多久就又冷了下来,根本原因是技术的突破与实际应用存在差距。但这一次发生了本质不同,人工智能必备的硬件、软件技术都相对成熟了。”“而一旦大家发现它能用了,用户的包容心也会增强很多,比如语义理解,以前用户希望我问什么,机器都要懂,现在虽然还达不到非常理想的效果,但已经可以解决很多问题,比如智能电话客服,虽不能全面回答客户的所有问题,但基本问答已经实现,不仅方便了客户,也提高了服务工作效率,大大降低了企业成本和管理难度。”张连毅透露,滴滴打车使用捷通华声的智能语音客服后,“几条电话线就代替了近100个人工客服坐席”,由此可见人工智能技术的巨大威力。

灵云平台全面开放以来,通过服务百度导航、搜狗导航、导航犬、滴滴打车、汉字英雄、天行听书、天行输入法、触宝输入法等移动应用平台,以及阿里、京东商城、携程网、去哪儿网等大型互联网平台,使中国13亿大众切身感受并体验了人工智能技术为现代生活所带来的轻松与便捷。

与此同时,捷通华声以人工智能技术为核心,针对不同行业的特殊需求,为客户量身定制各种解决方案,并陆续推出灵云各项智能解决方案、实体化产品如智能化服务机器人等。捷通华声的这些产品和方案,不仅得到了华为、中兴、Avaya等系统集成商的认同,在农业银行、中国邮储银行、中信银行等金融行业客户,国家电网、中国石化、中国石油等能源行业客户,中国电信、中国移动、中国联通等通信行业客户中都有普遍应用。


 

数十深耕风绽放 

2013年,清华大学产业基金投资捷通华声,双方形成战略合作关系。2014年,北京清华工业开发研究院与捷通华声联合创建“清华灵云人工智能研究中心”。清华校友总会邀请捷通华声共同成立“清华校友人工智能产业联盟”,由中国人工智能领域的泰斗张钹院士出任联盟理事长;同年,清华海峡研究院与捷通华声联合创建“人工智能研究中心”,由张钹院士出任研究中心首席科学家,清华大学张长水教授出任中心主任。在全方位合作的基础上,捷通华声与清华大学自动化系、计算机系、电子系等院系建立了稳定合作研究机制,以清华大学为强大的技术后盾,深度融合清华大学前沿人工智能技术,与多个实验室的研究团队共同进行技术研究,全面开展智能语音、智能语义、智能视觉、大数据分析等技术研究与灵云产品化应用。将清华多项人工智能技术进行产学研转化的同时,也促进了灵云各产品核心技术性能指标的提升。

捷通华声董事长张连毅(左三)拜访张钹院士(右二)

伴随着发展,捷通华声也得到了资本的支持,尤其是清华系资本。2016年初,清华大学产业发展基金对捷通华声追加投资,成为除了创始团队以外的最大单体股东。与此同时,海通证券等更多的资本方也参与进来。


 

上添花而非宾夺

捷通华声的定位是一家专注于人工智能技术的公司,“我们只做技术,不管别人用这些技术干出了多么惊天动地的事,我们都不会眼红,更不会去抢人家的饭碗,”张连毅笑言。

作为国内最早从事人工智能技术研究与应用的企业,捷通华声与应用领域的企业建立了长期、稳定、良好的合作伙伴关系,为数以千记的企业提供智能语音、智能语义、智能视觉、大数据分析等人工智能技术服务,尤其自创建灵云开放平台(AIcloud.com)以来,随着技术的广泛应用,捷通华声被越来越多人知晓。

张连毅说:“捷通华声之所以能够与众多企业建立并保持合作伙伴关系,灵云能够提供全方位人工智能技术服务,依靠的并不是什么秘诀,一是靠灵云人工智能技术产品不断满足合作伙伴的切实需求;二是明确自身定位,坚持不与合作伙伴争利,锦上添花但绝不喧宾夺主。”

近年来,只要合作伙伴要做的产品,即使捷通华声已经开始做,也会坚决退出。五年前,捷通华声推出了国内第一个能说会听、能写会看的语音助手——小唐龙,但当百度、搜狗等语音助手开始使用灵云语音技术,尤其是一些新团队依托语音助手型产品,并应用灵云语音技术开始创业时,捷通华声坚决退出了这块市场。在方案级产品领域,捷通华声也坚持同样的理念。灵云智能客服解决方案这几年在国内客服领域快速崛起,但由于智能客服产品在客户系统中具有“伴生”特点,难免会出现与过去的合作伙伴竞标,或者必须要与系统集成商分抢一个大项目利润的情况。捷通华声及时调整产品策略,退出了系统集成,而将灵云智能客服解决方案整合成独立产品形态,以优惠合理的价格向系统集成商提供服务,并通过培训帮助系统集成商和最终客户全面熟练掌握灵云智能客服产品的开发挂接与使用。

作为全方位人工智能技术与服务提供商,捷通华声在人工智能产业中充当“发动机”,灵云平台始终保持不垄断、也不封闭的理念,面向产业全面开放,无论是个人开发者还是企业开发商,灵云平台都会提供最大程度的支持,并通过合作伙伴实现对国内大众的服务。捷通华声也推动灵云平台核心技术在重点行业领域拓展应用,如智能车载、智能家居、家电、机器人等设备领域。

除了提供人工智能技术服务,捷通华声最近也推出了一系列灵云产品,并从两个方面去做产品开发。一是合作伙伴所需要的人工智能产品,如捷通华声在2015年相继推出的最新灵云智能语音合成、语音识别、声纹识别、OCR、手写识别、人脸识别、语义理解等满足行业通用标准的平台级产品,任何一家合作伙伴都可以通过应用这些平台级产品,构建属于自己的、独立应用的人工智能技术的产品与方案;二是开发应用全方位灵云人工智能技术产品。2015年,捷通华声相继推出灵云智能语音导航、灵云智能语音分析、灵云客服机器人、灵云身份认证,这几个解决方案级产品,每项产品都至少应用三项以上的灵云核心技术,如灵云身份认证,将灵云证照识别、声纹识别、人脸识别、指纹识别等四项技术融为一体,专门服务一些对身份认证非常严格的特定领域和行业。


 

将推动产业发展作

 

在张连毅的身上,有着清华人特有的家国情怀。他认为捷通华声虽为一家民营企业,却是代表着“国家”水平的“非国家队”,他的梦想是推动人工智能技术发展,促进中国人工智能产业的升级与进步。他说,捷通华声本着“技术为核心,服务为己任,技术服务生活”的企业发展理念,十几年来只做了一件事:将人工智能技术做出“中国水准”。捷通华声企业文化的精髓一是真,二是实,所以捷通华声在成长的过程中,从来没有放弃过对“什么能够真正推动产业发展”的思考。2011年决定转型,也是对这一问题深思熟虑后做出的。

回溯计算机乃至互联网、移动互联网产业的发展经历,张连毅总结为三个阶段:第一阶段是以IBM为代表企业的键盘交互时代,第二阶段是以微软为代表企业的鼠标交互时代,第三阶段是以苹果为代表企业的触控时代。下一个阶段是什么?推动产业发展的下一个焦点是什么?张连毅断定,一个更自然、更人性化的人机交互体系必将取代单一触控技术,成为未来主流。张连毅认为,这一体系就是人工智能技术即全方位人工智能交互系统。人工智能技术,其关键是模仿与学习人,所谓语音合成就是模仿人说话;扫描识别、拍照识别,就是模仿人的眼睛;语音识别可以理解为人的耳朵;语义理解就像大脑在思考。将这些技术组合起来,就能构成一个完整的“人”。基于这样系统性深入地思考,2011年张连毅正式提出捷通华声要打造12项人工智能技术,提供全方位人机交互服务。

张连毅不同意有人将“人工智能”说得多神秘,多可怕:“说到人工智能,人们经常想成机器有一天会把人统治了,这也许是受《黑客帝国》电影的影响;当人类发明出来机器、汽车,甚至是计算器这样的设备时,机器已经战胜人了,更不用说现在的电脑、手机。但是,这些设备并没有代替人,而是给人提供非常大的帮助,未来将是人和机器设备、人工智能的融合发展,而非人被人工智能所取代。”

对于当前社会上关于人工智能的某些夸张论述,张连毅不以为然。他认为这是个别企业为了一己私利夸大其词,给人工智能披上神秘的外衣,“无非是希望从政府、或资本市场圈到更多政策与资金,但这是对社会,对大众不负责任的做法”。张连毅谈到技术毫不夸张却很务实,谈及市场极为低调却高度自信,这正是清华校友企业家的风格。


 

灵云科技源自清

 

“灵云科技源自清华”这引人注目的八个响亮字眼,不仅成为灵云的品牌,也吸引越来越多的目光关注清华将在中国人工智能产业中发挥怎样的作用?

张连毅坦言:“灵云各项人工智能技术的发展进步,离不开清华大学科研力量的支持,如果说‘灵云科技源自清华’是灵云的品牌,不如说灵云是展现清华大学人工智能技术的一个窗口。发展灵云的最大压力不是市场运营,而是担心辜负了清华大学各位老师的心血与期望,因此捷通华声团队一直非常努力,希望能够通过广泛的市场应用为清华人工智能产学研结合发展做出自己的贡献。”

2016年清华人工智能论坛

“清华大学应该在中国人工智能产业中发挥什么样的作用,我一直在思考。在2015年第一届清华校友人工智能论坛上,我将这个问题提给我国人工智能技术领域著名教授,清华大学张钹院士。张院士并没有直接回答,而是指出清华大学在人工智能研究领域的四个优势:第一,清华大学是国内最早从事人工智能技术研究的大学;第二,清华大学在人工智能研究领域覆盖面最广;第三,清华大学在人工智能领域聚集了最多、最优秀的人才团队;第四,清华大学一直坚持理论研究与工程应用相结合,构成了国内最完整的人工智能技术研究体系。张连毅也深深记得两年前他去拜访在中国人脸识别等智能图像领域做出重要贡献的清华大学电子系苏光大教授,问及同样的问题,相比张钹院士的婉转,苏光大教授的答案则更直接:清华大学作为中国最高学府,发展世界一流大学,就一定要在中国国民经济的主战场顶天立地!”

“作为清华学子,很荣幸能在创业后得到母校的鼎力支持”张连毅说道。通过与清华大学“灵云科技源自清华”的战略合作,捷通华声灵云平台各项AI技术与产品已广泛渗透、应用于金融、电信、能源、交通、教育、司法、公安、医疗、互联网等各行业、各领域,给亿万社会大众的工作和生活带去了轻松与便捷。

如张钹院士所言,中国人工智能产业中的一股清华力量正在崛起,清华大学——推动中国人工智能产业发展的强大发动机已悄然启动。

 

 

后记

 

 

2019年12月,本书编写组从捷通华声获悉,公司原董事长张连毅因病在北京逝世。因身体原因,近两年张连毅已淡出捷通华声管理层,公司在董事长兼总经理的清华校友武卫东的带领下继续坚守初心、砥砺前行。张连毅在我国人工智能产业发展史上留下了浓墨重彩的一笔后,平静地离开了。他坚持不懈地奋斗与探索精神,将激励捷通华声的后辈团队在人工智能产业征程中不断进取。

 

 

文章来源于《清芬航企业创辑录》,有部分

部分片来源于网

编辑:高娜

责编:刘颖

 

 

附:《清芬航企业创辑录(第一册)》

清华大学产业创新与金融研究院(IIIF)主编的《清芬领航企业创新辑录(第一册)》,由清华大学出版社出版。该书收录了十六家清华校友企业的创新创业故事,全面记录了这些企业创办、发展、成长、壮大的发展历程,十六家企业涉及行业包括生物医药、电子信息技术、能源与环境保护、先进制造、新材料技术等。该书通过真实记述企业家的创新行为、创业现象、创业过程、创业方式,以及企业与外部环境相互作用等动态历程,为读者呈现了企业家、创业者宝贵的创新精神。并有助于读者进一步认知创业企业特别是高新技术企业的构成要素、运行体系、内外环境以及创新与发展规律。

 

清华大学

产业创新与金融研究院