站内检索

人工智能+共创美好新世界——访科大讯飞副总裁赵志伟
作者:黄晓艳 发表时间:2017年10月13日

 

  曾经,人工智能只是藏匿于书籍、电影、脑海的只言片影;现在,人工智能正融入我们生活的一点一滴,从概念走向现实,从单薄走向丰厚;未来,人工智能将与我们形影不离,人类将创造一个由人工智能与传统产业相融合、由智能技术和人类文明混融共创的美好新世界。

  科大讯飞2016年度发布会,向我们展示了人工智能技术的重大突破和“人工智能+”为社会生活带来的巨大变革,揭示了人们生活方式的下一种可能。

  接受采访时,科大讯飞副总裁赵志伟这样告诉记者:“讯飞专注人工智能的决心非常坚定,紧抓人工智能产业第三次发展浪潮中蕴含的巨大机会,正在稳步推进科大讯飞以语音为切入口、从感知智能到认知智能的人工智能革命。讯飞利用多年来在人工智能技术研发上的积累,获得了多项国际比赛的冠军,不仅语音,还有知识图谱、自然语言理解等。全球首发的多语种实时翻译技术,能够实时将中文翻译成英语、维吾尔语、日语、韩语等;个性化语音合成技术通过打造个性化音库,使用户随时随地用最喜欢的声音来朗读文字;推出了最好用的汽车智能车载系统——飞鱼助理,实现在车载环境下通过语音实现全程控制;以“讯飞超脑”为代表的人工智能技术成果已创新应用于教育、家居、医疗、客服、车载等领域,并获得了社会各界高度肯定,这种强劲的科技旋风将深度改变人们的生活。”

  本刊记者:科大讯飞在2016年度发布会上,推出了七款新产品。请您介绍一下这些新产品及应用领域?

  赵志伟:2016年度发布的产品主要还是基于我们的语音技术,我们将逐步朝更广范围的应用领域扩展。

  讯飞万物互联输入法——通过综合世界上最高水平的中文语音输入、语音命令、手势识别,手写图像识别等人工智能前沿技术,面向万物互联时代智能硬件的输入需求,前瞻性地定义了物联网时代输入法的技术和产品标准。

  今年的“讯飞听见”是在实时中文语音转写的基础上,融合全新的多语种翻译技术,实时将中文演讲翻译成英语、维吾尔语、日语、韩语,同步展示在大屏幕上。准确率比肩同传翻译。

  面向个人用户的中英互译神器——晓译翻译机,不仅能快速、准确地实现中英口语的即时互译,还支持汉维互译功能,未来将不断加入更多语种,实现不同语言之间的便捷交流。

  汽车智能车载系统——飞鱼助理,通过接入多种内容渠道,可以在复杂的行车环境中进行通讯、导航操作,收听多媒体娱乐信息,对车身进行控制和信息查询等服务,使用户在驾驶中无须分心,享受最佳的行车体验。目前,我们已与30多个国内外汽车厂商建立了长期合作,在100多款量产车型中搭载相关产品,未来共同为用户开启智能驾驶新时代。

  拥有完全自主产权的智能客服机器人——晓曼,应用了世界领先的语音合成、语音识别、语义理解和人脸识别等技术,结合麦克风阵列、3D摄像头、身份证读卡器、取号小票机等外设应用,以语音、触屏、动作等多模态的交互方式为用户提供优质的服务。未来将在政府、金融、运营商、医疗等多个领域具有广阔应用前景。

  讯飞快听APP,通过打造个性化音库,为用户提供个性化语音合成服务,能随时随地朗读任何文章,配有每日好文推荐,满足用户个性化需求,在老人、恋人、儿童等人群有着广泛的应用空间。

  配音阁则为用户提供智能语音合成、真人配音及各种特色化、个性化配音服务。采用世界领先的语音合成技术,文字一秒变声音,傻瓜式操作,简单高效、让用户极速制作优质配音。

  科大讯飞以超脑魔盒为入口,打造了一个通过语音便捷控制家居设备的智能环境。超脑魔盒集合了科大讯飞的语音识别、自然语言理解等核心技术,包含全网影音、智能家居、遥控器K歌、英语翻译学习、生活百科问询五大功能,用户可以用语音实现切换、快进等操控,其响应速度只有0.2秒,老人、小孩都能轻松上手。

  教育领域,我们以机器自动阅卷技术为切入点,通过学业数据采集和教学过程性数据分析,实现多维度教学发展性评价和基于知识点的学生个性化学习,深度挖掘数据价值,帮助教育管理者高效决策,教师精准教学和学生个性化学习,实现家校互动,帮助家长实时了解孩子学习情况,真正做到因材施教,个性学习。

  本刊记者:科大讯飞为什么想到要去做客服机器人——晓曼?

  赵志伟:每一次产业变革对中国来说都是一次大的机会,实现弯道超车的机会。在移动互联网领域,大陆已经超越亚洲其他国家和地区站在了世界前沿,比如像阿里、腾讯等企业。对机器人来说也是一样,从本体来说、从核心零部件等方面,我们与国外有很大的差距。但在软实力方面,在人机交互和机器人大脑上来说,中国完全有可能实现超越。

  机器人除了工业机器人,现在服务机器人市场的发展潜力非常大,也很火热。许多创业公司和团队都在做,也有原来做工业机器人公司开始做服务机器人,但在市场上,我们并没有看到一款真正能发挥作用和具有价值的服务机器人。大多数只是长得像人,但理解不了人的需求,无法交流,更无法向人类提供服务的机器人。晓曼是科大讯飞在机器人领域的集大成者,是公司依托“超脑”的人工智能技术,在服务集成领域、面向未来的一种探索。

  关于服务集成领域,我们现在分为两个方面:一方面,讯飞负责开发语音合成和语音识别、人脸识别等核心技术,并把这些业界领先的智能人机交互技术通过AIUI平台开发出来,和业界合作伙伴、应用集成开发商共同探索深化应用。我们已为行业内3000多家机器人厂商提供了人机交互核心方案。另一方面,讯飞在传统行业领域有着深厚积累,一直为金融、运营商等领域提供人工智能解决方案。比如银行和电信运营商的呼叫中心里,80%都已经部署了科大讯飞的人工智能自助应答服务。目前,每天的机器自动接听电话的数量达到了200万次,有效节约了25%的坐席人力成本。我们坚信,未来无论人工智能如何发展,交互和后台的理解和学习都是刚需,通过人机耦合以及迭代学习进步,人工智能会逐步替代简单重复的人类劳动。因此,我们希望尝试在讯飞有积累的领域深入去做些有标杆、有意义的产品。在此基础上,利用讯飞领先的人工智能技术进行开发,我们推出了全程语音交互的银行服务机器人——晓曼。

  除了晓曼外,我们还在寻求更有激情、更有技术实力的机器人合作伙伴。服务机器人是人工智能交互技术的实体化承载,讯飞当前主要还是做人机交互和业务运营,机器人本体还是希望能够和业界的翘楚共同合作打造。

 

 

  本刊记者:现在的陪伴机器人和客服务机器人也有很多,晓曼的核心竞争力表现在哪些方面?

  赵志伟:在做晓曼前,我们就对服务机器人提出了“可用”和“高度拟人化”的要求:可用于现实生活,并为人类解决现实问题;高度拟人化则意味不能只简单模拟人的行为,而是要高度模拟人的反应和思维。

  具体来说,做出有核心竞争力的服务机器人有三点很重要。第一,机器人本体要灵活。第二,要有很强的人机交互。第三,对所服务的行业本身要有很深入的了解。

  信息革命以来,每一次世界商业大潮的兴起都是由人机交互方式开端的,而下一代人机交互便是语音交互。科大讯飞在语音技术,以及在以语音交互为表现形式的人工智能研究领域领先优势很大,相关市场占有率很高。我们不止是中国人机交互的执牛耳者,也是世界上最强大、最具潜力的科技公司之一。

  早在2012年,中国联通启动了10010智能语音客服——语音导航系统试点建设,经过一年时间的系统实施和迭代优化,运营效果非常明显,得到众多用户接受和认可,还节省了20%以上的人工成本,成为全球运营商智能客服应用的标杆。2015年7月22日,由科大讯飞承建的中国联通面向4亿用户的全球最大的集中式智能语音客服系统正式上线。我们的智能语音客服解决方案先后应用于上海世博会、工商银行、招商银行、交通银行、建设银行、中信银行、中国平安、阳光保险、中国国航等。在为行业客户做服务的过程中,我们对这些行业的业务流程和应答系统非常了解。因而选择从银行系统和运营商领域来做客服机器人,我们是最有可能做出最好的产品的公司。

  目前在徽商银行和建设银行,已经有应用了讯飞领先的语音合成、语音识别、语义理解和人脸识别等技术的服务机器人晓曼,在营业大厅担任起大堂经理助手和柜台服务人员工作的角色的尝试,目前可以识别客户身份,自由对话,并以语音、触屏、动作等多模态的交互方式为为用户提供优质的服务和自然、精准的客户体验。

  目前我们有专业的运营团队,与银行大堂经理、金融产品经理一起深度打磨合作,也就是为了更好、更快地在金融领域里开花结果。后面,我们也会在更多的垂直领域进行探索。我们坚信,随着晓曼在金融、运营商、展厅、医疗等商业领域的推广应用,将会引领服务行业新一轮变革的到来。

  本刊记者:您会怎么看待人工智能威胁论、人工智能取代人工岗位的问题?

  赵志伟:事实上,人类现实生活中人工智能技术早已无处不在,无论互联网搜索、手机语音交互、安全门禁系统、实时交通调度……其背后都是人工智能技术在做关键支撑。

  我本人在公司一直是做技术的,现在才开始做产品。讯飞尽管展示了许多新的技术,不管是今天看到的各种交互,无论是车载,还是教育,都是在窄的领域。如果从认知智能方面来说,还算是属于弱人工智能(机器学习),远没有达到强人工智能(通用智能)和超人工智能。

  “机器学习”是目前人工智能最前沿的技术,能在数据样本中寻找规律,从而构建出具有“举一反三”泛化能力的模型,它只专注于某一问题的解决,而不具有普遍智能。机器人所获取的信息和场景,需要通过大量的数据训练,只要能收集到足够的高质量数据,就能通过使用机器学习技术帮助人们解决许多过去认为困难的问题。现在谈人工智能威胁人类还太早,只有当机器人有意识,还要有综合深度学习的能力才能做到,这个时间跨度可能会比较长。因此,当前我们能做的就是脚踏实地把人工智能领域的应用做好并推广,主要还在金融和运营商的场景里面来做,在垂直领域做深做透。

  谈到人工智能取代人工岗位的问题,我们知道,农业革命解决人们吃饱穿暖的问题;工业革命是以机器取代人力,以大规模工厂化生产取代个体工场手工生产的一场生产与科技革命。现在的革命就是把人们从繁重简单重复的脑力劳动中替代出来,这是社会资源的重新分配。现阶段AI对社会的影响很现实,机器学习了一个又一个行业的知识,达到一定的水平,代替普通专业人士的工作,增强人类适应未来解决问题的能力,但它更多是对人类技能的衍生,在成本控制下,一切可被重复化的工作必将被取代,人会去做走向更有创造力和最有价值的工作,而把繁重的工作交给机器人,这是不可逆转的发展趋势。

  本刊记者:如何保障语音模仿、声音密码认证等的安全性问题。

  赵志伟:声音是一种语音信号,现在的语音合成是通过合成器合成出来,虽然说会很像,但是对于专业做信号处理的人来说,还是很容易地从频谱上、从信号上识别、分辩出来的。当然,如果真正做到了一定阶段,我们会严格控制声音合成的内容,并选择在特定的场景下去用。

  感知智能领域,除了语音,讯飞还有先进技术,就是人脸、声音、内容的多模态识别交互,这样就大大地增强了安全性。

  本刊记者:国内掀起的机器人热潮你怎么看?您怎样看待产业未来的发展趋势?

  赵志伟:机器人领域规划有时间节点和关键技术突破目标。现在大家热情这么高,我觉得一个重要的原因是“需求”旺盛,不管是第一产业、第二产业或者第三产业都存在智能化的需求。由于制造业和服务业的需求已谈得比较多了,我就不再来强调。总之,需求是一个动力,有了这个动力才会促使人工智能谋求进一步发展。

  工业机器人已经找到了刚需,很多地方都在用。现在服务机器人市场的发展潜力非常大,但还是没有找到刚需。我们的性能优势将通过人机交互和对特定领域的理解方面展现出来。讯飞的理念,希望能从“让机器能听会说”到“让机器能理解会思考”,在这方面公司已经做了大量的研发投入,放眼未来,科大讯飞将坚持人工智能核心技术的源头创新,与广大合作伙伴一起携手推动人工智能技术走进千家万户,用人工智能建设美好世界。

首页投稿广告关于我们联系我们

版权:《高科技与产业化》编辑部版权所有 京ICP备12041800号

地址:北京市海淀区中关村北四环西路33号 邮编:100080

联系电话:(010)82626611-6618 传真:(010)82627674 联系邮箱:hitech@mail.las.ac.cn