语音技术在银行信息化的应用
来源:易观 更新时间:2012-04-15
吴晓如:语音技术在银行信息化的应用
来源: 2005-11-14
11月11日,中国中小银行信息化发展高层论坛在北京隆重召开,本次会议将以其主题的独家性成为本年度最具操作指导意义的中小银行信息化盛会。腾讯财经独家图文直播本次会议。
以下为科大讯飞吴晓如博士发言实录:
吴晓如:银行系统的各位领导各位来宾大家下午好,首先我代表这一次会议的合作方之一科大讯飞向银行系统的朋友参加银行信息化高层论坛表示热烈欢迎。
今天介绍的主要是语音技术,以及语音技术在银行信息化的应用,首先简单介绍一下语音技术,同时简单介绍一下科大讯飞技术公司。语音技术在银行系统最主要的应用就是呼叫中心的应用。呼叫中心又称为客户服务中心,他是把计算机和电信集成技术整合在一起,形成以电话与用户沟通的手段,第一代呼叫中心是电话热线,如果拨打电话越来越多就需要呼叫中心,首先是简单的把多个线路分配到不同的专家那里去为不同的客户提供解答。第二代呼叫中心发现很多用户提的共性问题可以通过同样的方式解答,也就是自动把答案录在系统里面,用户提供操作可以知道答案。另外如果用户问的信息是动态和个性化的,需要得到答案都不一样,这些信息很难通过实时录音实现,就催生智能语音技术在呼叫中心的应用。
语音技术研究目标是使各种智能设备向人一样能听会说,主要包含两个重要的技术,一个是话音合成,是把任意文本信息或者数据信息自动的实时转化为标准流的语音,这样给智能设备提供一个人工的嘴巴,同时还有一个语音识别技术,可以把语音变成语音命令也可以变成听写机。语音识别在呼叫中心主要有什么应用,随着银行上面业务扩展越来越多,通过按键式操作很难满足用户的需求,用户要完成一个请求要做很多次按键,而且按键很复杂,语音识别即使有一千个5千个命令,只要把希望的请求说过系统听,系统就理解这个请求,使呼叫中心完成这样的应答。因此语音技术可以用在社会生活方方面面。
下面举例说明语音在社会生活的应用。第一个应用是银行业来说在电信系统的应用,2004年7月份中国工商银行总行在全国同时布点新的电话银行,统一使用科大讯飞TTS技术,应用银证通,外汇买卖,原来很难提供,现在可以通过交互式语音技术来提供了,语音合成就是自动把文本转化成语音,所以叫TTS。TTS可以满足信息海量动态信息,通过电话的查询,这里面有一个当时从工商银行总行现场录音的演示样例。(示例)这完成由计算机生成的语音,所以现在计算机合成的语音这是2004年的技术,现在技术已经有所提升,这已经标准流畅满足需求。语音在其他方面也有很多需求,刚才也交流了一下,比如智能终端上的应用,比如把我们语音合成做到手机里,以前可以声控拨号,另外可以听短信,另外可以连接电子图书馆,可以听电子图书,可以把语音技术封装成芯片,在海南马自达可以用语音导航。另外车载设备,有一款这种手上拿的装置,可以改变原来传统的音响,可以听文本,在回家路上一边开车一边听相关信息。
在电信增值交互系统有广泛应用,比如炫铃,要记音乐对应的代码,现在有了语音技术,就不再需要了,只要拨通一个联通或电信的统一客服号,你说出希望下载的铃声就可以自动帮你完成,大大提高了产品的易用性。科大讯飞和微软成立合肥微软技术中心,以.NET为平台,推进语音技术在政府信息化中的推广。
下面简单介绍一下科大讯飞是1999面在中国科大人机语音实验室基础上组建的,创业员工18人注册资金300万,现在员工300多人,注册资金近1亿。股东单位除了当时的中国科技大学之外,有联想投资,上海复星以及信息产业部。科大讯飞虽然公司成立六年,但是当时科技大学一直得到国家重点科学攻关项目的支持,我们在国内国际评比都是大幅度领先,2003年得到杰出青年奖和国家科学二等奖。很多用户刚刚接触语音技术的时候,听上去概念很好但是是不是有可用性,98年之前产生的语音很难被人听懂,现在产生的语音已经标准流畅了,现在听一下98年之前的语音效果和现在的语音效果。大家听着比较难,现在经过几年以后有比较大的改善。这其实就是最新的语音合成的语音,这是国家八六三标准文本,去年又邀请日本、欧美的单位进行技术评准,科大讯飞在自然度上面,这次是两两相比,大家可以从上面看到,科大讯飞系统自然度大幅度领先其他的参赛单位,在去年八六三项目评选做了有趣的测试,选了三个国家播音员和三个自然人,经过这一次评测之后,平均得分播音员4.7,一般自然人3.7,这个系统还达到4分更加标准一些,这评测以信息发布的内容,如果涉及感情,疑问感叹,人更强一些。
科大讯飞除了现在在中文上做的语音合成做的工作,现在也有英文合成系统,所以现在银行信息化过程中对国际化的需求也可以逐渐满足,包含也有粤语的合成系统。现在多语种的合成科大讯飞还在不断往前推进研发工作,科大讯飞从发展过程中得到国家各方面支持,在2000年5月份的时候,科技部将科大讯飞认定为国家语音技术成果唯一产业化的基地,在02年8月份国家发改委确认科大讯飞作为国家语音的示范研究中心,03年10月份信息产业部正式确认科大讯飞和国内其他十几家单位一起组建中文语音标准交互组,来制定中文语音的标准,科大讯飞作为中间的标准。希望将国内语音研究的优势和结果,和企业的标准逐渐形成国家的标准,通过这个标准保护民族语音产业的发展。在03、04年科大讯飞被发改委信息产业部联合确定国家语音产业唯一的国家规划布局的重点软件企业。这图是当时标准工作组成立的情况,今年第二次标准工作组已经有了语音传输输入输出的标准。现在语音技术除了刚才介绍的几个典型应用,已经渗透很多领域,比如中国保险业第一个总部级呼叫中心,比如中国首批建设的大银行,比如工商银行全国布点,招商银行光大,以及省级电话银行,包含电信第一个上海语音门户,全国14多个省份开通 电力自助式自序,这次十运会语音是由科大讯飞和华为共同承担的,现在科大讯飞语音技术已经渗透到社会生活各个方方面面。
下面介绍一下TTS技术在银行业的典型应用和怎么应用的,除了刚才介绍的工行应用,在2004年5月份,广大银行在全国23个城市超过1千线呼叫中心采用TTS,广大所有语音播报都是通过TTS技术实现的,此外在2003年的7月份深发展在全国14个城市呼叫中心统一使用了语音合成技术,因为使用情况非常好,已经应用对公,信贷消费等很多业务中,所以先后扩容过两次。此外招商银行在今年4月份经过比较细致的考察已经开始在全国电话银行中通过语音合成技术提供自助式语音播报技术。现在没有进行国家大集中建设的各个省分行,比如建设银行山东、福建、云南。包括工商银行的江苏、山东,以及刚刚建设完北京交行,上海交行,都把TTS融入呼叫中心。此外金融系统其他的应用就是证券,证券的应用和银行有不可分割的关系。比如动态的股评信息,基金电话信息都可以提供呼叫中心提供服务。
为什么要把语音技术用到银行呼叫中心去,首先可以丰富电话银行服务的范围,原来通过录音的形式,有很多信息很难通过比较好的效果推送礼用户,现在有了语音技术就可以,另外可以针对用户个性化的服务,比如用户自己交易的信息,现在也可以方便播报给用户,此外可以降低运营的成本,原来需要通过银行专家提供的服务,大家经常问的问题也可以通过语音的形式提供服务。
下面简单介绍一下TT S技术在银行中可以有哪些实实在在的应用,当时以招商银行的应用,比如帐户查询,转帐查询等应用,呼叫中心在没有应用TTS之前这效果可能很难接受,另外在转帐服务,原来效果也是比较难接受的。经过改造以后。其他包含自助交费,提供费用的查询提供更加丰富的内容,包含提供交费的结果进行确认,比如电话号码手机号码身份证再次的确认,此外提供银证转行的信息,银证通可以让股民适时查询动态股评信息。另外国债买卖,外汇买卖,自助贷款都可以使用语音技术提高服务的效果和品质,另外一些公共信息服务系统,比如业务咨询服务,存贷款利率,营业网点ATM机分布信息都可以通过电话查询,而且动态变化的时候,不像以前用户非常麻烦得录音,因为数据库关联了语音,就可以动态实时把变化以后的结果传递给用户。
另外银行跟我们探讨各类存贷业务,以及公告通知,银行很多营销类的服务都可以通过外播式的手段实现,因此语音技术可以显著增强电话银行业务的主动营销和差异化营销的能力,之前有很多不能做的事情,比如要通过网络查询现在可以通过语音形式来实现。
综上认为TTS可以拓宽服务范围,可以提供丰富的信息和内容,可以显著提升语音的效果,之前通过一个字拼起来效果用户听了很难受,可能不愿意接受银行电话的服务,现在有了这服务可以覆盖更多的领域,原来更多的人工服务可以交给电话银行来做,这样可以降低人工的成本和劳动强度,此外除了和CRM结合可以通过外播服务可以增强银行的营销能力,今天介绍以语音合成技术为介绍,下一步语音与视频的合成技术,未来语音也会找一些视频用上去,总体来讲智能化专业服务,贯穿电话银行整个项目,可以显著提高电话银行服务的品质。