“清华大学—得意升文”声纹处理联合实验室管委会主任 覃文华 本文为覃文华于2006年1月20日在国际中文语言资源联盟年会(CCC)上的致辞。 刚才郑方院长已经就技术领域做了详尽的阐述,下面我简要说明一下我们在声纹身份认证技术方面已经形成的产业化模式。
所有的技术的产业化大概都需要产业界和投资界的充分介入。首先介绍一下我们与清华大学的合作模式和结构。我们的投资主体天资控股有限公司是在高新技术领域具有丰富经验的投资机构,北京得意音通技术有限公司则是在声纹基础技术方面拥有7、8项发明专利以及几十项著作权的高新技术企业,同时也是国际中文语言资源联盟的主要发起者和理事长单位。我们共同投资了一家公司:北京得意升文技术有限公司,来对北京得意音通公司的声纹基础技术做民用方面的产业化应用推广。北京得意升文技术有限公司为了做好声纹基础技术产业化的应用和推广,还需要不断地进行研发和提升,还需要得到学界的支持,以共同形成一个持续的研发环境。为此,我们与在这方面有非常强大的背景技术的清华大学信息技术研究院再度合作,投资成立了清华大学-得意升文声纹处理联合实验室。就设在5楼,欢迎大家有时间上去坐坐。这是一个清华大学和我们企业共同成立的联合实验室,它的功能是不断地对来自于清华大学和北京得意音通公司的基础声纹技术在产业化过程中所需要的技术优化和应用产品进行研究和开发。 我们认为声纹身份认证技术的产业化应用需要有三个方面的支撑。一个是声纹识别的基础技术和专利。如果没有获得基础技术的支撑,没有获得一批应用型的基础专利,那么整个产业化应用就是一个无本之源。这方面主要依托于北京得意音通的原有技术,并通过联合实验室不断地进行研发和提升。在中文语言资源方面的计算机技术领域,就像刚才海淀区于军副区长所说的,我们的技术所处的领域还是少量的没有被国外的信息技术跨国企业所垄断,能够达到国际先进水平的高技术领域,毫不夸张的说,甚至是国际领先的信息技术领域。这个技术基础是我们最重要的一个支撑。另外,所有的产业化应用必须要有一个应用和基础技术之间非常好的一个接口。就是说如果不能规模化,所有的基础技术都没有办法进入实际的应用领域。在这方面,我们经过大量的沟通和工作,获得了许多战略合作伙伴的认同,其中完成了前期沟通和准备,最接近实施阶段的是,我们将与国家信息中心合作,建设一个海量(千万级)声纹数据库,从而为电子政务、征信系统、电子商务、门户网站等领域所需的各类应用提供开放性的基于声纹的多模态精准认证基础平台。第三个方面,就是以声纹库为基础,开发一系列有针对性的应用产品,服务于政府用户、企业用户和个人用户。 在此基础上,除了与国家信息中心及海内外风险投资基金合作建设海量(千万级)声纹库,形成一个中立的、具有公信力的认证体系和平台之外,我们还将与银行、电信、民航、零售等民用行业领先企业合作进行各行业垂直应用开发。我们也会与各类投资基金合作,共同进行基于声纹认证技术及海量声纹库的商业应用模式的孵化和培育。从而为广大的互联网用户和电话用户提供便捷的、个性化的、安全的服务。 最后,对于声纹识别这项基础技术再简要地阐述一下我们的独特理解。针对目前“人-计算机、计算机-计算机、计算机-人”之间的交互模式,现有的基于网络的远程身份认证手段,包括业界最认同的PKI/ CA技术,最终都摆脱不了对“物”的依赖,都普遍存在“认物、不认人、不能识别主观意识”的致命缺陷。人类在这样的“技术进步”中被“物化”和“消解”了,被逐渐地“去中心化”了。著名的美国大片“黑客帝国”非常逼真地对这种“演化”的最终结果做出了预言。而包含有语音、语义、语境及个人声纹特征的人类话语作为人类最原始、最符合人性、最为便捷的信息交流方式,我们认为是最适合用来转变上述信息技术应用的潜在危局的手段。在我们正在研发的具备革命性意义的系统中,人与人以自然的话语模式,通过普适网络系统所进行的任何远程交谈和交易,将能够同时包涵参与人的身份信息和个人以话语、语境、意识等所表达的,远远超过“文本”能包含的信息。从而在当今跨时空的交互网络中,恢复人的真实存在和相对于“机器”的尊严。 谢谢各位嘉宾,并借此机会,预祝各位新春快乐,合家幸福! |