听到肖兴国的吩咐后,李景然就见叫小彭的技术员从随身携带的电脑包内掏出一个戴尔笔记本电脑,开机后从中调出一个音频软件,开始播放,然后过了两三秒,李景然就从笔记本自带的扬声器中听见一个个被人读出来的语音,都是单个的字词或词组,有男声,有女声,有小孩的声音,也有青年人和老年人的声音。
李景然在听的同时,肖兴国用眼睛朝技术员小彭示意了一下,于是,李景然就听到旁边的年轻人咳嗽两声,清了下嗓子,然后用一种略带紧张的声音,向李景然道:
“李先生,对于普通话,我们的每个语素,都同时采集了孩子,青年,中年和老年四个年龄层次的声音,每个年龄层次,都有男声和女声,因此,对于单个语素,我们采集了多达八种不同类型的声音。
“而针对其他方言的采集,虽然没有像普通话那样多达八种,但目前最低的,我们也已经完成了包括男声,女声,小孩,中年共计四种类型的语音。而像其他有些比较热门的有影响力的方言,如广东话和江浙话,我们差不多完成了六种语音采集。
“而对于所有采集的语音,我们都会根据每个字词的不同发音,进行标注,检查,整理,分离,然后形成一个系统的,容易查找的语音数据库。”
人机互动,人机交流中最关键的两项核心技术就是“语音合成”和“语音识别”。语音合成是为了让“机器说话”,人能够听得懂机器的语言;而语音识别则是为了让机器听得懂人话,明白人说的是什么。
而不管是语音合成还是语音识别,有一个必不可少的最基础的一项工作,那就是语音数据库,这是实现以上两种核心技术的“原材料”。虽然有了语音数据库,一般人也很难搞定,或者说到目前为止世界上就没人哪个人或哪个机构真正搞定过语音合成和语音识别,特别是语音识别,这一混合了信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等多种领域的前沿学科,对于所有想攻克这一技术的机构来说,真的非常非常困难!
但是,其他人搞不定自动语音识别技术,对于拥有全世界最先进智能体的李景然来说,却不是那么高不可攀,反而像“语音数据库”这种没有任何技术含量,需要大量人力物力才能搞得定的“累活”对李景然来说倒成了一个让人头疼的麻烦,逼得他只得求助于他人。
老实讲,深圳智冠提供的语音数据库,到底好不好,优秀不优秀,对于在这方面只是了解了一些皮毛的他来说根本就无法判断。要判断深圳智冠的东西有没有用,或者说好不好用,方法只有一个,那就是传给真智,让真智自己去研究,这就是李景然为什么要冒天大的奇险,不远千里,把真智从蓉城搬到广州,为此,还请了真武真情这两个被蒙在鼓里的超级保镖“一路保驾”。
本章未完,请点击下一页继续阅读! 第2页/共3页