主页 > 物联网 > 什么是语音技术?

什么是语音技术?

一、什么是语音技术?

语音技术,包含两个方面:语音合成和语音识别。

语音合成即Text to Speech(TTS),就是将文本状态的信息转换成语音的形式输出。就像给设备安装上了嘴巴,你想让设备说什么,设备就可以说什么,解决了设备上的信息只能看不能听得问题。

语音识别即Automatic Speech Recognition(ASR),就是使得设备可以听懂用户的话,识别又分为篇章级识别和命令词识别,目前在嵌入式领域发展比较成熟的只有命令词的识别。语音识别就像给设备安装了耳朵,让设备可以听懂我们的命令,并且执行相应的命令,解决了人们在操作各种终端设备时只能使用手动按键方式的问题。

实际上目前,语音合成技术已经达到了非常成熟的阶段,无论是平台级的还是嵌入式级的,目前都可以说已经达到了可以灵活应用的阶段,并且效果已经非常令人满意了,当然,不可否认的一点是,与真人说话相比还是有一些差距的,在实现语气语调方面存在很大的难度,可能还需要长时间的研究。

目前对语音合成技术的需求已经显露出巨大的市场,特别是导航,语音导航已经是导航发展的必然趋势,手机里的应用也越来越突出。

但是,中文语音识别技术目前还需要很大的提高,在命令词识别方面还比较能达到人们的需求,嵌入式和平台级都如此,而句子听写行的识别恐怕只有平台能达到要求,而且效果不能令人满意。在噪声环境下的识别率问题还为完全解决,可能还需要一段时间的发展才能完全达到运用自如的地步,我们期待着这一天的到来!

二、我想和你合张影英语怎么说

I want to take a photo with you

三、5300有什么优点?

诺基亚5300拥有92.4×48.2×20.7mm的机身尺寸和106.5g的重量,拥有蓝色、红色和黑色三种颜色。不管是身材还是颜色

搭配,在男性用户手中不显小家子气,在女性用户手中又不显呆板。5300整体外形非常圆润,虽然是塑料外壳,但是整体质地平滑,光泽度好,同时手感细腻,对于指纹和油污有着非常好得防护能力。而机身侧面的按键都被特别设计的橡胶外壳包裹在下方,这提示其不仅仅是部音乐手机,还是一部能生活防水的运动手机。特别强调的是,诺基亚5300XpressMusic提供了完善的功能组合,包括支持高达2GB的microSD卡、音乐播放专用键,以音乐为主要卖点。

相关推荐