分析语音识别技术在手机中的应用
现在,语音技术正在全新的环境中使用:移动电话。语音识别技术在手机中的应用将进一步推动该技术在新方向上的发展和应用。
这是语音识别技术从未涉足台式计算机应用程序的方向。 IBM在2011年庆祝成立100周年。
IBM创建了一个实验性语音识别系统,称为“ Shoebox”。在1960年代初期。
该系统解决了口头语言算法的问题。语音识别技术最早是1950年代出现的,它是一种早期技术,主要是出于好奇。
在1960年代初期,IBM的“鞋盒”(Shoebox)诞生了。该设备能够识别16个口头单词并回答简单的数学问题,例如“ 3 + 4 =?”。
& rdquo;。 DragonDictate由Dragon Systems在1980年代初为DOS计算机推出,可能是第一个语音识别应用程序。
此应用只能识别一个单词,一次只能说一个单词。随着时间的流逝,该应用已经发展成为一种称为“ Dragon NaturallySpeaking”的产品。
(当前为Nuance Communications拥有的第11版)。此应用程序可以翻译以正常会话语音和速度说出的文本。
语音识别技术在台式计算机中的应用有两个限制。首先,为了使该应用程序能够以更高的精度工作,必须对该应用程序进行培训以识别用户的语音特征。
Windows Vista和Windows 7操作系统以及诸如Dragon NaturallySpeaking之类的第三方产品中的本机语音转文本技术仍然需要经过用户培训才能使用。第二个限制因素是键盘的普及。
大多数人习惯于键盘打字而不是说话。因此,语音控制面临与Dvorak键盘布局相同的应用障碍。
当简单的老式QWERTY键盘可用并且可以正常工作时,为什么还要学习使用Dvorak键盘呢? Microsoft TellMe团队是负责为多媒体环境开发语音识别技术的部门。 TellMe团队的高级产品经理Abhi Rele指出,在台式计算机环境中,用户具有便捷的人机通信模式,例如键盘和鼠标。
因此,语音的使用主要针对语音爱好者。语音控制计算的广泛应用需要两件事:更好和方便的应用程序以及主要使用语音的地方。
手机正是这种增长了很长一段时间的地方。 Nuance产品管理和市场营销副总裁Matt Revis解释说,台式计算机和移动环境之间的区别在于:台式计算机是固定环境,并且重点完全放在台式计算机的使用上。
因此,台式计算机的语音技术主要执行以下任务:支持办公应用程序,Web浏览,通讯等。就移动而言,语音被更多地用于支持各种生活方式:移动中的专业人员,有趣的户外活动,动手操作,免费电话等等。
Gartner分析师Tuong Nguyen同意这种观点:语音在移动环境中更有意义。他说,从使用角度来看,手持设备的语音识别功能更有价值。
它添加了一种用户友好且方便的输入法。 Nguyen补充说,如果不是使用语音技术来讲一个简单的解释性句子,而不是滚动浏览许多菜单或在小型显示键盘上努力地打字,那么语音识别的价值将变得显而易见。
随着触摸屏设备(无物理键盘)使用的增长,语音识别技术将用于增强数据输入和输出。语音识别还支持免提要求或法律要求。
在移动设备方面:由于移动设备通常仅支持台式计算机的部分存储和处理功能,因此语音处理需要一些时间才能以基本形式出现在手机中。 《语音处理施普林格手册》解释了2000年代初手机的状况。
尽管当时存在一些限制,但已对移动电话进行了编程,使其可以识别拨号语音,一个人识别一个名字,并在某种程度上识别该人的名字。主要问题是内存。
因此,大多数手机一次只能识别10个数字或名称。但是,这些作者指出的另一个问题是此功能的使用较少,这可能是由于性能较差所致。
