办事指南

经济学人解释说,语音识别软件如何在2014年4月23日如此出色

点击量:   时间:2017-02-19 04:31:12

<p>很长一段时间,语音识别软件很差,证实了计算机发现很难做人类容易做的事情,反之亦然</p><p>但最近它已经变得更好了:大多数现代智能手机现在都有许多实际上有效的语音激活功能</p><p> Google Now或iPhone的Siri等程序不仅可以处理限制性任务,例如寻找餐馆或拨打电话号码;智能手机在自由形式的语音识别方面也变得更好,例如采用口述的文本消息或电子邮件</p><p>计算机如何更好地理解语音</p><p>几乎任何单词都可以开始一个句子,所以句子中的第一个单词可以是数万个单词中的一个</p><p>如果任何单词在任何位置都与其他任何单词一样可能,则从20,000个单词的词汇表中的五个单词的话语将具有3.2 x 1021种可能性</p><p>面对这样的赔率(以及由便宜的麦克风,背景噪音和压缩降低的声音信号),任务将是不可能的</p><p>升级您的收件箱并获取我们的每日调度和编辑推荐</p><p>但是,单词不会以随机顺序出现,因此计算机不必为您说的每个单词猜测(比如说)20,000个单词的词汇</p><p>相反,该软件根据周围的单词,根据从大量数字化文档库和其他用户的先前话语中得出的统计模型,评估您是否有可能根据周围的单词说出一个单词</p><p> “the”之后的内容可能不是动词,例如,缩小了可能性</p><p>在“杰斐逊撰写宣言”之后发生的事情缩小了可能性,而不是更多</p><p>以自然的速度将“一辆漂亮的奶油卡车”命令进入您的手机,并且它可能会返回几乎同音的“冰淇淋卡车”</p><p> “漂亮的奶油卡车”中的所有单词都很常见,但组合不是</p><p>智能手机可以通过考虑用户的个人信息(例如他的地址簿中的姓名或他所在位置附近的城市)来进一步改善他们的猜测</p><p>这种统计模型正在为各种语言应用提供动力</p><p>例如,较旧形式的计算机化翻译倾向于试图打破句子的语法和含义,并用新语言重新组合</p><p>最好的现代系统依赖于原始语言中字符串A被正确呈现为目标语言中的字符串B的可能性,其基于计算机已被训练的人体翻译材料的主体</p><p>并且统计模型可以纠正常见和明显的错误:发送一个朋友“在路上割草”,即使“割”是一个英文单词,一些软件会知道将其改为“现在的路上”,因为“割”是一个相对不常见的词,几乎从未在“途中”之前</p><p>计算机对人类更有用,他们对我们的了解越多,无论是集体还是个人</p><p>消费者越来越关注的是,他们愿意放弃多少个人信息以换取更有帮助和更可靠的服务</p><p>深入挖掘:转移,Siri: