在手机上,Android版Google Now和iPhone上的Google搜索APP已经支持语音搜索。在Google Glass上,如果没有语音互动,眼镜几乎无法使用。Moto X也将语音命令当成宣传重点。 语音与电脑互动并不新鲜。Google的目标是让语音和键盘、触摸屏一样方便容易。就目前来说,让语音界面在个人计算设备上成为主流仍然面临大挑战。 赫夫曼称:“我们希望人们与Google互动就如同和一般人互动一样。”他掏出智能手机问:“这里离赫斯特城堡有多远?” 一般来说,要回答这个简单的问题需要搜索“赫斯特城堡”,点击地图,输入自己的地址。但赫夫曼的手机第一时间就给出正确答案,语音命令可以节省时间和精力。它是电脑界面便捷性自然发展的一部分:10年前,你如果要写一封邮件,你得走到电脑前;5年前你掏出手机就行;未来可能只需要讲话就可以了。 要达到这个目标,Google会话搜索集团的任务就是将目前Google对现实世界所知的一切整合起来。人们学习外语时,一半的困难来自了解语言中包涵的文化,语言是依赖于环境的,这也是会话搜索的挑战。 赫夫曼称:“核心相关性、排序,Google搜索因此而知名,这些优势对我们的工作有帮助。” 感知环境不只会让Google语音界面更好用(某一天),还会让它比人类更好。 赫夫曼称:“今天,自动语音识别没有人好,但我们的目标是让它比人好。” 要达到此目标,就必须利用好掌握的用户信息。 赫夫曼说:“有时,Google拥有的环境信息比一个人类转录员多,比如,我们可以根据手机的地理位置知道你的位置,知道一些你最近谈论的事,它会帮助我们理解你所谈论的东西。” 未来,Google语音界面不只是准确解释指令,它还可以增强现实的互动。比如,让语音界面理解代词的意义。赫夫曼称:“在语音中有许多的代词,之所以如此,是因为它可以让我们更快沟通。” 例如,赫夫曼问“赫斯特城堡离我这里有多远”,然后说“告诉我方向”,里面甚至没有包括代词“它”,但手机开始指出方向了。 在对话中,人类可能会忘了代词代表什么,他会问同事们在谈论什么。Google会话搜索还没达到这种水平,但赫夫曼的团队正在努力。 对于语音控制来说,最大的挑战在于可靠性和错误修正。还有一个挑战在于,现有的视觉电脑接口限制了我们的使用,导致语音难以变得更容易使用。例如,在图型用户界面中,点击按钮、查看菜单就可以找到目标。但用语音控制电脑就如同用老式的命令行控制电脑。语音可能很强大,但需要人类学习全新的控制方式。 本站文章部分内容转载自互联网,供读者交流和学习,如有涉及作者版权问题请及时与我们联系,以便更正或删除。感谢所有提供信息材料的网站,并欢迎各类媒体与我们进行文章共享合作。
|