2012会有几大关键技术投入民用市场
开放式声音识别引擎。
市场上IBM、微软发布的语音识别系统都是特定环境下模式识别。这种识别系统只针对特定模式作出唯一输出。而新的开放式引擎,则是可以同时识别各种不同的声音,并作出多项输出。新引擎因为没有信噪比的识别要求,即使是在负信噪比的环境下也能达到和人耳相同的识别水平。智能学习模式可以使系统在有很多人都在同时说话的嘈杂公共场合,能同时识别每个人在说什么。可以通过语音来控制电视机等,而不会被其中发出的语音和其它声音干扰。
基于最新被动变焦、测距技术和记忆模组技术的视觉识别引擎。
被动变焦、测距技术的发展使电脑能比人还高效的认知三维场景,记忆模组的发展取代帧画面,使得电脑和以有效而高速的进行视觉存储、分辨。通过语音和手势交互将在迅速取代键盘、鼠标和触屏。在将来,如果要找一个人,那么只要他在有监控的公共场合出现,自动监控系统5秒之内就会发现他。
大规模的知识逻辑数据中心。
一个没有任何知识的人,如何能进行思考?如何能对语言做出理解和翻译?知识并不是罗列的字词、语句,而是一个庞大的关系体系。以前电脑的知识与逻辑都是靠人工建立的,数据中心的则是智能系统自动收集、学习知识和对其它智能系统提供知识支持。
开放式声音识别引擎。
市场上IBM、微软发布的语音识别系统都是特定环境下模式识别。这种识别系统只针对特定模式作出唯一输出。而新的开放式引擎,则是可以同时识别各种不同的声音,并作出多项输出。新引擎因为没有信噪比的识别要求,即使是在负信噪比的环境下也能达到和人耳相同的识别水平。智能学习模式可以使系统在有很多人都在同时说话的嘈杂公共场合,能同时识别每个人在说什么。可以通过语音来控制电视机等,而不会被其中发出的语音和其它声音干扰。
基于最新被动变焦、测距技术和记忆模组技术的视觉识别引擎。
被动变焦、测距技术的发展使电脑能比人还高效的认知三维场景,记忆模组的发展取代帧画面,使得电脑和以有效而高速的进行视觉存储、分辨。通过语音和手势交互将在迅速取代键盘、鼠标和触屏。在将来,如果要找一个人,那么只要他在有监控的公共场合出现,自动监控系统5秒之内就会发现他。
大规模的知识逻辑数据中心。
一个没有任何知识的人,如何能进行思考?如何能对语言做出理解和翻译?知识并不是罗列的字词、语句,而是一个庞大的关系体系。以前电脑的知识与逻辑都是靠人工建立的,数据中心的则是智能系统自动收集、学习知识和对其它智能系统提供知识支持。