目前,智能手机的赛点正在从“全面屏”转向AI。由于AI成为一个越来越热门的话题与概念,从互联网厂商到手机厂商,几乎所有公司都在给自身贴上AI的标签,以便占据未来一波潮流的坑位。事实上,在智能助手方面,除了走在前列的谷歌、苹果之外,仍有部分知名巨头在这一领域努力耕耘。比如今年11月21日,三星电子在北京正式发布了三星Bixby语音中文(普通话)版,完美的诠释了一个人工智能多模交互平台,将语义理解、场景感知、认知容忍等人工智能技术与智能手机产品进行深度融合,通过自然对话形式的人机交互最大化方便用户的操作。
而这种人机交互变革还体现在视觉智能化层面——视觉结合内置相机应用,当对准特定的物体时,可通过Bixby视觉摄像头检测文本并提取、翻译,通过街景的相机视窗,定位或者搜索购物信息与场景感知,这是一种视觉层面的人机交互。虽然我们还处在语音交互的早期,正如当初网络出现时并非交互式的一样,但我们可以看到语音交互这种技术已经浮出水面。《互联网趋势》报告显示,语音将是人机交互的新范式,语音技术将解放人类双手和眼睛,用户以较低的成本实现随时访问。当人机共存无可避免,人类该采取什么态度?上海大学社会科学学院教授杨庆峰的答案是“开放、理性和包容”:“整个社会所需要的准备是多方面的,至少包括制度政策、价值观、伦理和法律这四个方面。”
然而也有专家强调要为人工智能的发展设限。人与机器人完全平等、相互尊重是一种道德理想,就跟人需要把自然当朋友一样。但在具体的人类活动面前,开明的人类中心主义才是具有可操作性的现实途径。人类必须为机器人设置禁区,在与机器人和谐相处的同时,慎重开发机器人的情感和意识。
作为人工智能的重要一步,语音识别的进步代表着机器的听力发展。近些年来,语音识别技术突飞猛进,受到广大公众的极大关注。但是在硬件、算法、内容方面,语音识别技术依然存在问题。首先是硬件,硬件部分芯片与麦克风阵列是核心部件。当下的语音技术还只在算法阶段;其次是算法,主要包括语音检测、降噪、去混响和回声消除等传统音箱和通讯工具也需要具备的基本算法;第三是内容,语音识别的目的是将语音信号转化为文本。
目前,语音识别技术相对成熟。声纹识别是根据语音波形反映出的个人生理和行为特征的语音参数,并以此来识别说话者的身份。但在现实中,该识别的准确率并不如指纹、虹膜识别。这也是智能语音更高“智能”形态的表现特征。但如果我们从未来趋势看,AI如果要在智能手机市场爆发变革创新方向,绝不会仅仅停留在优化拍照的路上。因为真正的AI,它的核心在于人机的互动,让机器越来越懂人类。