打造人机共存的智能时代让机器更“懂”人类

18-06-13

目前，智能手机的赛点正在从“全面屏”转向AI。由于AI成为一个越来越热门的话题与概念，从互联网厂商到手机厂商，几乎所有公司都在给自身贴上AI的标签，以便占据未来一波潮流的坑位。事实上，在智能助手方面，除了走在前列的谷歌、苹果之外，仍有部分知名巨头在这一领域努力耕耘。比如今年11月21日，三星电子在北京正式发布了三星Bixby语音中文（普通话）版，完美的诠释了一个人工智能多模交互平台，将语义理解、场景感知、认知容忍等人工智能技术与智能手机产品进行深度融合，通过自然对话形式的人机交互最大化方便用户的操作。

而这种人机交互变革还体现在视觉智能化层面——视觉结合内置相机应用，当对准特定的物体时，可通过Bixby视觉摄像头检测文本并提取、翻译，通过街景的相机视窗，定位或者搜索购物信息与场景感知，这是一种视觉层面的人机交互。虽然我们还处在语音交互的早期，正如当初网络出现时并非交互式的一样，但我们可以看到语音交互这种技术已经浮出水面。《互联网趋势》报告显示，语音将是人机交互的新范式，语音技术将解放人类双手和眼睛，用户以较低的成本实现随时访问。当人机共存无可避免，人类该采取什么态度？上海大学社会科学学院教授杨庆峰的答案是“开放、理性和包容”：“整个社会所需要的准备是多方面的，至少包括制度政策、价值观、伦理和法律这四个方面。”

然而也有专家强调要为人工智能的发展设限。人与机器人完全平等、相互尊重是一种道德理想，就跟人需要把自然当朋友一样。但在具体的人类活动面前，开明的人类中心主义才是具有可操作性的现实途径。人类必须为机器人设置禁区，在与机器人和谐相处的同时，慎重开发机器人的情感和意识。

作为人工智能的重要一步，语音识别的进步代表着机器的听力发展。近些年来，语音识别技术突飞猛进，受到广大公众的极大关注。但是在硬件、算法、内容方面，语音识别技术依然存在问题。首先是硬件，硬件部分芯片与麦克风阵列是核心部件。当下的语音技术还只在算法阶段；其次是算法，主要包括语音检测、降噪、去混响和回声消除等传统音箱和通讯工具也需要具备的基本算法；第三是内容，语音识别的目的是将语音信号转化为文本。

目前，语音识别技术相对成熟。声纹识别是根据语音波形反映出的个人生理和行为特征的语音参数，并以此来识别说话者的身份。但在现实中，该识别的准确率并不如指纹、虹膜识别。这也是智能语音更高“智能”形态的表现特征。但如果我们从未来趋势看，AI如果要在智能手机市场爆发变革创新方向，绝不会仅仅停留在优化拍照的路上。因为真正的AI，它的核心在于人机的互动，让机器越来越懂人类。

打造人机共存的智能时代 让机器更“懂”人类

18-06-13

打造人机共存的智能时代让机器更“懂”人类