能说会到“AI助手”助力行业升级换代
发布时间:2021-06-06 16:15:38 所属栏目:云计算 来源:互联网
导读:数字化时代风口常立,身处潮起浪涌的技术圈,越能从前沿动态中感受行业动态与趋势。在这个融合物理与虚拟的全新时代,由AI驱动的AI助手如同互联网时代的PC,移动互联网时代的智能手机,成为我们进入智能时代的超级入口。 在主题为未来经济,数字优先的2020腾
|
数字化时代风口常立,身处潮起浪涌的技术圈,越能从前沿动态中感受行业动态与趋势。在这个融合物理与虚拟的全新时代,由AI驱动的AI助手如同互联网时代的PC,移动互联网时代的智能手机,成为我们进入智能时代的超级入口。
在主题为"未来经济,数字优先"的2020腾讯全球数字生态大会上,AI行业内的专业人士集中讨论了AI助手演进的最新成果。作为智联网时代人机交互入口,AI助手在AI赋能下带来行业解决方案,以AI语音交互能力为核心,结合知识图谱、IP虚拟形象、全双工等优势能力的打造,对传统对话机器人做全方位升级,让AI助手也能具备社会人的属性。
简单来说,就是AI助手能够满足更多个性化、场景化、情感化的需求,在“工作岗位”上帮助企业提升效率、节约成本、增强效果,而这一切,离不开AI语音助手从技术层面为AI助手“大开脑洞”。
结合腾讯智能平台副总裁李学朝在论坛上以“腾讯云小微,打造数字员工助力行业升级”为主题的演讲,让我们走进AI技术赋能下AI助手的技术和应用升级。
腾讯
全双工交互实现AI助手自然对话,打造情感化的语音交互
从技术层面来看,实现AI助手的对话交互难度并不大,面对一般指令如“今天的天气怎么样”,或者是执行一些简单的任务,如播放音乐等,每一次问答都属于语音交互的范畴。
但是如何让交互变交流,打造自然流畅的对话体验,更符合真实业务场景的需求,就需要在技术端通过技术创新赋予AI助手有情感的灵魂。
为此,腾讯云小微AI语音助手提供了解决方案,以全领域、全双工实现全业务场景覆盖,以ASR+NLP双向拒识判断极大降低错误响应概率(误识率 < 0.01 且 拒识率 < 0.1),以流式语义+语义VAD在低延迟下真正做到边听边思考,共同组成AI助手自然对话的基础。
其中全双工交互可以做到一次唤醒实现多轮连续自由对话,并且可以随时打断,AI助手也可以准确拾取相关指令并作出正确反馈。相较于“单工”和“半双工”技术,可以做到双向实时交流。单一场景下的全双工交互技术比较好理解,例如播放音乐时可以连续指令“现在播放的这首歌是什么名字”、“帮我收藏这首歌“等等。
腾讯
而在全领域人机交互中,人们的对话可能穿插着很多议题,不受场景的限制实现自然交互。面对任务型+问答型+闲聊的全业务场景,如在车载环境中,腾讯云小微车载语音助手能够根据车内收音的音区判别发出指令的用户,同时结合背景噪音的识别、多人聊天背景音等环境音的识别分析,拾取用户跟车机对话的指令,回答用户所需。
与此同时,腾讯云小微AI语音助手实现的AI助手还整合了语音交互、自然语言理解、声纹识别、图像识别等AI能力,面向不同场景复杂噪声针对性提升技术能力,不断提高复杂噪声环境下唤醒率、语音识别准确率及意图理解准确率,为用户提供自然、丰富的交互服务。其中以ASR+NLP双向拒识判断为技术特点,极大降低错误响应概率,误识率< 0.01且拒识率< 0.1。
另外在自然交流中从听懂到准确表达,还需要AI助手在流式语义处理方式取得突破,腾讯云小微AI语音助手能够以200毫秒为单位上传语音,让云端大脑能够做到边听边想,同时结合场景和上下文预测用户语义,提前思考怎么回复,在低延时特性下从加快响应的速度。
知识图谱提升AI助手生产力,成为AI语音助手进步的阶梯
在大会中,李学朝对AI助手的专业抛出了这样的观点,“人工智能不是人工智障,云小微的知识图谱能力作为机器人的大脑,将专业知识网状串联起来,不仅直线思考,还能推理、判断,提供更加专业的业务服务。”
其实对于AI领域来说,知识图谱的重要性在现在、未来都不言而喻。知识图谱对于人工智能的重要价值在于,知识是人工智能的基石。机器可以模仿人类的视觉、听觉等感知能力,但这种感知能力不是人类的专属,动物也具备感知能力,甚至某些感知能力比人类更强,比如狗的嗅觉。
如何让AI助手具备认知能力,从而有效提升生产力?腾讯云小微的做法值得思考,在程序设计上详细展示了AI助手的“成长”经历。
![]() (编辑:南昌站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |


