公式规律网

介绍首款自主带屏智能音箱性能

发表于: 2019-08-12 

  2019年4月23日,“2019年上海5G创新发展峰会暨中国联通全球产业链合作伙伴大会”在上海世博中心召开,本次大会以“联通5G 共见未来”为主题,集中展现了中国联通及其全球合作伙伴共同打造的5G生活图景。本次大会,中国联通发布了一系列自主品牌智能终端产品,其中,炯为智能与联通华盛联合开发深度定制的小易精灵联通智能触点解决方案也正式亮相。小易精灵是一款搭载了声智科技远场智能交互系统SoundAI Azero的带屏智能音箱,是针对新零售场景下的智能物联解决方案。

  该款带屏智能音箱配有7英寸高清屏,800万像素前置摄像头,10W*2双喇叭立体声扬声器,支持语音+视频的立体化人机交互体验,可为用户提供宽带电话、爆品到店、语音控制、视频通话、业务办理、云端播放等多种功能与服务,实现业务优化,助力销售业绩,轻松胜任智能触点各场景的任务处理。

  同时,联通小易精灵首次实现了支持国内4G全网通频段,既可以进行网络通话,也可以拨打普通电话号码,更可以随时变身WIFI热点。中国联通在通讯领域的优势,结合声智科技提供的前沿声学技术和人工智能交互服务系统,将为消费者带来更多智能交互新体验。

  声智科技创始人、董事长兼CEO陈孝良指出,“智能音箱加上屏幕之后,的确会给用户更多的信息反馈,特别是一些图形化的界面会让用户体验获得更大的提升”。无屏的智能音箱开启了语音交互场景,而带屏智能音箱则带来新一轮的语音+视频的交互升级。根据Strategy Analytics的研究数据,2018年全球智能音箱出货量达到8620万,其中第四季度带屏智能音箱出货量占比达10%以上,带屏智能音箱也将成为2019年重要的市场增长点。屏幕在呈现反馈结果时所具有的直观生动以及附加的视频播放和视频通话等优势,远胜于单一语音交互在获取内容和服务方面的体验感。可以想见18kj现场开奖。2019年智能音箱的竞争还将持续集中于带屏智能音箱领域。

  声智科技拥有自主研发的一站式带屏智能音箱解决方案,可为客户提供个性化的解决方案,根据不同产品定位量身定制最具性价比的产品。声智科技带屏智能音箱解决方案搭载自主研发的智能交互系统SoundAI Azero,拥有远场声学处理、声纹识别、空间感知(SSP)、空间认知(SSA)等核心技术,可实现5米范围内全方位响应指令,具备随时打断、随时唤醒、一句连控等功能。

  联通带屏智能音箱小易精灵搭载的便是声智科技SoundAI Azero系统,可以真正做到灵敏唤醒、准确识别、迅速反馈,为用户打造一站式语音智能交互体验。

  声智科技远场智能交互系统SoundAI Azero精准远场语音唤醒、远场语音识别(Far-Field ASR)服务及语音合成、动态应答词匹配等技术,赋予智能音箱随叫随应、一呼即应的能力,为用户提供更加人性化的交互体验。此外,声智科技通过不断训练唤醒模型,提高语音端点检测技术水平,已达到将机器应答时间控制在400~500毫秒的领先水平,为用户提供最佳体验速度。同时,产品从唤醒到内容的全链条响应速度也已达到全球领先的1.4s内,确保了更人性化的智能交互速度体验。

  声智科技SoundAI Azero系统可对真实使用环境中的声音信号进行有效采集和处理,实现噪声抑制、混响消除、声源测向、阵列增益等功能,提高语音信号处理质量。针对真实使用环境设计的独特语音降噪唤醒识别技术,在存在噪音的情况下同样可以准确识别语音指令,在实际应用中为用户带来精准轻松的智能语音交互体验。同时,声智科技为联通小易精灵提供的4麦线形麦克风阵列,远场拾音性能处于同类产品前列,具有很好的场景适应性。自主研发的宽场景高灵敏唤醒技术和低成本高容错唤醒技术,有效解决了高唤醒率和低误唤醒率的良性平衡,即便在一致性和失真度较大的情况下依然可以为用户提供出色的唤醒体验。此外,SoundAI Azero系统的自噪声抑制算法可以有效过滤背景噪声,在音箱音乐或视频播放状态下也能实现随时打断、随时唤醒,打造高效的人机交互模式。

  声智科技SoundAI Azero系统为联通小易精灵语音指令拨打电话功能提供技术支持,有效解决了通话场景中的噪声干扰和信号拾取困难等问题,实现一句话指令即可自由通话。在通话场景中,智能音箱一方面需要适应声源距离远、背景噪声干扰大等复杂多样的语音交互情况,另一方面也面临着网络传输过程中的语音丢帧、双工通话回声干扰等问题。为解决此类问题,声智科技SoundAI Azero系统提供了VOIP远场实时通话技术,通过远场双工通话解决方案,运用麦克风阵列、音频编解码、丢包补偿和语音重建、网络抖动缓冲等技术,确保智能音箱流畅的通话体验。

  声智科技专注提供声学语音技术和人工智能服务,携手生态合作伙伴,共同为智能语音产品解锁更多技能和应用场景,集合更多内容与服务,为终端用户打造多元创新的人机交互体验。