PingWest品玩11月28日讯,百度大脑今天发布了基于复数CNN的语音增强和声学建模一体化的端到端识别技术。这项技术无需任何数字信号处理和语音识别学科的先验假设,复数CNN网络内存占用少于200K,可以内置到百度鸿鹄芯片内部。利用进场数据和纯粹依靠仿真数据,就可以获得足量的远场训练数据,整个过程是从原始多麦克信号到识别文字的一个端到端训练,整个优化过程只有字错误率两集一个优化准则。
百度语音首席架构师贾磊告诉PingWest品玩,“这项技术完成了数字信号处理和语音识别这两个领域的技术革命,用端到端一个声学模型,不需要任何领域行业的支持,解决两个跨领域的语音识别问题。”
“我们获得了比目前百度音箱现有产品,超过30%以上错误率的下降,即语音识别性能提升30%,这也是目前我们在国际业内同行看到的提升最大的,利用深度学习竞价推广 竞价开户 搜狗开户 百度开户 sem推广 网络营销 sem竞价 360开户来完成语音交互的系统。”
会上,百度还发布基于百度鸿鹄语音芯片的硬件模组及开发板。其中,百度竞价推广 竞价开户 搜狗开户 百度开户 sem推广 网络营销 sem竞价 360开户鸿鹄芯片模组以及百度鸿鹄芯片+RK3399 Android开发板将于2020年1月推出,百度鸿鹄芯片+ESP32 RTOS系统开发板&模组将于2020年3月推出。