01. AI智能语音解决方案
产品方向
●在语音交互中,大体可以分为目标信号拾取、语音增强、语音识别、语义理解、信息反馈这五个部分,其中语音识别技术已经比较成熟。我们产品的优势主要集中在语音增强部分。可提供语音交互应用中的信号拾取和语音增强技术;
●语音增强技术作为本产品的核心应用
√ 波束形成
√ 声源定位
√ 定向拾音
√ 声源分离
√ 波束形成
√ 回声抵消
√ 降噪、去混响等
AI智能语音方案:主板简介
◆ 产品采用核心板+底板结构,配置应需而变;
◆ 核心板采用TI AM57xx的ARM+DSP 多核高性能处理器;
◆ ARM核处理业务逻辑+DSP核处理音视频数据分析;
◆ DSP应用开发SDK,轻松实现音视频数据分析算法;
◆ 多路McASP 音频接口+ CSI/USB 摄像头视频输入;
◆ 可用于音视频处理,智能教育,智能机器人等AI应用领域
AI智能语音方案:阵列麦板简介
环形阵列麦克风
线形阵列麦克风
AI智能语音方案:核心板简介
SOM5728核心板
2*AMR Cortex-A15 +2*C66x DSP
AI智能语音方案:产品优势
声学指标
阵列MIC类型
环形阵列
线形阵列
麦克风数量
13麦(6+6+1)、7麦(6+1)、 8麦(4+4)
8、4
波束方向
360°
有效拾音距离
0~10米
0~20米
有效波束宽度(3dB带宽)
70°
70°
声源定位分辨率
≤ 20°
≤ 30°
声源分离数量
12组
2组
音频质量
360°高保真
高保真
语音识别率(5m、带噪)
≥95%
≥95%
回声抵消
≥ 40 dB
≥ 40 dB
噪声抑制
信噪比提升 ≥ 10 dB
信噪比提升 ≥ 10 dB
AI 应用产品:AI5728产品优势
声源定位:通过获取准确的声源位置信息,可实现更多场景化应用
定向拾音:通过定向拾音技术可有效屏蔽范围外的噪音,提升语音纯净度。
波束成形:麦克风阵列的核心算法,通过波束形成算法可增强目标方向的声音指向性。
声源分离: 将音频按照发言人分离成多个声音并输出,适用更多的应用场景。
回声消除:在播放和拾音同时进行的场景,可以将扬声器的声音屏蔽,只接收用户的声音。
去混响:通过去混响算法,有效减小语音中混响的占比,得到更加纯净的声音。
噪声抑制:通过降噪算法,智能衰减拾取到的噪音,获得更清晰的音质。
AI 应用产品:AI57xx 产品应用场景
02. AM57xx的SOM核心板介绍
◆ SOM572x是信迈科技基于 TI AM5728处理器的工业级核心板。
◆ 业界超小尺寸:69mm*52mm
◆ 采用优质可靠的4*80PIN的精密BTB连接器,保证信号完整性,安装拆卸方便
◆ 两路千兆LAN, 支持EtherCAT主/从站,ProfiNet等多种工业以太网协议
◆ 最大支持10路视频输入
◆ 支持2路CAN接口
◆ 支持10路UART
◆ 支持1路USB 3.0 & 1路USB 2.0
◆ 支持3路LCD 接口
◆ 支持1路HDMI
◆ 支持8路McASP 音频接口
◆ 1路SATA接口
◆ 1路PCIe 3.0, 支持1*2-lanes 或2*1-lane
◆ 支持Linux 4.9.28、DSP RTOS系统,支持实时RT-Linux系统
◆ 工作温度范围:-40℃~85℃(工业级)
03. AM57xx处理器简介
AM5708 Cortex®-A15 based Processors
Benefits
● Single-core version of AM57x
● 3,500 ARM Cortex-A15 DMIPS
Sample Applications
● Human Machine Interface (HMI)
● Medical Imaging
● Test & Measurement
Key Features
● 1.0GHz* ARM Cortex-A15, Dual 213MHz ARM Cortex-M4; 750MHz** C66x DSP
● 1080p Video Decode/Encode
● 3D and 2D Graphics Acceleration
● Multiple Video Input Ports
● Display Subsystem
● Quad core Programmable Real-time Unit (PRU)/Industrial Communications Subsystem (2x dual core subsys.)
● USB3, PCIe
Power Estimates
● Typical Power: 1.5-3W (nominal voltage)
● Suspended Mode: <800mW
Package: 17x17mm, 0.65mm VCA
Availability:
● Samples: now
● Production: now
*Nominal voltage max freq. for Cortex-A15 is 1 GHz
**Nominal voltage max freq. for C66x DSP is 600 MHz
AM5728 Cortex®-A15 based Processors
Benefits
● Sitara’s highest performance ARM device w/DSP accelerators
● 10,500 ARM Cortex-A15 DMIPS
● Upgraded graphics performance with HD Video support
Sample Applications
● Human Machine Interface (HMI)
● Industrial PC
● Digital Signage
● High-end Navigation and Consumer
Key Features
● Dual 1.5GHz* Cortex-A15s, 213MHz M4s, and 750MHz** C66x DSPs
● 1080p Video Decode/Encode
● 3D (x2) and 2D acceleration
● Multiple Video Input Ports
● Display Subsystem
● Quad core Programmable Real-time Unit (PRU)/Industrial Communications Subsystem (2x dual core subsys.)
● USB3, PCIe, SATA
Power Estimates
● Typical Power: 2.5-4W (nominal voltage)
● Idle Power: ~650mW
Package: 23x23, 760 pin, 0.8mm
Availability:
● EVM: now
● Production: now