人機語音交互技術系列課程主要內容包括:車載語音識別技術開發、關鍵方案設計與實現、人機交互系統的原型搭建及系統設計、語音識別相關算法的研究與開發,聲學模型、語言模型的訓練。分為五個視頻,共計260分鐘。
本視頻為第四課,人機語音交互技術(四)
人機語音交互技術(一)
人機語音交互技術(二)
人機語音交互技術(三)
人機語音交互技術(五)
課程大綱
一、語音基礎
1.語音識別技術發展概述
2.MFCC特征
3.單聲道語音降噪算法
二、傳統技術
1.模型匹配法(DTW)
2. 概率統計法(GMM-HMM)
3. 分類器法(SVM、CNN、LSTM)
三、熱點技術
1. CTC
2. Attention
3. GAN
4. Few-shot
四、車內環境聲識別
1. 邊緣計算工具
2. 兒童哭聲監聽
模式識別與智能系統博士,現任某企業研發總監,負責國產芯片在智能座艙底層的移植,曾任智能座艙語音交互運用高級工程師和負責人,具有多年車載智控系統開發和交通環境視覺、語音識別類項目開發經驗。在關鍵方案設計與實現、人機交互系統的原型搭建及系統設計、語音識別相關算法的研究與開發,包括聲學模型、語言模型的訓練等方面有豐富的經驗。