- 相關推薦
基于LD3320的語音識別系統在家庭電路中的模擬應用
摘 要:本研究旨在為行動不便的殘障人士或者老年人的家居生活提供便利和幫助,使他們能夠通過語音識別系統對家用電器、照明系統、門窗開關等實現智能控制。通過查找資料,對比參數、價格、識別率等方面的信息,最終采用了基于LD3320的語音識別系統進行家庭電路控制模擬應用。系統由四部分構成,即:YS-LD語音識別模塊、STM32單片機控制單元、LED顯示單元、繼電器輸出單元。LD3320語音識別芯片感應語音――通過STM32單片機運算分析――發出信號――控制繼電器――電器工作。經過測試,本套系統的語音辨識率高達90%,造價僅155元,并且無需用戶自行建立語音模型及開發語音識別算法,降低了應用開發的技術門檻,有利于推廣應用。
關鍵詞:語音控制;單片機;語音識別芯片;
一、課題背景
學校常會組織我們到貴陽市盲聾啞學校送愛心,與殘障孩子親密互動,今年也不例外。那些殘章的孩子來到這個世界,只能用他們僅存的方式去感知世界萬物,在他們的世界里只有一種顏色,那就是黑色。我不禁想,在學校還有老師的照拂,可他們總有一日要長大,要開啟自己的人生旅程。要是我能為他們做哪怕一點點事,就算只是為他們的家庭生活提供一些幫助也是好的。我想,如果能利用我在機器人社中學到的傳感器、電子電路、單片機等專業知識,對家庭電路進行智能化改造,讓家庭的電路“聰明”起來,使他們能夠聽得懂主人的指令而進行相應的操作,那就可以對有殘障的人和對一些不良于行的病人或老人的家庭生活都能提供很大的便利。于是,有了我的這個設計――基于LD3320的語音識別系統在家庭電路中的模擬應用。
二、模型設計
(一)模塊功能
(二)模型組成
(三)主要電子元件工作原理與功能說明
1、LD3320語音識別芯片
LD3320語音識別芯片采用的是ASR(Auto Speech Recognitio)技術,是YS-LD語音識別模塊的核心。它是對大量的語音數據經語言學家語音模型分析,建立數學模型,并經過反復訓練提取基元語音的細節特征,以及提取各基元間的特征差異,得到在統計概率最優化意義上的各個基元語音特征,最后才由資深工程師將算法以及語音模型轉換成硬件芯片并應用在嵌入式系統中。
LD3320有兩種使用模式,即“觸發識別模式”和“循環識別模式”。可以通過編程,設置兩種不同的使用模式。
觸發識別模式:系統的主控MCU在接收到外界一個觸發后,啟動LD3320芯片的一個定時識別過程,在這個定時過程中說出要識別的語音關鍵詞語。這個過程結束后,需要再次觸發才能再次啟動一個識別過程。
循環識別模式:系統的主控MCU反復啟動識別過程。如果沒有人說話就沒有識別結果,則每次識別過程的定時到時后再啟動一個識別過程;如果有識別結果,則根據識別作相應處理后再啟動一個識別過程。
根據本案模型的設計特點,采用語音觸發識別模式。LD3320芯片最多支持50個識別條目,每個識別條目是標準普通話的漢語拼音(小寫),每2個字(漢語拼音)之間用1個空格間隔。例如表1,只需要把識別的關鍵詞語以漢語拼音字符串的形式傳送進芯片,該芯片已封裝了基于標準普通話的語音模型數據和語音識別算法,無需進行任何語音訓練即可投入開發應用。
2、STM32單片機控制單元
本案模擬系統主控單元采用意法半導體ARM-Cortex架構的STM32F1系列超低功耗單片機作為控制核心。
該單元完成幾大功能:
向LD3320模塊提供時鐘振蕩信號,以驅動片上DSP(數字信號處理器 )工作;
通過SPI(串行外設接口)串行通信方式向LD3320模塊寫入預定義的控制命令拼音串,并讀取語音模塊返回的識別結果編碼;
根據識別結果驅動負載電路(LED單元(發光二極管)、繼電器單元)的動作。
當LD3320模塊完成一次識別過程后,通過中斷請求方式通知主控單元處理,主控單元獲知中斷請求后會暫時中止當前的任務執行,轉而跳轉到中斷服務例程(ISR Route),在該例程中通過SPI總線從LD3320模塊讀取識別編碼,根據識別編碼的不同執行對應控制功能。通過點亮、熄滅指令對應發光二極管或驅動繼電器接通主回路得到運行結果。
3、LED顯示單元
本案模擬系統用六個共陽極發光二極管(LED)來模擬家庭中廚房、工作間、臥室、走廊、衛生間、陽臺的燈泡開關狀況,工作時主控單片機則根據語音命令,采用輸出低電平方式進行驅動點亮。
4、繼電器輸出單元
繼電器輸出單元可接收主控單片機的高低電平控制信號以接通或斷開主回路。主回路根據實際需求可以用于大電壓,交、直流供電的負載驅動。本案模擬系統用繼電器單元實現家庭電扇的通斷控制。
(四)系統軟件開發環境
本案模擬系統的軟件開發只針對STM32F103主控單元進行,軟件代碼完成以下功能:
LD3320底層驅動(對其內部寄存器的讀寫、時序的控制);
STM32F103硬件單元和用戶變量的初始化;
用戶語音命令拼音串的寫入;
中斷服務ISR(完成負載電路的驅動控制)。
軟件開發基于ARM公司的Keil開發環境,完成從代碼編輯到編譯、調試、燒寫一系列過程。
(五)設備成本
三、設備實測
(一)控制命令
LD3320語音識別芯片中最多可以寫入50條語音控制指令,可以根據用戶需要定制個性化的語音控制功能。本案設備的設計初衷是為了探索LD3320語音識別芯片在家庭電路中的模擬應用,故只寫入了比較基本的18條指令。
(二)設備測試
在寫入程序,完成硬件連線并加電復位后,系統即進入運行狀態。向系統說出控制命令(盡可能用普通話, 不過實測時對貴陽本地方言還是有較高識別率),比如說“廚房打開”、“走廊關閉”、“電扇啟動”、“運行流水燈”等命令后,系統會根據識別結果執行對應動作,點亮/熄滅LED或者通/斷電扇運行。
為了更好的檢測語音識別效果,實驗中選擇多個不同音色的人在家庭(比較安靜)環境下分別進行測試,每個詞語測試50遍。部分非特定人的語音命令測試的正確識別數據比例見表4:由上表可知,在家庭(比較安靜)環境下,對于語音命令的平均識別率可達到90%以上。
四、設備優勢與應用展望
(一)設備優勢
1、本案設備成本低、語音辨識率高、響應快速,可以直接安裝于家庭電路中實現語音智能控制。
2、由于LD3320 可以動態編輯的識別關鍵詞語列表,因此其可以應用的范圍大大超過了那些不可以改變識別列表的芯片。
3、可以根據用戶的需求進行控制命令寫入,實現可定制、個性化的智能控制。
(二)應用展望
1、應對家庭生活突發狀況
在本語音識別系統中只是初步嘗試了對用電器通、斷電控制,而在現在社會中有很多的空巢老人,他們獨自生活,如果在家中出現意外或突發疾病,隨時都有可能危及生命。如果在本案系統中可以添加“緊急呼叫”的語音控制,當出現突發狀況時可以使用該功能觸發電話自動撥打物管、救護車、親屬等重要聯系人。或者該控制與小區物管相連,每當有人有緊急呼叫時,物管的終端緊急呼叫燈亮起,并觸發揚聲器發出警報聲,使物管人員迅速到場解決問題。
2、實現家用電器的語音控制
(1)電磁爐/微波爐/智能家電操作
在現在的家電中,各種各樣的設置越來越繁復。用戶在使用過程中,還要不斷地對家電進行功能切換。在引入LD3320 芯片后,可以用語音直接控制這些家電。比如用語音來控制電磁爐把火力調整到“煎炸”或者是“慢燉”。
(2)數碼像框
數碼像框中存放了許多的照片和視頻,同時又具有多種播放的方式。一般是通過按鍵或者遙控器的方式來對其進行操作,但是這樣的操作并不方便。在引入了LD3320 提供的語音識別功能后,用戶可以最自然地用語音去點播想要顯示的照片,或者改變數碼像框的顯示方式。使得這樣的數碼產品更加具有人性化的操作界面。
3、機頂盒/彩電遙控器
隨著數字電視的普及,家庭中可以收看到的電視節目也越來越豐富。大家也就苦于在眾多的頻道中迅速選擇到自己想要看的頻道。在把LD3320 語音識別芯片集成進機頂盒/彩電遙控器后,用戶只需要對著遙控器說出想要看的電視頻道的名字,就可以快速地選擇。比如用戶可以說出“奧運體育”,就可以轉到體育頻道來觀看精彩的體育比賽了。
4、智能玩具/對話玩具
在電視購物中曾經出現過可以人機對話的玩具,比如金福豬,金福狗等。這些玩具采用的語音識別只能支持固定的10 條左右的語音命令,比如“你好”,“我想聽歌”等等。采用LD3320 芯片,可以利用其動態編輯識別關鍵詞語列表的性能,讓玩具實現及其復雜的對話腳本。避免了玩具的嚴重同質化。
(三)公共服務設施的語音控制
1、自動售貨機、地鐵自動售票機等銷售型服務設施
在自動售貨機、地鐵自動售票機等銷售型服務設施中安裝語音操作模塊。人們可以對著售貨機說出要買的商品,比如“可口可樂”或者“面巾紙”投幣后商品就自動售出。在北京、上海等大都市中,外地旅客較多,對地鐵線路不熟悉導致買票時不知道票價也不知道如何購買。有了語音操作界面后,只需要對著售票機說出要去的地方或者想要到達的站點,根據屏幕提示放入紙幣,就可以方便地買到車票。
2、公共照明系統、輔助設施的語音控制
在公共場合幫助殘疾人士、行動不便的老人或小孩非接觸地去控制公共照明系統或輔助設施(地下通道輪椅臺等)的運行。
3、樓宇電視的廣告點播
目前分眾傳媒等公司的樓宇廣告設施,遍布幾乎所有的寫字樓,也在廣告投放上取得了良好的效果。但是目前用戶在接受廣告時,都是被動地去接受信息。對于其中感興趣的廣告,只能是等待下次再看到時進行仔細地了解,沒有辦法進行主動式地廣告查詢。
引入LD3320 語音識別芯片后,用戶可以用語音去方便地查詢想要了解的廣告信息。比如操作樓宇廣告“重新播放”“上一條”來重新觀看一條廣告;蛘“汽車”來點播想要看的汽車廣告。
這樣的語音操作,不需要增加額外的鍵盤輸入和觸摸屏輸入,又可以讓用戶與廣告充分互動,取得更佳的效果。
五、結語
使用LD3320 芯片可以在一定程度上完成這樣的語音控制系統,給人們的生活帶來更便利的語音交互界面。作為一種新的人機交互界面,會逐步地走入人們的日常生活,在適合用語音控制的地方給人們提供更多的便利。
參考文獻:
[1]陳喜春.基于LD3320語音識別專用芯片實現的語音控制,[J]. 電子技術設計與應用. 2011年11月
[2]金鑫,田犇,闕大順. 基于的LD3320語音控制系統設計實現.[J].電腦與信息技術.2011年12月.第19卷第6期
[3]洪家平.LD3320的嵌入式語音識別系統的應用.[J].單片機與嵌入式系統應用.2012年.第2期
【基于LD3320的語音識別系統在家庭電路中的模擬應用】相關文章:
AMBE-1000在語音壓縮中的應用03-19
語音處理芯片AC48105在低速語音編碼設備中的應用03-18
語音參數提取在聾兒學習中的應用03-07
SPCE061A在語音遙控器中的應用03-25
串口服務器在車號識別系統中的應用03-16