音頻監(jiān)控在安防中的應用
音頻監(jiān)控是智慧安防建設(shè)系統(tǒng)的重要組成部分,它是一種防范能力較強的綜合系統(tǒng),直觀、準確、及時和信息內(nèi)容豐富,是其突出的特點。
對于音視頻一體化監(jiān)控來說,攝像機相當于眼睛,拾音器相當于耳朵。眼睛看到的圖像和耳朵聽到的聲音通過光纖、網(wǎng)絡(luò)等神經(jīng)系統(tǒng)傳輸?shù)酱鎯Ψ掌骶蜆?gòu)成一個完整的音視頻監(jiān)控系統(tǒng),為智慧安防或智慧城市提供 高品質(zhì)完整的基礎(chǔ)數(shù)據(jù)。
傳統(tǒng)的視頻監(jiān)控系統(tǒng)都沒有聲音,就像早期的無聲電影,人們只能看到無聲的影像。而現(xiàn)在很多的智慧安防,已經(jīng)要求增加音頻采集,例如在平安城市、公檢法辦案區(qū)、金融機構(gòu)、公共交通、教育監(jiān)考、行政服務、執(zhí)法取證等領(lǐng)域,越來越多的優(yōu)質(zhì)項目需要高清晰、高保真的音視頻同步監(jiān)控系統(tǒng),在優(yōu)質(zhì)安防工程中已凸顯出音頻監(jiān)控的重要性,成為平安城市和智能政務的新亮點。
一套完整的音頻監(jiān)控系統(tǒng)包括拾音器和語音降噪設(shè)備、網(wǎng)絡(luò)錄音對講系統(tǒng)、音頻智能分析系統(tǒng)。
拾音器:拾音器是音頻監(jiān)控系統(tǒng)的核心,主要是通過聲音的震動來采集現(xiàn)場的聲音。拾音器一般分為數(shù)字拾音器和模擬拾音器,數(shù)字拾音器就是通過數(shù)字信號處理系統(tǒng)將模擬的音頻信號轉(zhuǎn)換成數(shù)字信號并進行相應的數(shù)字信號處理的聲音傳感設(shè)備。模擬拾音器就只是用一般的模擬電路放大咪頭采集到的聲音。
網(wǎng)絡(luò)錄音對講系統(tǒng):主要包括遠程錄音系統(tǒng)和對講系統(tǒng)。一旦采集到聲音,就會自動啟動錄音功能,并主要通過語音卡和音箱,實現(xiàn)實時監(jiān)聽的功能。
音頻智能分析系統(tǒng):音頻智能分析類似于視頻監(jiān)控系統(tǒng)中的智能分析。通過聲紋采集和比對,來分析出聲音的具體特征,并能分析出當時的應用場景。
音頻監(jiān)控經(jīng)過多年的發(fā)展,技術(shù)正趨于成熟。通過對聲紋的識別可以鑒定個人的身份。人類語言的產(chǎn)生是人體語言中樞與發(fā)音器官之間一個復雜的生理物理過程,人在講話時使用的發(fā)聲器官(舌、牙齒、喉頭、肺、鼻腔)在尺寸和形態(tài)方面差異很大,所以每個人的聲紋圖譜都有獨特的,既有相對穩(wěn)定性,也有一些變異。但盡管如此,由于每個人的發(fā)音器官都不盡相同,因此在一般情況下,可以通過音頻系統(tǒng)來區(qū)別不同的人的聲音或判斷是否是同一人的聲音。
通過音頻監(jiān)控的場景分析來判斷當時場景下的異常行為。這種技術(shù)是基于各類異常聲音在時域、頻域的特征,結(jié)合模式識別的分類方法對異常事件報警。
其實,現(xiàn)在已經(jīng)有些廠商的技術(shù)已經(jīng)可以做到通過聲音的識別來判斷說話人的情緒、所處的環(huán)境等問題。