一個時間離散線性系統輸出的樣本可以用其輸入樣本和過去的輸出樣本的線性組合,即線性預測值來逼近。通過使實際輸出值和線性預測值之間差的均方值最小的方法能夠確定唯一的一組預測器系數。這些系數就是線性組合中所用的加權系數。在這一原理中,系統實際上已被模型化了,這一模型就是零極點模型。它有兩種特例:①全極點模型,又稱自回歸模型。這時預測器只根據輸出過去的樣本進行預測。②全零點模型,又稱滑動平均模型。這時預測器只根據輸入樣本進行預測。迄今為止,最常用的模型還是全極點模型。這有幾個原因:―是全極點模型最易計算;二是在多數情況下,不可能知道輸入;三是對語音信號,在不考慮鼻音和部分擦音時,聲道的傳輸函數是一個全極點函數。
模型參數的估值在全極點模型下有兩種方法,即自關法和協方差法,它們分別適用于平穩信號和非平穩信號。模型參數的基本形式是線性預測系數,但它還有很多等價的表示形式。不同形式的系數在導致的逆濾波器結構,系統穩定性和量化時要求的比特數等方面都有所不同。現在公認的較好形式是反射系數,它所對應的濾波器具有格型結構,穩定性好量化時要求的比特數也少。
線性預測編碼的基礎是假設聲音信號(濁音)是音管末端的蜂鳴器產生的,偶爾伴隨有嘶嘶聲與爆破聲(齒擦音與爆破音)。盡管這看起來有些原始,但是這種模式實際上非常接近于真實語音產生過程。聲帶之間的聲門產生不同強度(音量)與頻率(音調)的聲音,喉嚨與嘴組成共鳴聲道。嘶嘶聲與爆破聲通過舌頭、嘴唇以及喉嚨的作用產生出來。
線性預測編碼通過估計共振峰、剔除它們在語音信號中的作用、估計保留的蜂鳴音強度與頻率來分析語音信號。剔除共振峰的過程稱為逆濾波,經過這個過程剩余的信號稱為殘余信號(en:residue)。
描述峰鳴強度與頻率、共鳴峰、殘余信號的數字可以保存、發送到其它地方。線性預測編碼通過逆向的過程合成語音信號:使用蜂鳴參數與殘余信號生成源信號、使用共振峰生成表示聲道的濾波器,源信號經過濾波器的處理就得到語音信號。
由于語音信號隨著時間變化,這個過程是在一段段的語音信號幀上進行處理的。通常每秒 30 到 50 幀的速度就能對可理解的信號進行很好的壓縮。
根據斯坦福大學 Robert M. Gray 的說法,線性預測編碼起源于 1966 年,當時 NTT 的 S. Saito 和 F. Itakura 描述了一種自動音素識別的方法,這種方法第一次使用了針對語音編碼的最大似然估計實現。1967 年,John Burg 略述了最大熵的實現方法。1969 年 Itakura 與 Saito 提出了部分相關(en:partial correlation)的概念, May Glen Culler 提議進行實時語音壓縮,B. S. Atal 在美國聲學協會年會上展示了一個 LPC 語音編碼器。1971 年 Philco-Ford 展示了使用 16 位 LPC 硬件的實時 LPC 并且賣出了四個。
1972 年 ARPA 的 Bob Kahn 與 Jim Forgie (en:Lincoln Laboratory, LL) 以及 Dave Walden (BBN Technologies) 開始了語音信息包的第一次開發,這最終帶來了 Voice over IP 技術。根據 Lincoln Laboratory 的非正式歷史資料記載,1973 年 Ed Hofstetter 實現了第一個 2400 位/秒 的實時 LPC。1974 年,第一個雙向實時 LPC 語音包通信在 Culler-Harrison 與 Lincoln Laboratories 之間通過 ARPANET 以 3500 位/秒 的速度實現。1976 年,第一次 LPC 會議通過 ARPANET 使用 Network Voice Protocol 在Culler-Harrison、ISI、SRI 與 LL 之間以 3500 位/秒 的速度實現。最后在 1978 年,BBN 的 Vishwanath et al. 開發了第一個變速 LPC 算法。
①被控對象的狀態方程是線性的(可以是定常的或時變的):式中x(t)為狀態向量,u(t)為控制向量,A和B是由被控對象的結構和參數所決定的系數矩陣(見狀態空間法)。②對控制向量u(t)無約束。③性能指標...
線性陣列的原理 線性陣列不僅用在專業音箱中,也用于Hi—Fi音箱中。最近Dynaudio推出的信心(confidence)...
線性調節器是用于控制線性對象的調節器,它使系統狀態和控制變量在控制過程中的給定二次型時間積分達到最小值,又稱線性最優調節器。線性調節器的反饋規律也是線性的。 線性調節器可以分為有限時間調節器和無限時間...
線性預測編碼經常用來傳輸頻譜包絡信息,這樣它就可以容忍傳輸誤差。由于直接傳輸濾波器系數(參見線性預測中系數定義)對于誤差非常敏感,所以人們不希望直接傳輸濾波器系數。換句話說,一個小的誤差不會扭曲整個頻譜或使整個頻譜質量下降,但是一個小的誤差可能使預測濾波器變得不穩定。
有許多更加高級的表示方法,如對數面積比(en:log area ratio,LAR)、線譜對(en:line spectral pairs,LSP) 分解以及反射系數等。在這些方法中,LSP 由于它能夠保證預測器的穩定性、并且小的系數偏差帶來的譜誤差也是局部的這些特性,所以得到了廣泛應用。
線性預測編碼通常用于語音的重新合成,它是電話公司使用的聲音壓縮格式,如 GSM 標準就在使用這種格式。它還用作安全無線通信中的格式,在安全的無線通信中,聲音必須進行數字化、加密然后通過狹窄的語音信道傳輸。
線性預測編碼合成也可以用于構建聲音合成器,樂器用作從歌手聲音預測得到的時變濾波器的激勵信號,這在電子音樂中有一定的流行。
1980年流行的 Speak & Spell 教育玩具中使用了一個 10 階的線性預測編碼。
在 FLAC 音頻編解碼器中使用了 0 到 4 階的線性預測編碼預測器。
格式:pdf
大小:635KB
頁數: 4頁
評分: 4.5
線性網絡編碼作為一種新型的數據編碼方式,它可以提高無線傳感器網絡的數據吞吐率、降低節點能耗、減少數據的傳播延遲.由于無線傳感器網絡自身的特點,直接使用已有的線性網絡編碼協議將面臨許多嚴重的安全攻擊.指出了線性網絡編碼應用于無線傳感器網絡所面臨的安全問題;并提出了一種安全的線性網絡編碼協議SEC.SEC既能夠實現線性網絡編碼的優點,還解決了其在無線傳感器網絡中所面臨的安全問題.
格式:pdf
大小:635KB
頁數: 3頁
評分: 4.5
研究了一種線性周期編碼光柵的三維輪廓術,其中采用了兩個相位相反的線性周期變化的光柵光場和一個均勻光場,對被測物體進行三次采樣。在獲得物輪廓的同時,又獲得了物體的表面紋理。當背影光很暗時,經過兩次采樣即可獲得物體的三維輪廓。通過理論分析,采用相位相反的線性周期光柵光場與相位相差1/2周期的線笥周期光柵光場相比,檢測粗度可以提高近1倍。
線性預測編碼的基礎是假設聲音信號(濁音)是音管末端的蜂鳴器產生的,偶爾伴隨有嘶嘶聲與爆破聲(齒擦音與爆破音)。盡管這看起來有些原始,但是這種模式實際上非常接近于真實語音產生過程。聲帶之間的聲門產生不同強度(音量)與頻率(音調)的聲音,喉嚨與嘴組成共鳴聲道。嘶嘶聲與爆破聲通過舌頭、嘴唇以及喉嚨的作用產生出來。
線性預測編碼通過估計共振峰、剔除它們在語音信號中的作用、估計保留的蜂鳴音強度與頻率來分析語音信號。剔除共振峰的過程稱為逆濾波,經過這個過程剩余的信號稱為殘余信號(en:residue)。
描述峰鳴強度與頻率、共鳴峰、殘余信號的數字可以保存、發送到其它地方。線性預測編碼通過逆向的過程合成語音信號:使用蜂鳴參數與殘余信號生成源信號、使用共振峰生成表示聲道的濾波器,源信號經過濾波器的處理就得到語音信號。
由于語音信號隨著時間變化,這個過程是在一段段的語音信號幀上進行處理的。通常每秒 30 到 50 幀的速度就能對可理解的信號進行很好的壓縮。
線性預測是進行語音信號分析最有效和最流行的分析技術之一。線性預測分析的重要性在于:它提供了一組簡潔的語音信號模型參數,這一組參數能夠較精確地表征語音信號的頻譜幅度,而分析它們所需的運算量相對來講并不大。例如用線性預測原理降低編碼數碼率的信號編碼,它主要用于話音、圖像和遙測信號的編碼。這種預測編碼不是對連續的信號直接抽樣后編碼,而是把每幀的P個預測系數和各樣值預測誤差en編碼后傳輸。收信端則利用這些參數來重建信號。在一般情況下它的編碼數碼率比直接抽樣后編碼的數碼率低得多。將語音的線性預測參數形成模板儲存,在語音識別中也可以提高識別率和減少計算時間。此外,這種參數還可以用來實現有效的語音合成。因此,線性預測分析技術已經成為語音信號處理的一個強有力的工具和方法。
其中有:①簡單的固定系數預測:預測系數在長時間內不變S②自適應預測:每一幀都重新計算預測系數和預測剩余信號的平均能量等,以便能很好地適應信號的復雜變化;③單級預測:利用信號的短時相關性進行預測;④多級預測:既利用短時相關性又利用前后周期相關性進行預測。
在實際應用中,對預測算法、預測系數的表征、編碼型式等都要進行優選。目標是減少運算量和存儲量,在精度受限時確保預測穩定,以及減少測算誤差、編碼誤差和傳輸差錯等因素對重建信號的不良影響。隨著大規模集成電路與計算技術的發展,線性預測技術將在通信和語音信號處理中發揮更大的作用。