

已閱讀1頁,還剩57頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、基于神經網絡的語音轉換利用其特殊的非線性方程轉換式將源說話人的特征映射為目標說話人的特征,這種方法被證實比基于高斯混合模型語音轉換方法更加有效。然而,基于神經網絡的語音轉換還有諸多不足。例如目前神經網絡的訓練是基于最小化幀誤差準則的,因此神經網絡相應的權值是根據整個的源說話人和目標說話人的訓練數據來進行調整的。
在本文中,我們受啟發(fā)于基于隱馬爾科夫模型(HMM)的語音合成體系中的基于整句優(yōu)化最小化生成誤差的訓練準則,將語音轉換
2、中神經網絡訓練的基于幀誤差最小化的訓練準則改為基于序列誤差最小化的訓練準則。我們利用基于梯度下降的反向傳播算法來最小化一句訓練數據上源說話人和目標說話人之間的轉換誤差。實驗結果表明通過先用最小化幀誤差準則訓練,再用最小化序列誤差訓練的神經網絡比起只用最小化幀誤差訓練的神經網絡轉換出來的聲音在主觀測試中更勝一籌。
在目前的語音轉換中,韻律轉換尤其是基頻轉換是一個很具有挑戰(zhàn)性的研究課題,這主要是因為基頻的不連續(xù)性。通?;l轉換都是
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于神經網絡的語音轉換算法研究.pdf
- 基于人工神經網絡的語音轉換技術研究.pdf
- 基于RBF神經網絡的漢語耳語音轉換為正常語音的研究.pdf
- 基于AD神經網絡的語音增強.pdf
- 基于復合神經網絡的語音識別研究.pdf
- 基于神經網絡的拼音漢字轉換.pdf
- 基于人工神經網絡的語音識別研究.pdf
- 基于神經網絡語音識別算法的研究.pdf
- 基于卷積神經網絡的語音識別研究.pdf
- 基于RBF神經網絡的語音識別研究.pdf
- 基于深度學習神經網絡的語音識別研究.pdf
- 基于神經網絡的語音合成與可視語音合成研究.pdf
- 基于深層神經網絡的語音增強方法研究.pdf
- 基于BP神經網絡的語音增強算法研究.pdf
- 基于深度神經網絡的語音識別模型研究.pdf
- 基于神經網絡的語音情感識別技術研究.pdf
- 基于深層神經網絡的語音識別聲學建模研究.pdf
- 基于卷積神經網絡的語音合成聲碼器研究.pdf
- 基于回歸神經網絡方法的孤立詞語音識別.pdf
- 基于BP神經網絡的語音增強系統研究.pdf
評論
0/150
提交評論