1、非監督式學習於中文電視新聞自動轉寫之初步應用 郭人瑋、蔡文鴻、陳柏琳國立台灣師範大學資訊工程研究所Exploiting Unsupervised Learning to Mandarin TV News Transcription: An Initial Study Jen-Wei Kuo , Wen-Hung Tsai , Berlin ChenSpeech Lab, National Taiwan Normal University序論 動機 日常生活中能取得的多媒體影音資訊愈來愈多,若要在語音辨識系統上使用這些資訊,人工轉寫往往不易取得。 解決方法非監督式學習 利用現有的語音辨識系統對這
2、些語料進行自動轉寫,並使用信心度評評估來加以篩選。 非監督式學習包含 非監督式聲學模型訓練 利用發音確認技術來挑選較正確的語料。 非監督式聲學模型調適 引入信心度評估來作聲學模型調適。 非監督式語言模型調適 使用自動轉寫的文字語料來作語言模型調適。 非監督式學習之流程與技術Introduction Motivation 日常生活中能取得的多媒體影音資訊愈來愈多,若要在語音辨識系統上使用這些資訊,人工轉寫往往不易取得。 Solution Unsupervised Learning 利用現有的語音辨識系統對這些語料進行自動轉寫,並使用信心度評評估來加以篩選。 非監督式學習包含 Unsupervis
3、ed Acoustic Model Training 利用發音確認技術來挑選較正確的語料。 Unsupervised Acoustic Model Adaptation 引入信心度評估來作聲學模型調適。 Unsupervised Language Model Adaptation 使用自動轉寫的文字語料來作語言模型調適。台師大資工所新聞語音辨識系統 大詞 語音辨識系統詞 立 利用 機 來作 詞 的 。詞 語言模型與聲學模型的動 法, 語言模型 能有 的 立詞。詞 在詞上上使用currency1的語言模型,“新進行 動 ,fifl的詞。)|()|(),( jibijfji wwPwwPwwFB
4、NTNU LVCSR System Large Vocabulary Continuous Speech Recognition System詞 立 利用 機 來作 詞 的 。詞 語言模型與聲學模型的動 法, 語言模型 能有 的 立詞。詞 在詞上上使用currency1的語言模型,“新進行 動 ,fifl的詞。)|()|(),( jibijfji wwPwwPwwFB 詞 、語音辨識所生的詞,對應的轉寫 不台人”台東妙語無端 太重 良心不斷 太多台中良心兩任SIL豪雨無端無端台東不斷不斷兩人陶藝死亡私人良心 自任非監督式學習之流程大語料語音辨識 對應的自動轉寫( 詞序)篩選篩選非監督式聲學模型訓練聲學模型 語言模型詞 語音辨識系統詞 語音 入 文字 詞詞 詞 MLLR非監督式聲學模型調適詞 篩選非監督式語言模型調適文字語料語型言 模立語言模型人工轉寫語料聲型學 模立聲學模型非監督式學習技術選詞 機 聲學信心選詞信心度評估發音確認非監督式聲學模型訓練非監督式語言模型調適非監督式聲學模型調適選詞 機 ,),(),()(),()|()|(11111111XWpXWwWpXpXwpXwpXwCMTWTttttWWttttttPosteriorTeessTetsteseses esttwstet1T11stWTteW 1