自然語言處理團隊-研究成果

建構具包容、安全、韌性及永續特質的城市與鄉村 電信工程研究所     2022/07/04

陽明交通大學自然語言處理中心由陳信宏教授領軍,團隊成員包括有:王逸如教授、黃紹華教授、廖元甫教授等,另外並有7位博士後研究員與30位碩士研究員,研究中心設立於台北市中山區長安東路1段23號9樓之3,研究中心辦公室共有100坪研究空間。

    研究中心主要研究的方向包括: 語音辨識(Auto Speech Recognition, ASR)、語音合成(Text to Speech, TTS)、自然語言處理(Natural Language Processing, NLP)等三大方向。

研究團隊目前執行經濟部旗艦計畫研究案共四年(107年10月1日至111年9月30日止),每年補助六千萬,每年產出600~1,000萬技術移轉,以及每年產出6件專利申請。

    研究團隊在語音辨識技術之研究包括:中文、英文、台語之語音辨識研究,研究團隊目前已收集超過1萬小時且已標示對應文字之國語、英語、台語語料,目前在國語語音辨識部分,在會議聲音辨識率已接近93%,在電話語音辨識率亦已有85%,目前已經將技術應用在:總統大選辯論即時字幕、行政院紓困會議速記、立法院議會逐字稿、衛福部CDC記者會即時字幕、衛福部1966電話逐字稿、經濟部開會紀錄、科技部電話問答機器人、公視有話好說節目自動上字幕、台視節目上字幕、…等各式應用,其中衛福部CDC中央流行疫情中心記者會之應用並獲總統頒發感謝狀。此應用乃將陳時中部長自去年(109)二月份以來之記者會即時上字幕,讓聽障人士能夠一目了然記者會之內容,而且即時字幕平均正確率已達93%,算是成功之應用。

    研究團隊在語音合成技術之研究包括:中文、英文、台語之語音合成研發,目前已經有部分媒體採用此合成技術,作為虛擬主播之用。

    研究團隊在理解與回應部分,歷經三十餘年之研究,收集了數百億之中文文章,並將之做語法分析、斷詞研究、AI學習,共產生超過12萬之中文詞庫,此12萬中文詞庫與AI語言模型對於未來語音辨識、甚至機器人對話系統將有極大助益。

研究團隊語音辨識技術榮獲總統感謝獎牌
總統大選辯論即時字幕
衛福部CDC記者會即時字幕
TVBS(2021.03.26):CDC記者會同步字幕超精準竟是MIT!原因:維護國安
民視(2020.12.17):全台第一完整台語資料庫!「AI語音系統」用民視台語劇當語料
公視(2019.12.31):公視聯手交大,用語音辨識AI來幫總統大選辯論網路直播配即時字幕