聲音伴隨生活.親密感相隨你我──TTS(Text To Speech)
TTS (Text To Speech)語音合成──是現在常見的科技應用,它的資料庫建構方式是錄製人聲的短句子,依照不同的需求從資料庫「組合」短句子成為整句話,且出來的成果近似於人聲,有別於傳統機器人聲音,例如貼近生活的語音助理:Amazon’s Alexa , Google Assistant 及大陸的「小愛」,透過電腦模擬人聲的議題,早期科幻電影中有出現過。1968年史丹利•庫柏力克執導的美國科幻電影《2001太空漫遊》(2001: A Space Odyssey),電影裡人工智慧電腦的聲音呈現近似於人聲,並擔任重要角色。如果你想聽看看TTS的效果,可以上網搜尋國內提供TTS服務的企業官網,即可聽到樣音。
TTS的定位為生活各領域的「輔助」角色。其應用有:幫助閱讀及學習有障礙的孩子、學習新語言、生活陪伴、醫療協助、居家虛擬幫手和企業客服及教育訓練。
輔助閱讀及學習──順化求知道路
TTS 可協助有閱讀障礙及認字能力較緩慢的孩子。想像孩子看著螢幕上的文字,電腦中出現近似人聲的伴讀,且伴讀的文字會跟著螢幕中的游標同步移動,讓孩子能清楚瞭解伴讀的文章位置。這種閱讀同時兼具視覺及聽覺體驗,有助孩子理解力發展,而不是僅僅記住單字。記得語速不要調整太快,研究發現每分鐘140-180字的語速對孩子的理解力較佳(Cunningham, 2003, Cunningham, 2011)。
另外,可依照孩子的需求與學校師長溝通讓TTS輔助孩子學校的學習。TTS是「輔助閱讀」工具,並非能夠幫助孩子增加閱讀技巧,這個觀念很重要。
忙碌日常中的──生活陪伴
現代人的節奏大多是「多工處理」(multitasking),在撰寫簡報企劃案的同時,也聆聽podcasts跟音樂,從中得知演唱會資訊、天氣或是其他訊息,打開眼睛同時打開耳朵,因為生活總是在與時間賽跑,同時進行會比較有效率。
TTS可以在你忙碌的片段時刻給予陪伴,透過TTS可以協助閱讀你喜愛的書籍、了解今日重點新聞、聆聽喜歡的線上課程內容,TTS如同你隨身的專屬伴讀之友,成為你的另外一雙眼睛幫你吸收文字轉換成語音,不受地點及時間限制成為生活中重要的陪伴。
醫療協助──為你「發聲」
腦部受創、帕金森氏症及 ALS(Amyotrophic lateral sclerosis)患者,因受傷影響到聲音表達的清晰度,聽者無法快速瞭解患者想表達的訊息,TTS能夠輔助「清楚發聲」。
上述我們有提到TTS資料庫的建置方式,醫療團隊邀請患者發聲錄製短句子,建構專屬資料庫,後續患者僅需對著接受器說話,TTS接收「患者聲音」後轉換成「文字」並可代替患者「發聲」表達,聽者能馬上接受到清楚資訊,進一步達到溝通及互動的結果,這使得患者及家屬在往後的日子裡,心靈交流能夠更完整。
詳細的TTS建置過程可參考 Youtube《Healed through A.I. | The Age of A.I.》。
居家虛擬幫手──心理及生理照護
TTS不僅擷取人的聲音及文字,更重要的是擷取人類說話的「方式」以及聽到他人說話時所做的「反應」,例如:Amazon’s Alexa 對獨居老人生活有很大的幫助,除了提供心靈陪伴,亦可提醒吃藥及回診時間。除此之外,能說故事陪伴小朋友,並能提醒全家人日常行程,兼具心理及生理照護。
企業專屬聲優──客服及教育訓練
企業依照品牌定位及形象挑選配音員建置TTS資料庫,建構前須瞭解基本用途及性質,才能決定語音的規格與錄製方式。
TTS運用於客服系統中,讓顧客接獲帶有溫度近似人聲的回應,而非僅有的文字表達,亦可增加品牌認知度及好感度。集團內部訓練,既有的數位影像素材搭配TTS,提升學習效果。
TTS除了上述所提的面向,還有運用在:3C智慧終端、叫號/結帳、工廠/倉儲自動化、數位內容製作、無障礙設施及IVR電話語音系統……,未來的使用只會越來越廣泛,朝更人性化的方向發展。語音合成的與專業配音員相比,「情感面」還是後者較勝出,因此相關影像和聽覺作品旁白少見以TTS錄製。科技日益進步,學習如何與科技共存,路才能走得更長遠!
參考資料
- Text-to-Speech Technology: What It Is and How It Works (Understood)
- Text-to-Speech (TTS) (Todd Cunningham, Harrison McNaughtan)
- Text to Speech Technology: How Voice Computing is Building a More Accessible World (Oliver Skinner,2020)
- Text to Speech(TTS) Technology (Written by Steven Bussey,2020)
- TTS(Text To Speech)語音合成計畫開發與文本錄音採樣(瓦器錄音室)
- The Benefits of Text to Speech (TTS) (Read Speaker pioneering voice technology)
- Healed through A.I.|The Age of A.I. (Youtube, 2019)
- TTS主要應用(網際智慧股份有限公司)
本文僅代表作者觀點。AVOICE Blog 提供聲友們一個可以暢所欲言的發「聲」小天地,我們很歡迎有任何配音經驗或對配音產業有興趣的你,投稿分享自己的所知所聞。
作者
林晏伶 / 寶兒‧人聲
廣告配音員,曾任國外展覽設計公司業務、電台廣告文案企劃、集團品牌行銷。有感於 3C 時代視覺當道,但觸及人心之作必兼具聽覺繚繞,於電台工作六年期間接觸廣告配音,對於聲音工作心有眷戀,透過「聲音」與世界連結,若能產生共鳴便感到心滿意足!