聲音伴隨生活‧親密感相隨你我——TTS(Text To Speech)

聲音伴隨生活.親密感相隨你我──TTS(Text To Speech)

聲音伴隨生活.親密感相隨你我──TTS(Text To Speech)

TTS (Text To Speech)語音合成──是現在常見的科技應用,它的資料庫建構方式是錄製人聲的短句子,依照不同的需求從資料庫「組合」短句子成為整句話,且出來的成果近似於人聲,有別於傳統機器人聲音,例如貼近生活的語音助理:Amazon’s Alexa , Google Assistant 及大陸的「小愛」,透過電腦模擬人聲的議題,早期科幻電影中有出現過。1968年史丹利•庫柏力克執導的美國科幻電影《2001太空漫遊》(2001: A Space Odyssey),電影裡人工智慧電腦的聲音呈現近似於人聲,並擔任重要角色。如果你想聽看看TTS的效果,可以上網搜尋國內提供TTS服務的企業官網,即可聽到樣音。

TTS的定位為生活各領域的「輔助」角色。其應用有:幫助閱讀及學習有障礙的孩子、學習新語言、生活陪伴、醫療協助、居家虛擬幫手和企業客服及教育訓練。

輔助閱讀及學習──順化求知道路

TTS 可協助有閱讀障礙及認字能力較緩慢的孩子。想像孩子看著螢幕上的文字,電腦中出現近似人聲的伴讀,且伴讀的文字會跟著螢幕中的游標同步移動,讓孩子能清楚瞭解伴讀的文章位置。這種閱讀同時兼具視覺及聽覺體驗,有助孩子理解力發展,而不是僅僅記住單字。記得語速不要調整太快,研究發現每分鐘140-180字的語速對孩子的理解力較佳(Cunningham, 2003, Cunningham, 2011)。

另外,可依照孩子的需求與學校師長溝通讓TTS輔助孩子學校的學習。TTS是「輔助閱讀」工具,並非能夠幫助孩子增加閱讀技巧,這個觀念很重要。

忙碌日常中的──生活陪伴

現代人的節奏大多是「多工處理」(multitasking),在撰寫簡報企劃案的同時,也聆聽podcasts跟音樂,從中得知演唱會資訊、天氣或是其他訊息,打開眼睛同時打開耳朵,因為生活總是在與時間賽跑,同時進行會比較有效率。

TTS可以在你忙碌的片段時刻給予陪伴,透過TTS可以協助閱讀你喜愛的書籍、了解今日重點新聞、聆聽喜歡的線上課程內容,TTS如同你隨身的專屬伴讀之友,成為你的另外一雙眼睛幫你吸收文字轉換成語音,不受地點及時間限制成為生活中重要的陪伴。

醫療協助──為你「發聲」

腦部受創、帕金森氏症及 ALS(Amyotrophic lateral sclerosis)患者,因受傷影響到聲音表達的清晰度,聽者無法快速瞭解患者想表達的訊息,TTS能夠輔助「清楚發聲」。

上述我們有提到TTS資料庫的建置方式,醫療團隊邀請患者發聲錄製短句子,建構專屬資料庫,後續患者僅需對著接受器說話,TTS接收「患者聲音」後轉換成「文字」並可代替患者「發聲」表達,聽者能馬上接受到清楚資訊,進一步達到溝通及互動的結果,這使得患者及家屬在往後的日子裡,心靈交流能夠更完整。

詳細的TTS建置過程可參考 Youtube《Healed through A.I. | The Age of A.I.》

居家虛擬幫手──心理及生理照護

TTS不僅擷取人的聲音及文字,更重要的是擷取人類說話的「方式」以及聽到他人說話時所做的「反應」,例如:Amazon’s Alexa 對獨居老人生活有很大的幫助,除了提供心靈陪伴,亦可提醒吃藥及回診時間。除此之外,能說故事陪伴小朋友,並能提醒全家人日常行程,兼具心理及生理照護。

企業專屬聲優──客服及教育訓練

企業依照品牌定位及形象挑選配音員建置TTS資料庫,建構前須瞭解基本用途及性質,才能決定語音的規格與錄製方式。

TTS運用於客服系統中,讓顧客接獲帶有溫度近似人聲的回應,而非僅有的文字表達,亦可增加品牌認知度及好感度。集團內部訓練,既有的數位影像素材搭配TTS,提升學習效果。

TTS除了上述所提的面向,還有運用在:3C智慧終端、叫號/結帳、工廠/倉儲自動化、數位內容製作、無障礙設施及IVR電話語音系統……,未來的使用只會越來越廣泛,朝更人性化的方向發展。語音合成的與專業配音員相比,「情感面」還是後者較勝出,因此相關影像和聽覺作品旁白少見以TTS錄製。科技日益進步,學習如何與科技共存,路才能走得更長遠!

參考資料

  1. Text-to-Speech Technology: What It Is and How It Works (Understood)
  2. Text-to-Speech (TTS) (Todd Cunningham, Harrison McNaughtan)
  3. Text to Speech Technology: How Voice Computing is Building a More Accessible World (Oliver Skinner,2020)
  4. Text to Speech(TTS) Technology (Written by Steven Bussey,2020)
  5. TTS(Text To Speech)語音合成計畫開發與文本錄音採樣(瓦器錄音室)
  6. The Benefits of Text to Speech (TTS) (Read Speaker pioneering voice technology)
  7. Healed through A.I.|The Age of A.I. (Youtube, 2019)
  8. TTS主要應用(網際智慧股份有限公司)

本文僅代表作者觀點。AVOICE Blog 提供聲友們一個可以暢所欲言的發「聲」小天地,我們很歡迎有任何配音經驗或對配音產業有興趣的你,投稿分享自己的所知所聞。


作者

林晏伶 / 寶兒‧人聲

廣告配音員,曾任國外展覽設計公司業務、電台廣告文案企劃、集團品牌行銷。有感於 3C 時代視覺當道,但觸及人心之作必兼具聽覺繚繞,於電台工作六年期間接觸廣告配音,對於聲音工作心有眷戀,透過「聲音」與世界連結,若能產生共鳴便感到心滿意足!


Leave a Comment

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *