Figma設計稿、設計系統等相關尚未整理完成
– coming soon –

高擬真臺灣口音語音生成平台

Hyper-Realistic Taiwanese Mandarin AI Voice Platform

語音生成專案目標

虛擬人影片專案目標

品牌認識

一個以聲音生成為核心的創作平台,專注於高度在地化的台灣口音與自然語感。
以台灣人口音實現文字轉語音,專注在高擬真台灣口音的 AI 語音服務。提供多達 56 位具台灣口音的 AI 配音員,能夠表現多種情緒,使生成的語音富有情感,接近真人說話的效果。旨在推動本土文化的傳播,,平台進一步提供虛擬人影片功能,將聲音延伸為可視化內容,滿足多元媒介的創作需求。

目前平台可基本的單人語音生成、圖片轉多人對話的 Podcast、有聲書製作等,廣泛應用在 AI 配音、企業語音客服、公眾廣播、影片配音、教育學習等領域。
該品牌計劃未來擴展至 100 位台灣口音的 AI 聲優,為市場提供更多元的選擇。

隨著語音內容需求增加,創作者、品牌需更快速、低門檻的方式,將文字或圖文內容轉換為自然的聲音形式。
然而中文的聲音生成工具少數有台灣口音的聲音,以及在多人對話與情境應用上缺乏彈性,導致非專業使用者仍需投入學習成本,無法順利完成內容製作。

為解決「聲音生成門檻高、創作流程繁瑣、聲音情境不貼近真實使用需求」的問題,打造一個以台灣口音為核心、能支援多種創作情境的聲音生成平台,並在此基礎上延伸虛擬人影片功能,滿足不同媒介的內容呈現需求。

1. 聲音生成工具缺乏在地語感
多數 AI 聲音偏向標準普通話或中性語音,與台灣使用者日常語感落差大,影響內容的親切度與可信度。

2. 聲音創作流程對新手不友善
現有工具功能選項過多,初次使用者容易在設定階段迷失,無法快速完成第一次聲音生成。

3. 多人對話與角色切換成本高
製作對談型 podcast 時,需反覆設定不同聲音,流程零散且不易維持角色一致性。

4. 內容輸入形式單一
多數平台僅支援文字輸入,無法有效將圖片、圖文內容轉換為聲音,限制內容再利用的可能性。


5. 聲音情境與使用目的未被清楚區分
使用者難以快速找到適合新聞、聊天、教學等不同場景的聲音設定,增加試錯成本。


6. 聲音調整與預覽流程不直覺
聲音生成後的語速、語氣、停頓調整分散,影響創作流暢度。


7. 創作者對露臉與錄音存在心理門檻
部分使用者希望創作聲音或影音內容,但對錄音環境、鏡頭或隱私有顧慮。

8. 內容重製與延伸成本高
既有文章或圖文內容難以快速轉換為聲音或影音格式,降低跨平台經營效率。

Persona

聲音、文字為主的內容工作者,年齡約 25–50 歲,具備穩定收入來源,願意投資能提升創作效率與專業度的工具。

六大核心功能

短篇配音

提供 56 位聲優選擇,可將文字內容快速轉換為自然流暢的語音,適合用於廣告、短影音與旁白製作,大幅提升配音效率與產出速度。

長篇配音

支援多人角色設定,透過貼上文案即可自動生成多角色對話,讓不同聲音分別演繹內容,適合故事敘事、課程講解與節目製作。

虛擬人影片

結合人物圖片與 5–120 秒的音檔,自動生成對嘴同步的虛擬人影片,能快速製作解說、展示或品牌形象相關內容。

建立個人聲音

透過上傳音檔或錄音進行聲音學習,建立專屬人聲模型,後續可將文字轉換為高度貼近原聲的語音輸出。

文字生成 Podcast

根據輸入的主題或文章內容,自動轉換為 Podcast 音檔或行銷語音素材,將文字內容重新包裝為易於收聽的形式。

圖片生成 Podcast

透過辨識上傳圖片的畫面重點,自動產生對應的語音內容,快速轉換為 Podcast 或行銷音檔,延伸圖片內容的傳達方式。

關鍵任務

Features to start

Design

Click edit button to change this text. Lorem ipsum dolor sit amet, consectetur adipiscing elit.

Marketing

Click edit button to change this text. Lorem ipsum dolor sit amet, consectetur adipiscing elit.

Dev System

Click edit button to change this text. Lorem ipsum dolor sit amet, consectetur adipiscing elit.

設計決策與取捨

設計系統

易用性測試