musely
支援 51 種語言

線上語音轉文字 — 把說話的聲音變成文字

上傳任意音訊或影片,於線上把語音轉成文字。51 種語言達 97.3% 準確率,並附上智慧型標點與段落。

最後更新 2026 年 4 月 23 日
97.3%轉寫準確率
51音訊語言
48輸出語言
2 小時檔案長度上限
Musely 線上語音轉文字是什麼?

Musely 線上語音轉文字是一款 AI 語音轉文字工具,可將音訊或影片錄音轉成乾淨又排好版的文字。由 Seed-ASR 2.0 驅動,在 51 種輸入語言上達到 97.3% 的轉寫準確率,支援 48 種輸出語言雙語模式。可依內容類型調整標點、整理贅語與排版,並提供 4 組針對本工具調校的預設;你可以設定輸出格式,並匯出為 Markdown、DOCX 或純文字,直接貼入你的工作流程。

技術規格

幕後規格

🤖ASR 引擎

模型Seed-ASR 2.0
準確率51 種語言達 97.3%
音訊語言51 種,中文與英文可自動偵測
檔案長度上限單檔 2 小時

工具輸出

預設標準文字 / 語音備忘轉文字 / 課堂或講座 / Podcast 或訪談
輸出語言48 種,附雙語模式切換
匯出格式Markdown / DOCX / 純文字
處理策略區塊循序處理,10 秒重疊銜接
運作方式

3 步使用 Musely 線上語音轉文字

1

上傳檔案

將任何音訊或影片檔拖放到 Musely 線上語音轉文字。支援 MP3、MP4、WAV、M4A、MOV、AAC、FLAC、OGG、WEBM 等超過 10 種格式,單檔長度最長可達 2 小時。

2

選擇預設並設定

從 4 組預設中擇一(標準文字、語音備忘轉文字、課堂或講座、Podcast 或訪談)。設定音訊語言與輸出語言,並加入自訂指示或詞彙。啟用雙語模式,即可獲得翻譯結果與原文並列。

3

下載結果

查看生成文字,視情況包含講者標註、時間碼或章節結構。可下載為 Markdown、DOCX 或純文字。複製到剪貼簿,即可快速貼入文件、Slack 或 CMS。

使用情境

誰在使用 Musely 線上語音轉文字

常用語音備忘的人

把語音備忘變成乾淨的文字

我大多數點子都用語音備忘錄下來。語音備忘預設會整理成易讀的文字,還會抓出待辦事項。每天大約省下一小時的筆記時間。

大學講師

把課堂錄音變成學生的筆記

我上傳 90 分鐘的課堂錄音。課堂預設會用標題分段,並附上重點摘要。學生很喜歡在聽錄音的同時有一份結構化的文字。

Podcast 主持人

把 Podcast 音訊變成已排版的節目文字

Podcast 預設會自動切出開場、段落與結尾。我只做輕度修訂就能隨每集發布逐字稿,自從這麼做之後,Google 自然流量翻倍。

UX 研究員

把使用者訪談音訊變成標註講者的逐字稿

訪談預設會標註講者並附上時間碼,任何引述都能跳回對應的音訊位置。97.3% 的準確率讓我幾乎不用再整理。

語言學習者

把外語語音變成雙語對照文字

我把音訊語言設成西班牙文並開啟雙語模式,就能得到西班牙文原文與英文翻譯並列的文字。這幫我取代了每月 20 美元的語言 App。

內容寫手

用口述寫草稿,再轉成乾淨的文字

走路時我先口述初稿,再把錄音上傳。Musely 會變成有段落的乾淨文字,一篇大概省下 30 分鐘。

比較

Musely 與其他線上語音轉文字工具比較

功能MuselyOtter.aiRevTrint
轉寫準確率✓ 97.3%(Seed-ASR 2.0)⚠ 良好(以 Whisper 為基礎)⚠ 良好(自研)✗ 一般
音訊語言✓ 51 種,附自動偵測 99 種(Whisper)✓ 36 種✓ 15-20 種
檔案長度上限✓ 單檔 2 小時⚠ 免費 30 分鐘⚠ 免費 15 分鐘⚠ 免費 10 分鐘
輸出語言翻譯✓ 48 種輸出語言附雙語切換⚠ 有限⚠ 有限✗ 無
是否需註冊✓ 首份逐字稿免註冊✗ 需註冊✗ 需註冊✗ 需註冊
免費方案✓ 提供⚠ 每月 30 分鐘⚠ 頁數受限✗ 僅限試用
功能比較以 2026 年 4 月各家免費方案為準
評價

使用者怎麼說

4.8/5,共 3127 則評價

★★★★★

Podcast 預設會把我 45 分鐘的節目自動拆成開場、段落與結尾。以前我都手動切,現在每集節省 40 分鐘。自從開始隨集發布逐字稿,節目頁的自然搜尋流量成長 80%。

EM
Elena M.
Podcast 製作人
★★★★★

西班牙文的語音辨識準確度是我試過最好的。雙語切換讓我能同時看到西班牙文與英文,對我的雙語部落格來說很關鍵。

LP
Luis P.
內容創作者
★★★★☆

智慧標點會在講者停頓的地方加上破折號與長破折號,讀起來像是自己寫的,而不是口述的。

AB
Aisha B.
作家
常見問題

常見問題

Musely 線上語音轉文字採用 Seed-ASR 2.0,51 種語言達 97.3% 準確率。內含 5 組內容類型預設(一般、語音備忘、課堂、Podcast、會議)、智慧標點與 48 種輸出語言(附雙語切換),並可完全在瀏覽器中執行,無需安裝。

Musely 線上語音轉文字是面向終端使用者的工具,內建預設、智慧排版與翻譯,而 Google Speech-to-Text 是開發者 API,需要自行整合。Musely 走瀏覽器路線,30 秒內就能開始使用;Google 的服務則需要 API 金鑰、程式碼與計費設定。

很高。Musely 線上語音轉文字透過 Seed-ASR 2.0 支援 51 種音訊語言,涵蓋中文普通話、粵語、西班牙文、葡萄牙文、日文、韓文、阿拉伯文、印地文與另外 43 種。多數語言的準確率都維持在 95% 以上,中文與英文的自動偵測也相當穩定。

Musely 線上語音轉文字提供 3 種標點風格:標準(句號 / 逗號)、智慧(在直接引語與插話處加上引號與破折號),以及最簡(只在句末標點)。此外也提供 3 種排版選項:純文字、段落文字,或帶標題的 markdown。

Musely 內建「清理口語贅語」開關,可在保留原意的前提下移除「嗯、啊、就是、你知道」等填充詞、錯誤起頭與口吃重複。若在研究或法律情境中需要保留每個字,請關閉此開關以取得逐字稿輸出。