線上語音轉文字 — 把說話的聲音變成文字
上傳任意音訊或影片,於線上把語音轉成文字。51 種語言達 97.3% 準確率,並附上智慧型標點與段落。
Musely 線上語音轉文字是一款 AI 語音轉文字工具,可將音訊或影片錄音轉成乾淨又排好版的文字。由 Seed-ASR 2.0 驅動,在 51 種輸入語言上達到 97.3% 的轉寫準確率,支援 48 種輸出語言與雙語模式。可依內容類型調整標點、整理贅語與排版,並提供 4 組針對本工具調校的預設;你可以設定輸出格式,並匯出為 Markdown、DOCX 或純文字,直接貼入你的工作流程。
幕後規格
🤖ASR 引擎
工具輸出
3 步使用 Musely 線上語音轉文字
上傳檔案
將任何音訊或影片檔拖放到 Musely 線上語音轉文字。支援 MP3、MP4、WAV、M4A、MOV、AAC、FLAC、OGG、WEBM 等超過 10 種格式,單檔長度最長可達 2 小時。
選擇預設並設定
從 4 組預設中擇一(標準文字、語音備忘轉文字、課堂或講座、Podcast 或訪談)。設定音訊語言與輸出語言,並加入自訂指示或詞彙。啟用雙語模式,即可獲得翻譯結果與原文並列。
下載結果
查看生成文字,視情況包含講者標註、時間碼或章節結構。可下載為 Markdown、DOCX 或純文字。複製到剪貼簿,即可快速貼入文件、Slack 或 CMS。
誰在使用 Musely 線上語音轉文字
把語音備忘變成乾淨的文字
我大多數點子都用語音備忘錄下來。語音備忘預設會整理成易讀的文字,還會抓出待辦事項。每天大約省下一小時的筆記時間。
把課堂錄音變成學生的筆記
我上傳 90 分鐘的課堂錄音。課堂預設會用標題分段,並附上重點摘要。學生很喜歡在聽錄音的同時有一份結構化的文字。
把 Podcast 音訊變成已排版的節目文字
Podcast 預設會自動切出開場、段落與結尾。我只做輕度修訂就能隨每集發布逐字稿,自從這麼做之後,Google 自然流量翻倍。
把使用者訪談音訊變成標註講者的逐字稿
訪談預設會標註講者並附上時間碼,任何引述都能跳回對應的音訊位置。97.3% 的準確率讓我幾乎不用再整理。
把外語語音變成雙語對照文字
我把音訊語言設成西班牙文並開啟雙語模式,就能得到西班牙文原文與英文翻譯並列的文字。這幫我取代了每月 20 美元的語言 App。
用口述寫草稿,再轉成乾淨的文字
走路時我先口述初稿,再把錄音上傳。Musely 會變成有段落的乾淨文字,一篇大概省下 30 分鐘。
Musely 與其他線上語音轉文字工具比較
| 功能 | Musely | Otter.ai | Rev | Trint |
|---|---|---|---|---|
| 轉寫準確率 | ✓ 97.3%(Seed-ASR 2.0) | ⚠ 良好(以 Whisper 為基礎) | ⚠ 良好(自研) | ✗ 一般 |
| 音訊語言 | ✓ 51 種,附自動偵測 99 種(Whisper) | ✓ 36 種 | ✓ 15-20 種 | |
| 檔案長度上限 | ✓ 單檔 2 小時 | ⚠ 免費 30 分鐘 | ⚠ 免費 15 分鐘 | ⚠ 免費 10 分鐘 |
| 輸出語言翻譯 | ✓ 48 種輸出語言附雙語切換 | ⚠ 有限 | ⚠ 有限 | ✗ 無 |
| 是否需註冊 | ✓ 首份逐字稿免註冊 | ✗ 需註冊 | ✗ 需註冊 | ✗ 需註冊 |
| 免費方案 | ✓ 提供 | ⚠ 每月 30 分鐘 | ⚠ 頁數受限 | ✗ 僅限試用 |
使用者怎麼說
4.8/5,共 3127 則評價
“Podcast 預設會把我 45 分鐘的節目自動拆成開場、段落與結尾。以前我都手動切,現在每集節省 40 分鐘。自從開始隨集發布逐字稿,節目頁的自然搜尋流量成長 80%。”
“西班牙文的語音辨識準確度是我試過最好的。雙語切換讓我能同時看到西班牙文與英文,對我的雙語部落格來說很關鍵。”
“智慧標點會在講者停頓的地方加上破折號與長破折號,讀起來像是自己寫的,而不是口述的。”
常見問題
Musely 線上語音轉文字採用 Seed-ASR 2.0,51 種語言達 97.3% 準確率。內含 5 組內容類型預設(一般、語音備忘、課堂、Podcast、會議)、智慧標點與 48 種輸出語言(附雙語切換),並可完全在瀏覽器中執行,無需安裝。
Musely 線上語音轉文字是面向終端使用者的工具,內建預設、智慧排版與翻譯,而 Google Speech-to-Text 是開發者 API,需要自行整合。Musely 走瀏覽器路線,30 秒內就能開始使用;Google 的服務則需要 API 金鑰、程式碼與計費設定。
很高。Musely 線上語音轉文字透過 Seed-ASR 2.0 支援 51 種音訊語言,涵蓋中文普通話、粵語、西班牙文、葡萄牙文、日文、韓文、阿拉伯文、印地文與另外 43 種。多數語言的準確率都維持在 95% 以上,中文與英文的自動偵測也相當穩定。
Musely 線上語音轉文字提供 3 種標點風格:標準(句號 / 逗號)、智慧(在直接引語與插話處加上引號與破折號),以及最簡(只在句末標點)。此外也提供 3 種排版選項:純文字、段落文字,或帶標題的 markdown。
Musely 內建「清理口語贅語」開關,可在保留原意的前提下移除「嗯、啊、就是、你知道」等填充詞、錯誤起頭與口吃重複。若在研究或法律情境中需要保留每個字,請關閉此開關以取得逐字稿輸出。
