musely
可匯出 DOCX / TXT / Markdown

語音轉文字轉換器 — 乾淨且可直接匯出的文字檔

將語音轉成可直接匯出的文字。可選擇文件、純文字、結構化 Markdown 或 SRT 相容輸出,準確率高達 97.3%。

最後更新 2026 年 4 月 23 日
97.3%轉寫準確率
51音訊語言
48輸出語言
2 小時檔案長度上限
Musely 語音轉文字轉換器是什麼?

Musely 語音轉文字轉換器是一款 AI 工具,可將音訊或影片錄音轉成乾淨又排好版的文字。由 Seed-ASR 2.0 驅動,在 51 種輸入語言上達到 97.3% 的轉寫準確率,並支援 48 種輸出語言雙語模式。匯出就緒,內含標題、段落結構與 3 種匯出格式(DOCX、TXT、Markdown);提供 4 組針對本工具調校的預設,可依需求設定輸出格式,並匯出為 Markdown、DOCX 或純文字,直接貼入你的工作流程。

技術規格

幕後規格

🤖ASR 引擎

模型Seed-ASR 2.0
準確率51 種語言達 97.3%
音訊語言51 種,中文與英文可自動偵測
檔案長度上限單檔 2 小時

工具輸出

預設文件就緒文字 / 純文字傾印 / 結構化逐字稿 / SRT 相容文字
輸出語言48 種,附雙語模式切換
匯出格式Markdown / DOCX / 純文字
處理策略區塊循序處理,10 秒重疊銜接
運作方式

3 步使用 Musely 語音轉文字轉換器

1

上傳檔案

將任何音訊或影片檔拖放到 Musely 語音轉文字轉換器。支援 MP3、MP4、WAV、M4A、MOV、AAC、FLAC、OGG、WEBM 等超過 10 種格式,單檔長度最長可達 2 小時。

2

選擇預設並設定

從 4 組預設中擇一(文件就緒文字、純文字傾印、結構化逐字稿、SRT 相容文字)。設定音訊語言與輸出語言,並加入自訂指示或詞彙。啟用雙語模式,即可獲得翻譯結果與原文並列。

3

下載結果

查看生成文字,視情況包含講者標註、時間碼或章節結構。可下載為 Markdown、DOCX 或純文字。複製到剪貼簿,即可快速貼入文件、Slack 或 CMS。

使用情境

誰在使用 Musely 語音轉文字轉換器

專業譯者

把音訊轉成 DOCX 用於翻譯工作

我用一鍵把原始音訊轉成 DOCX。文件預設會加上標題與 metadata,讓我的翻譯記憶體軟體能正確索引每個檔案,每案可省下 15 分鐘。

作者

口述章節並匯出為 Word

我散步時口述 2000 字的章節。Musely 會給我現成的 Word 文件,含章節標題與乾淨段落,完全省下打字的步驟。

法務助理

把庭訊音訊轉成逐字文字

逐字預設會保留每個字,連贅語都在內。我們律師在法律審閱時需要完全精確的逐字稿。匯出成 DOCX 讓團隊可以立刻開始審閱。

內容再利用者

把音訊變成 SRT 就緒的文字,方便之後做字幕

每行一句的預設讓之後轉成 SRT 字幕變得輕而易舉。一次上傳就能同時拿到書面逐字稿與可做字幕的素材。

學術研究人員

把 2 小時的訪談轉成可搜尋的存檔檔案

我們的研究倫理委員會要求檔案保存 10 年。含字數統計與乾淨段落的存檔格式,正好符合資料存放區的需求。

編輯

把作者的粗略口述轉成可出版的文字

作者寄來語音備忘,我用自然書面風格把它整理成精緻散文,初步清稿時間直接減半。

比較

Musely 與其他語音轉文字轉換器比較

功能MuselyOtter.aiRevTrint
轉寫準確率✓ 97.3%(Seed-ASR 2.0)⚠ 良好(以 Whisper 為基礎)⚠ 良好(自研)✗ 一般
音訊語言✓ 51 種,附自動偵測 99 種(Whisper)✓ 36 種✓ 15-20 種
檔案長度上限✓ 單檔 2 小時⚠ 免費 30 分鐘⚠ 免費 15 分鐘⚠ 免費 10 分鐘
輸出語言翻譯✓ 48 種輸出語言附雙語切換⚠ 有限⚠ 有限✗ 無
是否需註冊✓ 首份逐字稿免註冊✗ 需註冊✗ 需註冊✗ 需註冊
免費方案✓ 提供⚠ 每月 30 分鐘⚠ 頁數受限✗ 僅限試用
功能比較以 2026 年 4 月各家免費方案為準
評價

使用者怎麼說

4.8/5,共 3127 則評價

★★★★★

文件預設能把我的內容匯出成含標題與乾淨段落的 Word 檔,直接就能交給客戶。這一季我已經交出 40 份逐字稿,沒有一份需要再動格式。

TG
Tomás G.
自由譯者
★★★★★

逐字預設會抓下每個字,連贅語都會保留。對需要精確紀錄的法律工作來說很關鍵。匯出成 DOCX 後,我不必再做任何轉檔就能立刻開始審閱。

RN
Rachel N.
法務助理
★★★★☆

SRT 就緒的輸出格式原本沒想到會這麼實用。現在一次上傳就能拿到逐字稿和字幕素材,省掉再跑一次的時間。

KA
Kenji A.
影片剪輯師
常見問題

常見問題

Musely 語音轉文字轉換器由 Seed-ASR 2.0 驅動,可產出 97.3% 準確的可匯出文字。支援 4 種輸出目的地(Word、純文字、markdown、SRT 就緒)、自動產生標題,並可一鍵匯出為 DOCX、TXT、Markdown。共支援 51 種音訊語言。

Musely 語音轉文字轉換器專注於轉換流程 — 上傳、設定、匯出;Descript 則是完整的音訊剪輯軟體。對簡單的逐字需求而言,Musely 使用上更快,支援的音訊語言也更多(51 對 23),而且不需要安裝桌面應用程式。

可以。在「其他指示」欄位中可以指定自訂詞彙 — 例如專案名稱、縮寫或技術名詞。Musely 會把這些詞彙以 hotwords 的形式送到 Seed-ASR 2.0 以提高辨識精準度,並提示 LLM 後處理器在輸出中保留精確的拼寫。

Musely 語音轉文字轉換器可匯出為 Microsoft Word(DOCX)、純文字(TXT)與 Markdown(MD)。「每行一句」預設還會額外產生 SRT 就緒的輸出。若啟用相應選項,所有匯出都會包含自動產生的標題與 metadata 列。

Musely 可在一次轉換中處理長度達 2 小時的檔案。對於長檔案,內容會以 10 秒重疊的方式聰明切塊,再組合成一份連貫的文件。章節結構與標題會在切塊邊界間維持一致。