廣東話轉文字 — 粵語逐字稿,準確率94.1%
上傳廣東話錄音或影片,Musely以Seed-ASR 2.0專屬粵語模型轉錄,準確率達94.1%。支援口語書面語及書面語輸出,完美保留港式英粵夾雜。
Musely廣東話轉文字是一款AI工具,採用Seed-ASR 2.0專屬粵語聲學模型,將廣東話錄音及影片轉換成準確的中文文字稿。不同於Google、HappyScribe和Notta等工具常將廣東話誤判為普通話,Musely將粵語視為獨立語言,設有專屬聲調辨識系統。工具提供口語書面語輸出(保留嘅、喺、咗、啦等語氣助詞)或書面語轉換,完美處理香港日常英粵夾雜嘅情況,並設有4種預設模式——清晰版、逐字版、書面語版及訪問版。每段錄音最長支援2小時,辨識準確率達94.1%。
引擎核心
🤖語音辨識引擎
逐字稿輸出
三步完成廣東話轉文字
上傳廣東話錄音或影片
拖放任何MP3、MP4、WAV、M4A、OGG、WebM或MOV檔案,最長支援2小時。Musely預設使用廣東話(yue-CN)模式以確保最佳準確率。支援手機錄音、Zoom及Teams會議錄影、WhatsApp語音訊息及專業錄音器材。
選擇書寫形式及預設模式
選擇口語書面語(保留嘅、喺、咗等語氣助詞)或書面語轉換。選取預設模式:清晰版、逐字版、書面語版或訪問版。按需開啟講者標籤及[MM:SS]時間戳記。
下載粵語逐字稿
檢閱逐字稿,英文字詞以原文保留。下載TXT、DOCX或Markdown格式,或直接複製到剪貼簿。可選翻譯成英文、普通話、葡萄牙文、日文或韓文,並支援雙語對照模式。
誰在用Musely廣東話轉文字
將中環金融會議的廣東話英語夾雜錄音轉成正式書面紀錄
我哋中環團隊開會全程講廣東話,term sheet、due diligence、IPO呢啲英文詞不停夾雜。Musely將英文字原樣保留,廣東話部分自動轉換成書面語,直接可以傳送俾內地counterparty。以前每星期嘅策略會議要花三個鐘整理,而家輕鬆多了。
將新聞發佈會轉錄成可直接發稿嘅文字
我負責採訪香港政治新聞。其他工具將廣東話錯識為普通話,字幕一塌糊塗。Musely嘅專屬粵語模型將語氣助詞同聲調辨識得相當準確。訪問預設自動加上訪問者/受訪者標籤,再翻譯成英文就可以發稿俾國際通訊社,整個流程壓縮至半小時以內。
逐字轉錄香港法庭聆訊以備案件存檔
香港法庭程序要求每一個語氣助詞都要準確記錄。逐字版預設完整保留嘅、喺、咗,並以[停頓]標注停頓位置。書面語轉換功能可生成平行版本,方便向內地律師提交跨境文件。原本每場聆訊要花六個鐘整理文字稿,現在不用九十分鐘就完成。
記錄口語廣東話作語言學分析
我研究香港廣東話社會語言學,田野錄音嘅逐字稿必須保留真實口語形式。Musely嘅口語書面語輸出完整保留嘅、囉、喎等語氣助詞,其他工具通常會直接略去。對田野錄音轉錄嚟講係一大突破。
為廣東話Podcast生成節目介紹及字幕
我主持一個香港科技Podcast,廣東話夾英文係日常。Musely輸出嘅節目介紹同聽眾講話嘅方式完全一致——嘅就係嘅,iPhone就係iPhone。後期製作由四個鐘縮短到大約四十五分鐘一集,好正。
記錄廣東話及葡萄牙語雙語會議程序
澳門政府會議需要同時備存廣東話紀錄及葡文譯本。Musely準確轉錄廣東話內容,再啟用雙語模式即可取得葡文對照版。兩小時上限足以涵蓋整個會期,書面語轉換功能亦方便向內地夥伴提交正式文件。
Musely對比其他廣東話轉文字工具
| 功能 | Musely | HappyScribe | Notta | |
|---|---|---|---|---|
| 專屬廣東話(yue-CN)聲學模型 | ✓ 準確率94.1%專屬粵語模型 | ⚠ 常預設為普通話zh-CN | ⚠ 有列出但準確率有限 | ✗ 未有專門支援 |
| 口語書面語輸出 | ✓ 支援(保留嘅喺咗等語氣助詞) | ✗ 不支援(僅書面語) | ✗ 不支援 | ✗ 不支援 |
| 書面語轉換 | ✓ 支援書面語轉換模式 | ✗ 不支援 | ✗ 不支援 | ✗ 不支援 |
| 英粵夾雜處理 | ✓ 英文字以原文保留 | ⚠ 部分支援 | ✗ 不支援 | ✗ 不支援 |
| 翻譯輸出 | ✓ 英文 / 普通話 / 葡文 / 日文 / 韓文 | ⚠ 語言有限 | ⚠ 需額外付費 | ⚠ 僅付費用戶 |
| 最長錄音時限 | ✓ 每段錄音最長2小時 | ⚠ 視乎方案而定 | ✗ 按分鐘計費 | ✗ 免費版僅3分鐘 |
廣東話用戶怎麼說
4.8/5,共2,380個評價
“我喺中環一間投資銀行做嘢。每週策略會議全程廣東話,夾雜大量英文金融術語。Musely將iPhone、IPO、term sheet原汁原味保留,廣東話部分自動轉成書面語,可以直接傳俾內地counterparty。每次會議幫我慳返三個鐘,真係正。”
“之前試過用Google同HappyScribe做廣東話採訪稿,兩個都將廣東話轉成一塌糊塗嘅普通話。Musely嘅專屬粵語模型係第一個真正識得辨認廣東話嘅工具,語氣助詞準確無誤。每篇稿嘅訪問準備時間由四個鐘縮短到半小時,差天共地。”
“我哋香港律師行每週都要整理法庭聆訊嘅文字稿。逐字版預設完整保留每一個廣東話語氣助詞,並為法庭記錄標注停頓位置。平行書面語輸出可直接傳送俾內地律師。整間律師行每週嘅轉錄工作慳返約十五個收費小時,成效顯著。”
常見問題解答
Musely廣東話轉文字以Seed-ASR 2.0專屬粵語聲學模型領先同類工具,清晰廣東話錄音準確率達94.1%。Musely將廣東話視為獨立語言而非普通話方言,同時提供口語書面語及書面語輸出,並完整保留港式英粵夾雜——這個組合在其他服務上找不到。
Musely使用專屬廣東話(yue-CN)聲學模型,而Google及HappyScribe處理中文錄音時往往預設普通話zh-CN,導致文字錯誤百出、語氣助詞全部丟失。Musely另提供廣東話專屬功能,包括口語書面語與書面語的選擇,以及香港式英粵夾雜的完整保留。
Musely嘅後處理系統能自動辨識香港廣東話中常見的英文字詞,將英文以原文保留,廣東話部分則輸出中文字。無論是專業術語、品牌名稱,還是日常夾雜的英文短語,輸出結果都與香港人書寫習慣完全一致,生成自然的中英混排逐字稿。
Musely接受MP3、MP4、WAV、M4A、OGG、WebM及MOV格式,每段錄音最長支援2小時。涵蓋手機錄音、Zoom及Teams會議錄影、WhatsApp語音訊息及專業錄音器材。可匯出TXT、DOCX及Markdown格式,適用於各種後續工作流程。
廣東話與普通話在聲調系統、詞彙、語法及語氣助詞方面均截然不同。用普通話模型辨識廣東話錄音,會出現大量錯誤——語氣助詞消失、用字不當、輸出一塌糊塗。Musely的專屬廣東話聲學模型針對粵語音系設計,準確率遠超使用普通話模型改裝的方案。
Musely的書面語預設模式可將口語廣東話轉換成正式書面語,適用於官方文件。嘅自動換成的,喺換成在,咗換成了,口語句式亦會重新整理。輸出文字符合正式中文規範,適合提交予內地業務夥伴或跨境文件存檔。
Musely提供輸出語言設定,可將廣東話逐字稿翻譯成英文、普通話、葡萄牙文、日文、韓文等語言。啟用雙語模式可同時顯示廣東話原文及譯文對照,非常適合跨境業務及澳門廣東話葡文雙語文件需求。
