musely
同意ゲート付きAIボイスジェネレーター

Voice Cloner:30秒のサンプルからAIボイスを生み出す

使用について明示的な書面の許可を得た声を、10〜30秒の音声または動画サンプルからクローンできます。35言語超、再利用可能なボイスライブラリ、約30秒で完成。公人の声は同意ゲートでブロックされます。

1

音声サンプルを追加

MP3、M4A または WAV · 10 秒〜5 分 · 最大 20MB

音声をアップロード

MP3、M4A または WAV · 10 秒〜5 分 · 最大 20MB

より良い結果のために:一人がはっきりと自然に話してください。BGMや雑音は入れないようにしましょう。

詳細設定(オプション)

2

音声に名前をつける

無断で声をクローンされた?報告する

クローンされた声

クローン音声のプレビューがここに表示されます

最終更新 2026年6月
35+対応言語
~30s平均クローン時間
10-30sサンプル長
9,234ユーザーレビュー
Musely Voice Clonerとは?

Musely Voice Clonerは、同意を得た短いサンプル(10〜30秒のクリアな音声または動画)を、新しいテキスト読み上げ用に再利用できる音声モデルへ変換するAIボイスジェネレーターです。ボイスチェンジャー的なお試しツールや単発のTTSサイトとは異なり、Muselyは命名・タグ付けが可能で、英語、スペイン語、フランス語、ドイツ語、日本語、韓国語、北京語、広東語を含む35言語超でMuselyツール全体に渡って再利用できるモデルを構築します。アップロードはすべて同意ゲートを通過し、著名な公人の声はデニーリストによってモデルレベルでブロックされます。クローンできるのは使用について明示的な書面の許可を得た声のみで、たとえばご自身の声や、所有者から同意を得ている声に限られます。音声サンプルと生成音声はMuselyプライバシーポリシーに基づきMuselyのクラウドサーバー上で処理されます。

仕様

Musely Voice Clonerの技術情報

🤖入力とクローン処理

AIモデル短いサンプルでも再現性が高くなるよう調整されたMuselyのボイスクローンモデル
サンプル長クリアな音声で10〜30秒を推奨
音声入力MP3、WAV、M4A、FLAC(サンプルあたり最大25MB)
動画入力MP4、MOV、WebM(音声トラックを自動抽出)

出力とライブラリ

対応言語英語、スペイン語、フランス語、ドイツ語、日本語、韓国語、北京語、広東語、ポルトガル語、イタリア語など35言語超
平均クローン時間アップロードから最初の生成ラインまで約30秒
ボイスライブラリクローンボイスを命名・タグ付けして再利用。Muselyアカウントに紐づきます
同意管理アップロードごとの同意ゲート、モデルレベルでの公人デニーリスト、不正報告窓口
使い方

3ステップで声をクローン

1

同意を得た音声サンプルをアップロード

クローンする許可を明示的な書面で得ている声の10〜30秒の音声ファイル(MP3、WAV、M4A、FLAC)または動画ファイル(MP4、MOV、WebM)をアップロードします。背景ノイズが少なく、BGMが入っていないクリアな録音を心掛けてください。

2

同意ゲートを通過

声がご自身のものであるか、所有者から書面の許可を得ていることを同意ゲートで確認します。Muselyのデニーリストは、クローン開始前のモデルレベルで、著名な公人(政治家、著名人、経営者)のサンプルを拒否します。

3

生成・保存・再利用

Muselyが約30秒で音声モデルを構築し、名前とタグを付けてパーソナルボイスライブラリに保存。35言語超で新しいTTS音声を生成できます。サンプルを再アップロードせずに、ナレーション、吹き替え、その他のMuselyツールでクローンを再利用可能です。

ユースケース

Musely Voice Clonerを使っているのは

独立系ポッドキャスター

自分の声をクローンして差し替えに活用

20秒のサンプルから自分の声をクローンし、ポストで言い損ねを見つけたときの差し替え用に使っています。クローンしたナレーションがライブ収録の隣に並んでも違和感がなく、2秒程度の修正のためにスタジオを予約する必要もありません。1エピソードあたり約1時間の短縮になっています。

オーディオブックナレーター(セルフパブリッシング)

ひとつの声で多言語リリース

英語のオーディオブックをライブで録音した後、自分の声をクローンして同じモデルからスペイン語、フランス語、日本語版を生成します。発音を学ばなくても4言語すべてで自分の声を届けられ、公開前には必ず最終QCを行っています。

語学教師(K-12)

リスニング演習のための一貫した声

自分の声をクローンして対象言語でリスニング演習を生成し、生徒がカリキュラム全体で一貫した声に触れられるようにしています。再録音せずに新しい語彙を毎週更新でき、クローンボイスは私自身の声に聞こえるので、クラスの雰囲気を損なうこともありません。

ソロYouTuber

Bロールナレーションをスピードアップ

チャンネルの台本が午前2時に上がってきても、マイクをセットし直したくありません。古いエピソードから自分の声をクローンしてBロールナレーションを生成し、仮トラックとして使うと、そのまま最終版に残ることもよくあります。動画1本あたりの制作時間を数時間短縮できています。

ナレーションアーティスト(フリーランス)

再予約なしでクライアントの差し替えに対応

セッション納品後、収録のクリップから自分の声をクローンしてライブラリに残しておき、クライアントが1行だけ修正したいときに差し替えを生成できるようにしています。事前に必ずクライアントへ伝え、ごく小さな修正にのみ使い、フルセッションには使いません。

コンテンツマーケティングマネージャー

創業者の声でローカライズした解説動画を制作

創業者から書面で同意を得たうえで彼女の声をクローンし、6言語でローカライズされた解説動画のナレーションを生成しています。以前は誰も知らないストックボイスをライセンスしていましたが、いまは市場をまたいで同じ人物の声に聞こえ、同意書もきちんと保管しています。

比較

Musely Voice Cloner vs. 他のボイスクローンツール

機能MuselyElevenLabsMurfSpeechify
対応言語のカバレッジ✓ アジア言語(日本語、韓国語、北京語、広東語)に強い35言語超✓ 英語の再現性に非常に強い30言語超⚠ エンタープライズ向けナレーションを中心とした20言語超⚠ 読書とアクセシビリティに特化した20言語超
必要なサンプル長✓ クリアな音声サンプル10〜30秒⚠ インスタントクローンは約1分から、プロフェッショナルクローンは30分超必要⚠ カスタムボイスは通常10分以上必要⚠ クローン機能はStudio層で数分のサンプルが必要
動画入力対応✓ MP4、MOV、WebMに対応し音声を自動抽出✗ 音声入力のみ。音声は自身で抽出が必要✗ 音声入力のみ✗ 音声入力のみ
ツールエコシステムとの統合✓ クローンボイスはアプリ内ドロワーからMuselyの各ツール(ナレーション、吹き替え、レッスン)で再利用可能✓ ElevenLabs StudioおよびAPI内で再利用可能✓ Murf Studio内で再利用可能✓ Speechify Studioおよびリーダーアプリ内で再利用可能
同意ゲートと公人デニーリスト✓ アップロードごとの同意ゲートと、モデルレベルで適用される公人デニーリスト✓ 同意ステートメントとボイスCAPTCHA検証⚠ アップロード時の同意ステートメント⚠ アップロード時の同意ステートメント
料金✓ 充実した無料枠あり。大量利用にはCreatorプラン(月額19.9ドル〜)✓ 無料枠あり、Creatorは月額5ドル〜、Proは月額22ドル〜⚠ 無料枠あり、Creatorは月額19ドル〜、Businessは月額66ドル〜⚠ 無料枠あり、Premiumは月額11.58ドル〜、Studioはさらに高額
ボイスライブラリとタグ付け✓ クローンを命名・タグ付けして再利用可能。Muselyアカウントに紐づく✓ カテゴリ付きの名前付きボイスライブラリ✓ Murfワークスペース内の名前付きボイスライブラリ✓ Speechify Studio内の名前付きボイスライブラリ
機能比較は、2026年6月時点で公開されている各ツールの機能情報に基づきます
レビュー

クリエイターが語るMusely Voice Cloner

9,234件のレビューで4.7/5

★★★★★

20秒のサンプルから自分の声をクローンし、差し替えやBロールナレーションに使っています。クローンの精度が高くリスナーに置き換えを気付かれることがなく、同意ゲートのおかげで不正利用の心配もありません。エピソードごとに約1時間の再録音が削減できています。

PC
独立系ポッドキャスター
独立系クリエイター
★★★★★

今回のプロジェクトでElevenLabsではなくMuselyを選んだ決め手は、アジア言語のカバレッジでした。自分の声をクローンして同じ章の日本語、韓国語、北京語版を生成しても、リズムがしっかり保たれていました。それでも章ごとにQCはしていますが、初稿として十分に使えます。

AN
オーディオブックナレーター(セルフパブリッシング)
独立系クリエイター
★★★★☆

創業者の声をクローンし(書面の同意を保管しています)、6つの市場向けにローカライズされた解説動画のナレーションを生成しています。ボイスライブラリのおかげでキャンペーンごとに同じモデルを再利用しやすく、公人デニーリストはオンボーディング時に法務を安心させてくれました。

CM
コンテンツマーケティングマネージャー
小規模代理店のオーナー
FAQ

Musely Voice Clonerに関するよくある質問

ボイスクローンとは、短い音声サンプルでAIモデルを学習させ、その声で新しいテキストを読み上げられるようにする処理です。Musely Voice Clonerは10〜30秒のクリアなサンプルがあれば、約30秒で再利用可能な音声モデルを構築し、クローンボイスから35言語超で新しいテキスト読み上げを生成できます。クローンはパーソナルボイスライブラリに保存され、Muselyの各ツールで再利用できます。

クローンする許可を明示的な書面で得ている声の10〜30秒の音声または動画サンプルをアップロードし、ゲートで同意を確認すると、Muselyがクラウドサーバー上でサンプルを処理し、約30秒で音声モデルを構築します。音声入力はMP3、WAV、M4A、FLAC、動画入力はMP4、MOV、WebMに対応し、音声トラックは自動抽出されます。クローンはパーソナルボイスライブラリに保存され、35言語超で新しいTTSを生成できます。

はい。クローンできるのは使用について明示的な書面の許可を得ている声のみで、たとえばご自身の声や、所有者から同意を得ている声に限られます。すべてのアップロードはクローン開始前に同意ゲートを通過し、Muselyの利用規約により話者の許可に関する書類を保管することが求められます。不正利用の疑いがあればMuselyの不正報告窓口までご連絡ください。

いいえ。Musely Voice Cloneは、著名な公人(政治家、著名人、経営者)の声をデニーリストによってモデルレベルでブロックしています。認識された公人の声のサンプルをアップロードしようとすると、同意ゲートの段階で拒否されます。不正利用を見つけた場合はMuselyの不正報告窓口までご連絡ください。

Muselyは英語、スペイン語、フランス語、ドイツ語、イタリア語、ポルトガル語、日本語、韓国語、北京語、広東語などアジア言語のカバレッジに強い35言語超に対応しています。受け付ける音声入力はMP3、WAV、M4A、FLAC(サンプルあたり最大25MB)、動画入力はMP4、MOV、WebMで、音声トラックは自動抽出されます。10〜30秒のクリアなサンプルが最良のクローンを生成します。

音声サンプルと生成音声はMuselyプライバシーポリシーに基づきMuselyのクラウドサーバー上で処理されます。ボイスクローンはMuselyアカウントに紐づき、共有しない限りご自身だけがアクセスできます。MuselyはHIPAA、SOC 2、エンドツーエンド暗号化を主張していません。機微な録音をアップロードする前に、プライバシーポリシーとご自身のコンプライアンス要件をご確認ください。

Muselyは充実した無料枠を用意しており、声のクローンと短いTTSクリップの生成を試せます。大量利用には月額19.9ドルからのCreatorプランがあり、より長い生成、ライブラリに保存できるクローン数の増加、優先処理が利用できます。すべての階層にフェアユースポリシーが適用されます。