アマノケイのまったり技術解説

合成音声系の技術的なことを中心に解説記事を書いていきます。

【2022/07/05更新】読み上げソフト・サービスをまとめてみた【29+2種類】

注意

読み上げソフトはめっちゃ多いので調べてないものもあります、無いものがあったらコメントでこっそり教えて下さい、こっそり追加します。

一応、利用についてや規約に関しては細心の注意を払っていますが、間違ってる場合もあるので各サービス利用する場合は規約を自分で読み、各自で判断して下さい。

※なにかしらトラブルがあったとしても、この記事を根拠にしないで下さい。

あと、各サービスのデモとしてウェブに体験版が置かれている場合も多いのですが、サービスによっては出力した音声の二次利用を禁止しているので、規約を読んで各自で判断して下さい。

 

Aquest Talk(ゆっくりボイス,Softalk)

 同人・商用利用:可能(要ライセンス)

 

株式会社アクエストが開発しているソフト

いわゆる「ゆっくり実況」などで使われる例の声

AquesTalk公式サイト

 

 AquesTalkの音声を利用した読み上げソフトSoftalk

f:id:crimsonbutterfly0zero0:20200209233213p:plain

こちらは非営利かつ個人の場合、無償利用が可能。

商用利用する場合は前述のライセンスを購入すること。

VOICEROID(ガイノイドTalk・ギャラ子Talk・音街ウナTalk Ex)

エンジンは株式会社エーアイが提供し、それぞれAHS, ガイノイド(よしもと), ヤマハ、インターネットが販売しているソフト

f:id:crimsonbutterfly0zero0:20200209233855p:plain

 

VOICEROIDには結月ゆかり、琴葉葵・茜、ガイノイドTalkには鳴花ヒメ・ミコト、VFlower(開発予定)、ギャラ子Talkにはギャラ子などのキャラクターがいる

www.ssw.co.jp

 

商用利用:

VOICEROIDは要ライセンス(詳細はこちら)

ガイノイド吉本興業に要問い合わせ(連絡先:contact@gynoid.co.jp)

ギャラ子はヤマハに要問い合わせ(問い合わせ窓口)

音街ウナはインターネットに要問い合わせ。(問い合わせ窓口)

※1 東北きりたん, 東北イタコ, ついなちゃんは「商業利用目的でのキャラの吹き替え」はできません。あるいはキャラクターが出ないナレーションのみ可能です。

※2同人利用の範囲なら別キャラの声あてはOKです

※3東北ずん子はいかなる理由であっても商用利用はできません

 

同人利用:

VOICEROIDは商用ライセンスの要否に準じて可能

ガイノイドガイノイドTalk利用規約に準じる

ギャラ子は(おそらく)「ギャラ子」名称およびイメージイラスト利用規約に準じる

音街ウナは音街ウナTalk Ex エンドユーザー使用許諾に準じる

CeVIO/CeVIO AI

株式会社テクノスピーチがエンジンを、ブイシンクがエディタを開発。

f:id:crimsonbutterfly0zero0:20200209232917p:plain

www.youtube.com

 

CeVIO Projectからさとうささら、すずきつづみ、タカハシ

 

/1st Place社からはIA, ONEが開発・発売されてる。

 

AHSからはCeVIO AI小春六花、弦巻マキ日本語・英語

1st Place社からはIA, ONEのアップデート版開発・発売されてる。

CeVIO AI ONE TALK -ARIA ON THE PLANETES-【ベクターPCショップ】

CeVIO AI IA TALK -ARIA ON THE PLANETES-【ベクターPCショップ】

 

商用利用:部分的に無許諾および申請で利用可能(詳細はこちらを参照)

(AHS音源の場合はこちら)

(1st Placeはこちらから)

同人利用:可能

A.I.VOICE

AITalk5エンジンを利用した株式会社エーアイの自社製品


現在、琴葉茜・葵

aivoice.jp

伊織弓鶴

aivoice.jp

アナウンス部

aivoice.jp

結月ゆかり・紲星あかり

aivoice.jp

レプリボイス:足立レイ

camp-fire.jp

丹下琴絵

greenfunding.jp

などの音源が販売・制作決定されています

 

商用利用:要ライセンス

同人利用:可能(※こちらを見て個別に判断してください)

 

 

※企業の場合、A.I.VOICE Bizにてキャラクターを含めたコラボ契約も可能。

Megpoid Talk(FineSpeech)

インターネットが開発したソフトウェア

GUMIの音声以外にも男声、女声の読み上げも存在。

加えてトークのイントネーションをVSQxで出力できる機能もある(が精度はやや難あり)

商用・同人利用:可能

Megpoid Talkの規約はこちらから

 

※1 法人・法人格・公的機関による利用の場合、非営利であっても利用料の支払いが必要

※2 社内利用の場合は利用料不要

利用料金はこちらから

 

 

ちなみにエンジンにはAnimoと呼ばれる会社が作ったFineSpeechを採用している

SHABERU

アキヒロ (@akihiro01051)氏の制作したOpen JTalkベースのソフト。

イントネーションなどの微調整は不可能だが、音響モデルの自作(音声データベース)が可能。

f:id:crimsonbutterfly0zero0:20200209232635p:plain

↓公式サイト

商用利用:ソフトウェア自体の商業利用は不可能。(詳細は本体付属のReadme参照)

同人利用:各音響モデル(キャラクター)の利用規約に準ずる。

 

唄詠

SHINTA(@shinta0806)氏の制作した、UTAU音源をゆっくり式に使用できるソフト。

商用利用:ライセンスにより不可だが、営利目的で使用したい場合は作者に事前相談をすることで対応可能な場合アリ。
それ以外の制約:各UTAU音源(キャラクター)の利用規約に準ずる。

AITalk

株式会社エーアイが開発している音声合成ソフト。いわばVOICEROIDの企業向け製品。

f:id:crimsonbutterfly0zero0:20200209234354p:plain

エーアイの公式サイトより引用

 

個人利用:恐らく不可(要問い合わせ)

※1 高額につき

※2 かんたん!AITalk®3及びAITalk® あなたの声®などを除く

 

かんたん!AITalk®3では、女声×4, 男声×1,関西弁女声×1, 関西弁男声×1が利用可能。

 

AITalk® あなたの声®では自分の声でAITalkの音源が制作可能(55万円)

※恐らく販売不可、感情表現に対応してるらしいが詳細不明

余談

・AITalkのいくつかの音源はVOICEROIDでも利用されており、以下の通りになっている

 

まき→民安ともえ(弦巻マキ)

すみれ→結月ゆかり

れいな→琴葉葵

たいち→水奈瀬コウ

あんず→月読アイ

こうたろう→月読ショウタ

 

VOICEVOX

ヒホ(@hiho_karuta)氏の制作したAI系読み上げソフト、イントネーション等の微調整が可能なのが特徴。ずんだもんや春日部つむぎ、男声数人が実装されいてる。

商用利用:「VOICEVOX:○○」を記載、明示、アナウンスすれば無料(一部キャラにて例外あり)

音源作成:VOICEVOXキャラクター付き音源企画提出フォーム

(常設)と、VOICEVOX Nemo(キャラクター無し音声、恐らく不定期)がある。

 

COEIROINK

オープンソースになっているVOICEVOXのUI部分を用いてシロワニさん(@shirowanisan)氏が制作したAI系読み上げソフト。つくよみちゃんなどの女声数名と、男声が1種類(おふとんP)実装。

公式サイトにて公式キャラの立ち絵が生成できたり、具体的な規約があったりかなりユニーク。

商用利用:可能(詳細は各音源の規約を参照)

音源作成:MYCOEIROINKにて自作可能。

 

エステーション/コエアバター

東芝が開発したディープラーニングベースのアプリ(一般ユーザー向けではiOS限定)

アプリ版では読み上げた文章を基に学習し、自分と似た声を合成できるようにできる

エディタ版では様々な声から読み上げを製作可能。感情の割合をブレンド可能。

VOCALOIDで歌声ライブラリが制作された「蒼姫ラピス」が発売。

f:id:crimsonbutterfly0zero0:20200210011652j:plain

www.youtube.com

個人利用:コエアバター販売に伴い個人利用も可能(要問い合わせ)

商用利用:要問い合わせ(月額3万)

エステアプリの同人利用:不可(利用規約の禁止事項[13-23]にて「複製・録音」が禁止されている」)

※コエステアプリで生成した音声を画面録画・録音してYoutube, ニコニコ動画TwitterなどのSNSサービスや共有サービスにアップロードすることは禁止されています

デジタルボイス・プレミアム

前述のコエステの個人向け有償版

エステーションエディタに加え、スマホアプリに制作した高品質データを提供。

f:id:crimsonbutterfly0zero0:20200908221558p:plain

東芝ホームページより引用

制作費用:50万円

※収録は都内近郊の(エイベックス)収録スタジオで行うらしいので、都内在住でない方は恐らくこれ以外にも交通費・宿泊費が別途必要です。

個人利用:恐らく可能(要問合せ)

商用利用:不明(要問合せ)

 

VoicePeak

Dreamtonicsが開発したソフトウェア。

現時点で男女各3種類の音源+女児1つの計7種類の声が存在。感情の割合をブレンド可能。

商用利用:可能

 

Amazon Poly

アマゾンが開発しているディープラーニングベースの読み上げソフト

日本語男女、英語男女、中国語女声、韓国語女声など計8言語使用可能

様々なスピーチスタイルを適応可能、カスタム音源も製作可能。

aws.amazon.com


Amazon Polly のご紹介 | AWS (日本語字幕) (2:08)

商用利用:可能

価格:初年度は無料枠が存在

通常版………月/500万文字無料、超過した場合100万文字/約400円

Wavenet版…月/100万文字無料、超過した場合100万文字/約1,600円

Google翻訳

言わずとも知られたアレ

ページ上には特に利用規約がないので利用に関しては不明です。

f:id:crimsonbutterfly0zero0:20200210013433p:plain

余談

昔はGoogleの読み上げは後述のVoiceTextのSayakaが長らく使われていましたが、近年になってGoogle独自の音声合成(後述のGoogleクラウド TTSの低品質版)が使用されるようになった経緯があります

ボイスソムリエ

日立が開発したコーパスベースのソフト

www.youtube.com

www.hitachi-solutions-create.co.jp

f:id:crimsonbutterfly0zero0:20200210153702j:plain

日立の公式サイトより引用

 

個人利用:恐らく不可

※1 高額につき

※2 学生の場合、大学の生協経由でアカデミック版の購入が可能

商用利用:要ライセンス

同人利用:(購入できることが前提だが)要ライセンス

 

Readspeaker(VoiceText, NeoSpeech)

HOYAが開発したコーパスベース、ディープラーニング併用のソフト

読み上げのみならず、歌声などの声質変換なども手掛ける

2017年に合併したオランダのReadSpeakerと合併し、2020年に名称を改めるとのこと

f:id:crimsonbutterfly0zero0:20200210154557p:plain

個人利用:恐らく不可(要問い合わせ)

商用利用:要問い合わせ

※このサイトのデモンストレーション音声を出力して二次使用するのは禁止されています。過去にもいろいろな理由でこのデモが非公開になったこともあるので注意してお使いください。

余談

ハローキティ音声合成はVoiceTextで作られています

 

CoeFont STUDIO/CLOUD

東工大発のベンチャー企業「yellston」が開発している読み上げサービス

f:id:crimsonbutterfly0zero0:20210720001041j:plain

商用利用:可能

単価:1文字当たり0.05~0.5円(100万文字で5~50万円)

 

月額

Lite:500円~

Business:3万円~

Enterprise:要問合せ

追加料金:10円で1000ポイント(最低金額100円)

 

カスタムボイスの作成:

ベーシック……500円(収録時間15分)

ミドルレンジ……1000円(収録時間1時間)

ハイエンド……1500円(収録時間2時間)

 

利用規約

TALQu

UTAU系&新人AI系VTuberの「Haruqa」によって開発されたAI系読み上げソフト

f:id:crimsonbutterfly0zero0:20210720002302p:plain

www.youtube.com

商用利用:それぞれ音声モデルの規約による

音源制作:可能(※1, ※2)

※1「Haruqaポイント」と呼ばれる「Haruqaに関係する創作」を一定の条件を満たして制作した場合に獲得できるポイントを対価に製作可能。

※2自作でタコトロン2モデルを制作する、Haruqaさんの配布しているColab用ノートブックを利用しての自作も可能

Voiceful

VOCALOIDMaikaなどを開発したVoctro Labsの読み上げ・歌声合成・声質変換……etcのソフト。ディープラーニングベース。


Voiceful demo - "Make a celebrity talk or sing"

音声合成、歌声合成サービスの提供以外にも、Unityのアプリやゲーム向けに音声合成エンジンを組み込めるVoiceful Charactorsも販売

f:id:crimsonbutterfly0zero0:20200210160242p:plain

 

それ以外にもウェブのデモにて、声質変換、音声合成(発話・歌声)、音声ファイルのピッチ変更・時間伸縮などが可能。

f:id:crimsonbutterfly0zero0:20200210161244p:plain

ウェブ版のデモ利用:不明(規約が見当たらないので要問い合わせ?)

個人利用:Voiceful Charactorに関しては可能、それ以外のサービスは不明(要問い合わせ)

商用利用:Voiceful Charactorに関しては可能、その他不明(要問い合わせ)

Voicerful Charactorsのカスタム音源制作:要問い合わせ

 

スマホ標準読み上げ機能

iPhoneの場合はSiri, Androidの場合はGoogleの読み上げや各社の読み上げアプリが利用可能な場合がある。

利用規約は各機種の契約書、OSの仕様書などを各自読んで下さい

Windows標準 読み上げ機能

いわゆるナレーター機能(棒読みちゃんなどでも利用可能)

f:id:crimsonbutterfly0zero0:20200210163931p:plain

商用利用:不明

(こちらのブログ記事が参考になるかも知れませんが各自で判断して下さい)

Mac標準の読み上げ機能(VoiceOver)

f:id:crimsonbutterfly0zero0:20200210164111p:plain

商用利用:不可(ソフトウェアライセンス契約によって禁止)

Googleクラウド TTS

ディープラーニング(WaveNet)ベースの読み上げサービス

Google翻訳読み上げの超上位版

180言語・男・女声の読み上げが利用可能

商用利用:可能

個人利用:可能

価格:

通常版………月/500万文字無料、超過した場合100万文字/約400円

Wavenet版…月/100万文字無料、超過した場合100万文字/約1,600円

Clova Voice

韓国のNAVERが開発したディープラーニングベースの読み上げサービス

 

商用利用……要問い合わせ

同人利用……可(個人コンテンツ制作目的である限り無料で利用可能)

詳細や細かい利用規約はこちらから↓

IBM Watson TTS

IBMが開発したディープラーニングベースの読み上げサービス


 

商用利用:可能

個人利用:可能

価格:

ライト版(無料アカウント)……月/1万文字

標準版…1000文字ごとに約2円(2.24円)

プレミア版:要問い合わせ

Microsoft Azure TTS

マイクロソフトが開発したディープラーニングベースの読み上げサービス

 

Microsoft Azure Text to Speech

商用利用:可能

個人利用:可能

カスタマイズ音源:製作可能

価格:やや複雑なので公式サイトを参照

 

NTT FutureVoice Crayon

NTTが開発したディープラーニングベースの読み上げサービス

f:id:crimsonbutterfly0zero0:20200210170712j:plain

個人利用:恐らく不可(要問い合わせ)

 

iSpeech

iSpeech社が開発したコーパスベースの読み上げサービス

f:id:crimsonbutterfly0zero0:20200210171052p:plain


N2

KDDIが開発した機械学習ベースの読み上げサービス

Android限定で読み上げアプリとしても配信されている

商用利用:不可(利用規約による)

同人利用:不可(利用規約による)

Acapella Group

Acapella Groupが開発したディープラーニングベースの読み上げサービス

https://www.acapela-group.com/demos/

f:id:crimsonbutterfly0zero0:20200210172254p:plain

利用について:デモが違法、有害、脅迫的、虐待的、嫌がらせ、不法、中傷的、低俗、わいせつ、わいせつ、他人のプライバシーの侵害、憎悪的、人種的、民族的、その他好ましくないコンテンツへの利用は禁止、あとはこちらを読んで各自判断して下さい。

 

おまけ

MUTA

厦门优他动漫科技有限公司が開発した歌声・発話合成ソフト

現状で、トーク機能に対応してるのは中国語音源(というより中国語音源しか無い)

f:id:crimsonbutterfly0zero0:20200210002956p:plain

Alter/Ego(ChipSpeech)

PLOGUEが開発した歌声・発話合成ソフト

スピーチに対応してるのは英語音源のBONESのみ

BONES自体は日本語歌唱に対応、あとはフランスのVOXWAVE製音源のALYSが対応

 

感想

VOICEROIDのみならず、企業向けのTTSソフトでも

 

大手からTTSのベースを提供してもらう

自社製品に組み込む

一般ユーザーから金を取る

 

みたいなビジネスって結構あるのね……有名でないだけで。