アマノケイのまったり技術解説

合成音声系の技術的なことを中心に解説記事を書いていきます。

AITalkも歌声合成に参戦!?「A.I. VOICE」が歌声合成事業展開へ!

まずはこちらからご覧くださいませ……。

エーアイ、個人向けオリジナルブランド製品「A.I.VOICE™」による歌声合成ソフト・外国語音声合成ソフトを2021年12月リリース予定 株式会社AI(エーアイ)

高品質音声合成エンジンAITalkⓇを開発・提供する株式会社エーアイ(本社:東京都文京区、代表取締役社長:吉田 大介、証券コード:4388、以下:エーアイ)は、個人向けエーアイオリジナルブランド「A.I.VOICE™(エーアイボイス)」において、歌声を作成できる歌声合成ソフト及び、英語・中国語音声が作成できる外国語音声合成ソフトを2021年12月に販売開始(予定)することを決定いたしましたのでお知らせいたします。

何ですとぉ!??!?!?完っ全にダークホースじゃないですか!?!?!?

 

というわけで、AITalkエンジンの歌声合成ソフトウェアがリリースされる模様です。

※2021末なので、あくまで1年くらい待つ必要あると思いますけど

 

それに加え、英語のTTS音源も同時期にリリースされるようです。

となると……東北ずん子Englishのボイスロイドは、本当にボイスロイドで制作されるのかそれとも、A.I. VOICE製品になるのか気になってきます。

(現状ではまだ制作できないと思いますが↓)

 

加えてこれはあくまで推測ですが、TTS(テキスト-トゥー-スピーチ)が英語・中国語でも利用できるということは言語のシステムが整備されているということなので、「歌声合成でも利用できる可能性が高い」のではないかな……と思っています。

 

ディープラーニング系で日本語・英語・中国語の歌声が合成できるということは、CeVIO AI, ProとSynthV AIの競合相手になりそうです。

 

あと、これは伏線回収と言って良いのか分かりませんが………実のところ、エーアイさんは結構歌うボイスロイドに造詣が深かったりします。

 

追記

どうやら発売が来年の12月で、発表自体は来年の2月らしいです

f:id:crimsonbutterfly0zero0:20201109171718p:image

まさかの新規AI歌声合成ソフト!?「Synthesizer V AI」が発表!

それはbilibiliの公式Dreamtonic社のアカウントに投稿された、とある告知から始まりました……。

f:id:crimsonbutterfly0zero0:20201028224347p:plain

訳:Synthesizer V Studio AIアップデート。

詳細は近日中に公開されます。ご期待ください!

ん?

f:id:crimsonbutterfly0zero0:20201028224407j:plain

ん???!?!?!?!?

 

ぬぁんだってぇ~!?

 

……というわけで、中国でSynthV AIがフライング発表されました。

 

ということは、次のAHS生放送はもしかして……!

だといいなぁ………。

それはそうとやっぱり商業男声AIシンガー欲しいなぁ……誰か作ってくれないかなぁ……。

追記1

ビリビリの投稿が削除され、公式サイトでも「10/23日に告知されたこと」になっていました

AI Updates for Synthesizer V Studio | Dreamtonics株式会社

追記2

追記その2

①ビリビリ動画の告知が消える

②DT社のホームページに告知が来る

③DT社の告知が消える

④私のサイトだけが残る←イマココ

な ぜ 消 し た し

追記3

 

 

AIシンガー「夏目悠李」の使い方(with Gdrive)

ついにユーザーが自作可能なAI(諸説あるらしい)歌声合成が出てきました

その名もNNSVS!(過去にも取り扱ったことはあるので、詳細はこちらからどうぞ)

※ちなみにNNSVSは「Neural Network-based Singing Voice Synthesis/ニューラルネットワーク基盤の歌声合成」の略です

デモ動画↓

夏目悠李の詳細はこちらから↓

というわけで、今回はNNSVSを用いて夏目悠李を歌わせる方法をさっくり解説していきたいと思います。

 

必要なもの

Googleのアカウント(Gdriveが必要なため)

TwitterFacebookGitHubのアカウント(歌声DBのダウンロードに必要)

Gdriveの空き容量(少なくとも6~7GBは欲しい)

手順

①まず、Tarou ShiraniさんのGitHubから必要なデータをダウンロードします。

nnsvs_test_natsume_singing_official_recipe · GitHub

この右上の「Download ZIP」をクリックして解答した後、中身の「nnsvs_test_natsume_singing_official_recipe.ipynb」のGoogle Driveにアップロードします。

f:id:crimsonbutterfly0zero0:20201011134401j:plain

②こちらの記事を確認し、利用規約に同意したのであれば夏目悠李歌声DBをBowlRollからダウンロードします。

ダウンロードが完了したら、zipファイルを解凍しないでGDriveにアップロードします。

 

③GdriveでGoogle Colaboratoryが使用できるように設定します

 

「マイドライブ→その他→アプリを追加」をクリックします

f:id:crimsonbutterfly0zero0:20201011135109j:plain

出てきたウィンドウの検索欄に「Colaboratory」と入力して、赤丸のボタンをクリックして導入します。

f:id:crimsonbutterfly0zero0:20201011140204j:plain

Google DriveからColaboratotyを起動します

導入が完了したのであれば、恐らく先程アップロードした「nnsvs_test_natsume_singing_2.ipynb」にこのようなアイコンになっていることが分かると思いますので、こちらをダブルクリックします。

f:id:crimsonbutterfly0zero0:20201011140536j:plain

 

⑤Colaboratotyの設定を変更します

なんか物凄く怖そうな画面が出ましたが落ち着いて下さい。

私もこういうの無理でしたが手順は至って簡単です。

 

まず「編集→ノートブックの設定」をクリックします。

f:id:crimsonbutterfly0zero0:20201011140902j:plain

 

ノートブックの設定から「ハードウェア アクセラレータ」をGPUに変更し、「保存」をクリックします

f:id:crimsonbutterfly0zero0:20201011141009j:plain

 

⑥レシピを実行します。

こういうボタンみたいなやつを上から順番にポチポチ押していきます。

f:id:crimsonbutterfly0zero0:20201011141303j:plain

 

とりあえず、「ステージ 5-6 (歌声合成) の実行」までポチポチしていきましょう。

もしめんどくさいなら

左の目次から「ステージ 5-6 (歌声合成) の実行」をクリック

上部上部ツールバーの「ランタイム→より前のセルを実行」をクリック

「ステージ 5-6 (歌声合成) の実行」のセルのボタンをクリックするのでもいいです。

(むしろこっちの方が押し忘れがないので安全です)

 

※「注意 この処理は非常に重くColaboratoryの接続が切れる場合があるようです. 画面左端の[ファイル]からファイルをダウンロードしてローカルで視聴することをお勧めします。」

と書かれているやつは実行しないで下さい

 

⑦Gdriveの接続

左の目次から「Google Driveのマウント」をクリックします。

(左が目次じゃない場合は左端の4つ並んだアイコンの内、虫めがねの上のアイコン「:≡」みたいなのを選んで下さい)

 

しばらくするとセルの中にこんな感じでURLと入力欄が表示されるので、リンクをクリックします。

f:id:crimsonbutterfly0zero0:20201011142000j:plain

 

こういう画面が表示されますので、現在自分が使用しているGDriveのアカウントを選択します。各種権限の許可もします。

f:id:crimsonbutterfly0zero0:20201011142209j:plain

そうするとコードが表示されるので、右のコピーボタンをクリックしてコピーしておきます。

f:id:crimsonbutterfly0zero0:20201011142341j:plain

その後、「Enter your authorization code:」と書かれた欄にCtrl+Vで先程のコードを入力し、エンターキーで確定をします。

f:id:crimsonbutterfly0zero0:20201011142441j:plain



⑧ひたすら待ちます

他の作業、スマホゲーの周回、動画視聴、TwitterのTL巡回にうってつけです。

ただ、放置しすぎるとColaboratoryの有効期限が切れるので定期的に見てください。

(※1. なんかエラーっぽいのが出たら「再接続」を押すことを推奨します)

(※2. zipの方の歌声DBはもう削除して大丈夫です)

 

⑨好きな楽譜で歌声合成

Gdriveに適当なフォルダを新規で作成します。

(とりあえず、ここでは分かりやすく「sample」にしておきます)

フォルダの中にmusicxmlあるいはxmlファイルと「song_list.txt」を入れます。

f:id:crimsonbutterfly0zero0:20201011143701j:plain

song_list.txtの中身は「musicxmlの拡張子を除いた名前」を1行ずつ入力したものです。適当にテキストエディタやメモ帳から作成しておkです。

 

例:「sakura.xml」「test.xml」を合成する場合のsong_list.txtの中身

sakura

test

 

そうしたら、「学習したモデルから任意の歌声を合成する」の中身を若干書き換えます。

「sample_dir=○○」の「gdrive/……」以降の文字を先程のフォルダの名前に変更します。

f:id:crimsonbutterfly0zero0:20201011143346j:plain

 

できたら一番最後のセル以外のボタンを押していきます。

 

⑩ちょっと待ちます

そこまでは時間かかりません。

 

⑪歌声wavをダウンロードします

レシピのやつを実行してしまうと物凄く重くなって失敗することもあるので、直接ダウンロードします。

1番左の4つに並んだアイコンの内、一番下のフォルダの形をしたボタンをクリックし

「nnsvs→egs→nnsvs_natsume_singing→00-svs-world→exp→natsumeyuuri→synthesis→(先程のフォルダ名)」から、好みのwavファイルを選択し、項目右端の「:」みたいなボタンを押してダウンロードをクリックします。

f:id:crimsonbutterfly0zero0:20201011193401j:plain

 

⑫ピッチ補正及びMix

なお、夏目悠李の声は結構ピッチがガタガタしているのでピッチ補正が必須です。

頑張って下さい!

※ピッチ補正にはVocalShifterをおすすめします。

 

注意

警告: GPU ランタイムに接続していますが、GPU は使用されていません。

こう表示されることがありますが、「標準ランタイムに切り替え」は押してはいけません。

スペシャルサンクス

レシピを制作したTarou Shirani様

使い方や各種サポートをしてくださったくれいじー様

 

夏目悠李の出力音声に関する利用規約

夏目悠李の出力音声に関する利用規約

本規約は、アマノケイ(以下「甲」という)が制作した「夏目悠李/男声歌声データベース」(以下「歌声DB」という)を用いて制作された「夏目悠李の出力音声」(以下、「出力音声」という)を利用者(以下「乙」という)が利用する際の規約について定めるものです。
なお、本規約は同じく次項で定義する「キャラクター夏目悠李」の使用に関して定めるものではありません。
「キャラクター夏目悠李」の使用については、キャラクター「夏目悠李」を使用する際のガイドラインにて定めています。

・規約の変更

甲は本規約の内容を変更できるものとします。

変更した規約は、甲がWebサイト等で告知を行い、乙が出力音声の利用を続行した時点で有効になるものとします。

規約変更以前に発表された作品の内、規約を変更することで規約違反になる作品については原則として不遡及となります。

・定義

「キャラクター夏目悠李」とは、その名称「夏目悠李」と「UNF/UserNotFound」がデザイン原案を作成した絵画の著作物とによって、その外観等の特徴を表現されている抽象的概念をいいます。
「音声提供者」とは、本データベースを構成する歌唱データファイル(wav形式)を提供した「霧野蒼太」のことをいいます。
「歌声DB」とは、音声提供者が提供した歌唱データファイル(wav形式)と甲が作成及び整備したMIDIファイル、MusicXMLファイル、ラベルファイルなど、配布物に含まれる一部または全部(修正、追加などを含む)をいいます。

「成果物」とは、本データベースを用いて生成した音響モデルやピッチモデルなど、本データベースそのものを含まないデータのことをいいます。
「出力音声」とは、成果物から生成されたあらゆるオーディオ出力をいいます。

「利用者」とは、出力音声を利用する者をいいます。 
「デザイナー」とは、歌声DBに関連して制作された「キャラクター夏目悠李」をデザインした「UNF/UserNotFound」のことをいいます。

・保証の否認及び免責

(1)甲は、出力音声が乙の特定の目的に適合すること、期待する機能・正確性・有用性を有すること、及び不具合が生じないことについて、何ら保証するものではありません。

(2)乙が出力音声を利用したことに起因する直接的又は間接的な損害に関し、甲及び音声提供者は一切責任を負わないものとします。

(3)出力音声の利用によるデータの消失または機器の故障もしくは損傷、その他出力音声に関して乙が被った損害について、甲及び音声提供者はこれを賠償する責任を一切負わないものとします。

(4)出力音声に関連して乙と第三者との間において生じた取引、連絡、紛争等については、甲・音声提供者及びデザイナーは一切責任を負わないものとします。

・利用許諾

甲は乙が本規約を遵守することで出力音声の利用を許可するものとします。
同意していただけない場合、出力音声の使用はできません。


(1)法人・個人・同人サークルを問わず、非商用の活動の範囲内であれば乙は出力音声を無償で使用することができるものとします。

(2)乙が個人・同人サークルであり、CD制作費や会場代などのコストが必要なコンテンツを制作する場合は、実費程度の回収であれば無償での利用の範囲内とみなします。

(3)乙が法人の場合、出力音声を使用したコンテンツに対して「歌声データベース制作:アマノケイ 音声提供者:霧野蒼太」を明示的にクレジットするものとします。

上記を遵守した上、出力音声を使用して制作された作品の発表をする場合は甲および音声提供者への事前事後の連絡は不要です。

なお、歌声DBを含まない、利用者や第三者が出力音声を単体で利用できる成果物に本規約を同梱する場合、この規約と同梱された規約の内容に差異があるときは同梱された規約を優先するものとします。

 

・使用許諾が必要な場合

乙が出力音声を商用利用、または出力音声を上記の使用許諾の範囲を超えて利用する場合は事前に別途の使用許諾が必要となります。
その場合、下記の連絡先のいずれかにお問い合わせください。

・禁止事項

出力音声の使用にあたり、以下の行為は禁止されています。

(1)犯罪の助長を目的とした作品・サイトなどへの出力音声の使用。

(2)音声提供者及び「キャラクター夏目悠李」の有する信用、品質、品位、イメージを著しく損なうような出力音声の公開。

(3)甲、音声提供者、デザイナー及び第三者の権利を侵害する出力音声の使用。

(4)公序良俗に著しく反する内容の出力音声の使用。

(5)歌声DB、及び「キャラクター夏目悠李」の著作情報を偽ること。

(6)本規約に違反すること。

(7)本規約を同梱する際に無断改変を行うこと。

(8)出力音声を用いて成果物を作ること。

それ以外にも甲、音声提供者が不適当と判断した場合には、乙に対して出力音声の公開を中止するよう要請する場合があります。

・禁止事項の非適用

以下の行為は禁止事項に該当しません。

(1)個人・同人サークルに該当する乙が利用許諾を遵守した上で「夏目悠李」「歌声データベース制作:アマノケイ 音声提供者:霧野蒼太」をクレジットせず、出力音声を用いた作品を発表すること。
(2)乙が出力音声の使用を明示、及びその他の手段で明確化し、著作情報に誤解が生じないようにした上で、出力音声を「夏目悠李」以外に使用すること。

・準拠法

本規約は、日本法に準拠し、日本法に従って解釈されるものとします。

本規約に強行法規に抵触する規定がある場合、抵触部分のみ無効となり、抵触部分は強行法規の範囲内で最も近い内容に修正されるものとします。

・管轄

本規約に関する一切の紛争は、東京簡易裁判所または東京地方裁判所を第1審の専属的合意管轄裁判所とします。

・連絡先

アマノケイのGmail

amano0kei☆gmail.com (星を@マークに変更して下さい)

アマノケイのTwitter (DMにお問い合わせ下さい)

アマノケイ@歌声合成系Vの者 (@aman0_kei) | Twitter

アマノケイの公式サイト (歌声データベースの運用にてメールを送信して下さい)

依頼・問い合わせ | Official

 

キャラクター「夏目悠李」を使用する際のガイドライン

キャラクター「夏目悠李」を使用する際のガイドライン

ガイドラインは、アマノケイ(以下「甲」という)が制作した「夏目悠李/男声歌声データベース」(以下「歌声DB」という)に関連して制作された「キャラクター夏目悠李」を利用する際のガイドラインについて定めるものです。

・定義

「キャラクター夏目悠李」とは、その名称「夏目悠李」と「UNF/UserNotFound」がデザイン原案をした絵画の著作物とによって、その外観等の特徴を表現されている抽象的概念をいいます。

「デザイナー」とは、歌声DBに関連して制作された「キャラクター夏目悠李」をデザインした「UNF/UserNotFound」のことをいいます。

「公式イラスト」とは、デザイナーの「UNF/UserNotFound」が描いた「キャラクター夏目悠李」のことをいいます。

イラストレーター」とは、デザイナーの原案に沿ってイラストを制作した「おにだるま」のことをいいます。

「準公式イラスト」とは、イラストレーターの「おにだるま」が描いた「キャラクター夏目悠李」のことをいいます。

 「イラスト」とは、絵画の著作物の事をいいます。

 

「歌声DB」とは、音声提供者が提供した歌唱データファイル(wav形式)と甲が作成及び整備したMIDIファイル、MusicXMLファイル、ラベルファイルなど、配布物に含まれる一部または全部(修正、追加などを含む)をいいます。

「音声提供者」とは、歌声DBを構成する歌唱データファイル(wav形式)を提供した「霧野蒼太」のことをいいます。

ガイドラインの変更

甲は本ガイドラインの内容を変更できるものとします。

変更したガイドラインは、甲がWebサイト等で告知を行い、乙が「キャラクター夏目悠李」の利用及び参考を続行した時点で有効になるものとします。

ガイドライン変更以前に発表された作品の内、甲がガイドラインを変更することでガイドライン違反になる作品については原則として不遡及となります。

・クレジット表記

公式イラストを用いる場合のクレジットは「UNF」または「UserNotFound」のどちらかを記載するものとします。

準公式イラストを用いる場合のクレジットは、デザイン原案として「UNF」または「UserNotFound」を、イラストとして「おにだるま」を記載するものとします。

・キャラクターの利用許諾

甲は乙が本ガイドラインを遵守することでの利用を許可するものとします。
同意していただけない場合、キャラクター夏目悠李の使用はできません。

・公式・非公式イラストの利用・参考許諾

甲は乙が本ガイドラインを遵守することで公式・準公式イラストの利用・参考を許可するものとします。
同意していただけない場合、公式・準公式イラストは利用・参考できません。


(1)公式・準公式イラスト、またはそれらを参考に制作した作品を公開する際には、該当作品が二次創作であることを明示、及びその他の手段で明確化することとします。

(2)乙が個人または同人サークルである場合、非商用の活動の範囲内であれば公式・準公式イラストを無償で使用することができるものとします。

しかし、いかなる条件であっても金銭が発生する場合は公式・準公式イラストを無償で利用することはできません。

(3)個人・同人サークルの乙が公式・準公式イラストを参考に新しいイラストを自主制作、または第三者に委任・制作した場合、該当するイラストを用いて(CD制作や印刷費などの)コンテンツ制作に必要な実費程度の対価を得ることは可能とします。

(4)乙が法人の場合、商用・非商用を問わず公式・準公式イラスト・または第三者の作成したイラストを無償で利用することはできません。(後述の使用許諾が必要な場合を参照)

上記を遵守した上、公式・準公式イラストを使用して制作された作品の発表をする場合は甲、音声提供者、デザイナー及びイラストレーターへの事前事後の連絡は不要です。

・公式・非公式イラストの利用・参考許諾が必要な場合

乙が公式・準公式イラストを利用して制作した成果物を以下の目的で利用する場合、乙は事前に甲まで問い合わせるものとします。

場合によっては使用料の甲への支払を含め、追加の契約を行うものとします。

なお、公式イラストの使用許可はデザイナーに、準公式イラストの使用許可はデザイナーとイラストレーターの両方に許諾を得るものとします。

(1)法人・同人・個人を問わず、キャラクター夏目悠李の公式・準公式イラストを商用利用する場合。

(2)法人が公式・準公式イラストを参考にして新たなイラストを制作する場合。

(3)法人が第三者にイラストの制作を依頼し、その成果物を商用・非商用を問わず利用する場合。

・禁止事項

(1)犯罪の助長を目的とした作品・サイトなどへの使用。

(2)音声提供者、デザイナー、イラストレーター及び「キャラクター夏目悠李」の有する信用、品質、品位、イメージを著しく損なうような作品の公開。

(3)甲、音声提供者、デザイナー、イラストレーター及び第三者の権利を侵害する作品への使用。

(4)公序良俗に著しく反する内容への使用。

(5)公式・準公式イラスト、及び「キャラクター夏目悠李」の著作情報を偽ること。

(6)公式・準公式イラストをトレースして新たなイラストを制作すること。

(7)本ガイドラインに違反すること。

それ以外にも甲、音声提供者、デザイナー及びイラストレーターが不適当と判断した場合には、乙に対してイラスト及び作品の公開を中止するよう要請する場合があります。

 

・禁止事項の非適用

以下の行為は禁止事項に該当しません。

個人や同人サークルの乙が「夏目悠李」の使用を明示及びその他の手段で明確化した上で、デザイナー及びイラストレーターの名前をクレジットせず、公式・準公式イラストを用いた作品を発表すること。

・準拠法

本規約は、日本法に準拠し、日本法に従って解釈されるものとします。

本規約に強行法規に抵触する規定がある場合、抵触部分のみ無効となり、抵触部分は強行法規の範囲内で最も近い内容に修正されるものとします。

・管轄

本規約に関する一切の紛争は、東京簡易裁判所または東京地方裁判所を第1審の専属的合意管轄裁判所とします。

 

以上に同意する方は、公式作者の名前(短い方)+準公式作者の名前+規約に同意しますと入力した上でダウンロードして下さい

bowlroll.net

StudioVoICEがXStudioに進化!音源制作&ピッチ機能なども追加

先日、紹介したStudioVoICEですが今回メジャーアップデートが入りました!

使い方や導入方法はこちらから↓

その名も「XStudio!」

 

①シンガーの追加&ビジュアル公開

f:id:crimsonbutterfly0zero0:20200820180718p:plain

今回新規公開された「陈水若(チェンシュイルオ)」以外に、「陈子瑜(チェンズユ)」さんのビジュアルが追加されました!

ふむ、中々イケメンのメガネ男子でござったか……。

②待望のピッチ編集機能追加!

なんと、右上の「参数」をクリックすることで……

f:id:crimsonbutterfly0zero0:20200820180955j:plain

ピッチを弄れるようになりました!

f:id:crimsonbutterfly0zero0:20200820181034j:plain

1.手書きモード

f:id:crimsonbutterfly0zero0:20200820181310g:plain

ペンツールで自由に描けるようになりました。

2.ポイントモード

f:id:crimsonbutterfly0zero0:20200820181330g:plain

UTAUやSynthVのような形式でポイントを置いてピッチが描けるようになりました!

③ピアノモードが追加!

ここの「○琴」と書いてある部分をクリックすることで、ボーカルではなくピアノでおとをプレビューすることができます(ピッチは無視する)

f:id:crimsonbutterfly0zero0:20200820183910j:plain

 

④音源自作が可能に!

なんと、応募すれば音源自作もできるようです!

加えて音源の権利は音源の製作者に帰属するとのことです。

※ただしオーディションがある上、中国語限定な模様。

詳細説明(全文)

f:id:crimsonbutterfly0zero0:20200820184212p:plain

 

感想

下手すると個人でも制作可能な高レベルのAI歌声合成のソリューション増えましたね、X Studioにはどんな音源が付くのか楽しみです。

Synthesizer V Studio Proの使い心地を試してみた

色々ありましてSynthV R2のエディタを先に貰いました、やったね!

あと今日は平行四界のR2音源発売日なので、「情報解禁してもいいでしょ!」ってかんじでレビューをしました。

f:id:crimsonbutterfly0zero0:20200709191228p:plain

 ※執筆時点でのバージョンはPro1.0.4です。

ここで書いた悪いところはアプデで改善される可能性もあります。

全体的な感想

 

R1とR2を比べた感じでは「目を見張るような新しい技術的機能は無い」という感じで、どちらかと言うと「UI的な機能面」を重点的に改修したように見受けられます。

あまり良い例えではないですが、V2→V3における「トライフォン採用」V3→V4における「グロウル、クロスシンセシス」並の驚きは無い感じがします。

そもそもSynthVがR1時代から超絶有能なのもあって、結構ハードルは高くなってる感じがあります。

それ以外に良くも悪くも「良いところを伸ばし、悪いところを切り捨てる」という感じもします。

R1との変更点

良い点

 

音質の向上

真面目に音質が向上しました、特に息成分。

R1では結構ぼやけた音だったのが、R2では高域の部分もしっかり合成されるようになったのでMixのときにも埋もれづらく、囁き系の声もいい感じに生成されます。

R1サンプル

 

f:id:crimsonbutterfly0zero0:20200710120550j:plain

R2サンプル

 

f:id:crimsonbutterfly0zero0:20200710120542j:plain

※特に2秒あたりの「綴れ『ば』」が息成分が減り、明瞭になっている

※「夢に『ね』むる」の明瞭度が向上

 

実際のピッチ、波形、音素領域が表示されるようになった

「∨ピアノロール」と書かれている右隣のボタンを押すと実際の音声のピッチ(NOTピッチベンドで描いたピッチ)実際の波形音素の範囲が表示されるようになりました

子音の長さを視覚的に弄れるようになったのは嬉しいですね。

f:id:crimsonbutterfly0zero0:20200709204815j:plain

 

R1時代は「▲」「▼」のみで表示されたので、「子音がどこまで伸びているか」「子音が伸びているのか縮んでいるのか」が非常に分かりにくかったので、これは大きな改善です。

f:id:crimsonbutterfly0zero0:20200709205311j:plain

 

「ゆらぎ」パラメータ

ゆらぎパラメータ自体はSynthV R1からあったのですが、いまいち効き目が分かりづらく何をしているのかよく分かりませんでした。

しかし、前述のピッチ視覚化機能により「ゆらぎ」の効き目が目に見えて分かるようになりました。

f:id:crimsonbutterfly0zero0:20200709220025j:plain

f:id:crimsonbutterfly0zero0:20200709220029j:plain

各ノートごとに「収録したときのピッチの揺れを加算する」機能です

(※Melodyneでいう「モジュレーション」、UTAUでいう「Mod」機能)

無調整でも良い感じに肉声感を加えたい場合は「ゆらぎ」を少々強めに、逆にとことん弄りたい/平べったい感じが良いのであれば「ゆらぎ」を弱く、あるいは無しにすることもできます。

 

ピッチの制御方法

SVR2にて追加された「点で制御する」タイプのピッチエディットですが、UTAUを使った事がある人なら結構良い感じにエディットできると思います。

ただ1つ、注意すべきことを言うなら1番UTAUチックな曲線は赤丸のボタンを押さないと適応されません。

f:id:crimsonbutterfly0zero0:20200709210453j:plain

1つ左は「カクカクの線」、その右は「ベジェ風味の曲線(使いづらい)」 なのでご注意を。

 

音素ガチャの効率化

公式で既に発表があったので書くか迷いましたが、3種類の音素を選択することができます。なので「この発音気に入らないなぁ……」ってなったときの代替案が見つけやすくなりました!

地味に既存の歌声合成では存在しなかった機能です(UTAUは異次元、V4xは表現特化なので用途が違うので除くものとする)

f:id:crimsonbutterfly0zero0:20200710005454g:plain

レンダリング率の視覚化

各トラックがどれくらいレンダリングされているのか非常に分かりやすく表示してくれます

f:id:crimsonbutterfly0zero0:20200709214346p:plain

ピアノロールの表示場所を変えるとそれまでのレンダリングを止め、表示した箇所からレンダリングされます。

f:id:crimsonbutterfly0zero0:20200709214430p:plain

あと、やろうと思えば12も並列してレンダリングができるみたいです、すげぇ……。

f:id:crimsonbutterfly0zero0:20200709214856j:plain

日本語歌詞の入力

R1でもずっと問題になっていましたが、R2になってようやく直りました!

拗音を入力すると「じ」「ゃ」ではなく「じゃ」と入力されます!!!!!

ようやく区別されるようになりました!!!!!

f:id:crimsonbutterfly0zero0:20200710001601j:plain

これだけで神アプデと言っても過言ではないかと思います。

 

UST読み込み

なんと、SynthVにて書き出したUSTが文字化け無しでUTAUに読み込めるようになりました!

f:id:crimsonbutterfly0zero0:20200710002023j:plain

これでもう神を越して超越です(何を言ってるんだか)

どっちとも言えない点

読み込めるファイルが減った

地味ですが、Sharpkeyのプロジェクトファイルが読み込めなくなりました。

f:id:crimsonbutterfly0zero0:20200709205544j:plain

 

R1時代の読み込み機能

f:id:crimsonbutterfly0zero0:20200710222254p:plain

(※あと、某DTMブログを見てCeVIOトークを保存した後にSynthVで読み込んだら何も表示されなかったので悲しかったです)

 

安定性(1.0.3/1.0.4)

超絶安定してます。全然問題無いです

 1.0.4でデータを弄ってるんですが、激しい編集を施しても全く落ちないのでめっちゃ安定してると思いますが、運が良いだけかもしれないので一旦ここに保留しておきます。

※これから先全く落ちないなら「良い点」に移行するか削除します

1.0.3では結構データが落ちましたので、不安定な場合は「Ctrl+S」で頻繁に保存した方が良いと思われます。

※R1では救済措置として最短でデータを毎分上書き/新規保存してくれる機能がありました。

f:id:crimsonbutterfly0zero0:20200709211136j:plain

 

VST機能の削除

結構VST連携機能に関してはDTMerからは賛否両論だったので敢えて削除したのは一周してありだったかもしれません……が、やっぱりそれを残念に思う人は一定数いるかと思います。

 

 

息成分の分離(ブレスの分離)

正直、息成分を分離して色々やる人はRX7とかAdobe Auditionとかで各自の手段を手に入れてると思うので「あえて息成分を別出力する必要はあるのか」という感じはあります。

でも、非常にきれいな感じで息成分が分離できてるので新しい表現方法としては使えると思います

 

左チャンネルから有声音のみ、右チャンネルから無声音(息成分)のみが流れます

※SynthVの標準書き出し機能「ブレスを別チャンネルとして」を利用

 

悪い点

 

UIが初見で結構不親切

サイドバーの横幅は変更できないので、色々と見づらいです。

特に「ショートカットの設定」欄が見づらく、一部の説明に至っては見切れています。

f:id:crimsonbutterfly0zero0:20200709210905j:plain

それに加えここのボタンは「白がON、 黒がOFF」なので「ボタンを押すと凹んで黒い影ができる」という一般的な感覚と一致しません。

できれば緑色に光ってくれたら嬉しいんですが………。

f:id:crimsonbutterfly0zero0:20200709210930p:plain

この辺り、R1は非常に直感的で「機能美」といえるUIをしていたのですがR2は「整列された美しさ(使いやすかは別)」という感じがします。

 

グロウルエフェクトの削除

R1では余り使われなかったグロウルエフェクトですが、Studioでは削除されました。

簡便なエッジボイス生成手段が無くなったのは少々痛いですね……。

f:id:crimsonbutterfly0zero0:20200709215144j:plain

機能的にはボイスエフェクターだと思うので、個人的には、「生成音:原音」の比率をフリーハンドで調整できるようにしたら結構素晴らしい機能になると思ったので残念です。(初音ミクNTのような)

f:id:crimsonbutterfly0zero0:20200709215401j:plain

個人的なぼやき

翻訳の変更

私が担当した翻訳よりも良い感じになっている場所もあれば、直訳すぎて分かりづらい箇所や「この表現はどうなんだ……?」というところが(個人的に)結構見受けられます。

個人的に「トランスポーズ」→「転調」にしたのは分かりやすいと思います。

 

特に「ブレスの分離」は「(CeVIOみたいに)トラックに自動ブレスが入るので、それだけ別途でエクスポートする」という風に見えるので「息成分の分離」と訳した方が良かったと思う。

 

  

 

感想

今回のアプデはR1で不満だった点を改善してくれたので本当に素晴らしいです。

もうSynthV最高…………。

 

 

 

 

 

おまけ(執筆当時のバージョン)

f:id:crimsonbutterfly0zero0:20200709223753j:plain