アマノケイのまったり技術解説

合成音声系の技術的なことを中心に解説記事を書いていきます。

「初音ミクNT」の機能・仕様を解説してみる

 

f:id:crimsonbutterfly0zero0:20200604205800p:plain

1パラメータ編

NT Parameters

NTにて新規実装されたパラメータです。

Note Gain

ノートごとのゲイン(≒音量)を増減できるパラメータです。

f:id:crimsonbutterfly0zero0:20200605150131g:plain

0%にした場合、前後の音のフェードイン/アウトはそのままで、該当する音の音量が限りなく0に近くなります

(語頭だと稀に子音が残る)

f:id:crimsonbutterfly0zero0:20200604210641p:plain

Note Gainについては音質にそこまで関与しないように思われます。

f:id:crimsonbutterfly0zero0:20200605192218p:plain

Consonant Rate

子音の長さを調整する値です。

本来の子音の長さの0.1~3倍の範囲で伸縮できます。

f:id:crimsonbutterfly0zero0:20200605150826g:plain

子音の長さが長すぎると前のノートの母音を侵食します。

 

なお、波形が表示される部分の緑色のバーはおおまかに「子音の開始位置」を表しています。(厳密に言うとAttack Speedが100の時のみ)

f:id:crimsonbutterfly0zero0:20200604211150p:plain

このバーに関しては、波形のレンダリング(後述)をオフにしても表示され続けるので、子音の大まかな位置が分かりやすく表示されます。

Attack Speed

母音のアタックスピードを調整できるパラメータです。

(厳密に言うとVCやVV接続部分の遷移時間を変更させてる可能性?)

「fast」に寄せると立ち上がりが早く、「slow」で遅くなります。

①語頭・語中の場合

f:id:crimsonbutterfly0zero0:20200605151621g:plain

 

②母音を連続した場合

f:id:crimsonbutterfly0zero0:20200605152504g:plain

 

③語尾の場合

f:id:crimsonbutterfly0zero0:20200605153209g:plain

特に、「3.」については「立ち上がりが早いと語尾のフェードが早く、遅いと逆に語尾まで音量が均一」という現象が確認されています。

Dynamics

ダイナミクスを調整できるパラメータです。

f:id:crimsonbutterfly0zero0:20200604213327p:plain

調査の結果、単にボリュームを調整できるパラメータであることが判明しました。(ゲイン調整済み)

f:id:crimsonbutterfly0zero0:20200605192941p:plain

Breathiness

息成分を調整できるパラメータです……と言いたいところですが、このパラメータを中途半端に(20〜90%辺り)掛けると音色が微妙になるので100%掛けて息成分だけにしない限り、余り使えません。

(EQでハイパスフィルタ掛けたっぽい感じになる)

f:id:crimsonbutterfly0zero0:20200604213632j:plain

調査の結果、「声から有声音を抜いている」訳ではなく、スペクトログラムに応じて「息成分をシミュレートしている」ように思われます。

f:id:crimsonbutterfly0zero0:20200605193344p:plain

Super Formant Shifter

声のトーンを変更できるパラメータです。

「cute」に寄せると可愛らしく、「cool」に寄せると張った声になります。

VOCALOIDに比べると、フォルマントの変化が緩やかになっているので、ある程度扱いやすくなりました。

f:id:crimsonbutterfly0zero0:20200604213855j:plain

Voice Voltage

声のハリを変更するパラメータです。

100%に寄せると明るく、-100%に寄せると暗くなります。

-100%は声質が良い感じに弱くなるので使いやすいのですが、100%に関しては(個人的に)聴覚上音量が大きく感じしかしないので、今のところは-100%ほど出番は無いように思われます。

f:id:crimsonbutterfly0zero0:20200604214144j:plain

調査の結果、高域と低域のどちらにパワーを偏らせるか調整できるパラメータであると思わしき結果が出力されました。(ゲイン調整済み)

f:id:crimsonbutterfly0zero0:20200605193920p:plain

Pitch Control

後述の「ピッチカーブを編集」モードで弄ったラインを眺めることができます。

ここからは特に弄れる要素はなく、単に「どれほどピッチが離れているか」を眺められる欄のようです。

f:id:crimsonbutterfly0zero0:20200604214701j:plain

Voice Drive

唸り声, グロウル効果を付与できるパラメータです。

使う際は、【Voice Drive】左隣の電源ボタンをクリックして青く点灯したことを確認しましょう。

【-+スライダー】にて初期値を変更できます。(左端に寄せて初期値を【0】にすることを推奨)

f:id:crimsonbutterfly0zero0:20200604215109p:plain

2UI編

新しい描画ツール

Piapro Studioに存在した既存のツール以外に、ピークを描けるツールが増えました

使い道は……クレッシェンドとかを手軽に描けるのではないでしょうか……。

f:id:crimsonbutterfly0zero0:20200604220143j:plain

ピッチカーブを編集

ペンツール、ラインツール、カーブツール、ピークツールを使ってピッチをピアノロール上に描くことができます。

f:id:crimsonbutterfly0zero0:20200604215831j:plain

このモードに入る場合は「ノート」の該当箇所、ショートカットキーの「tab」

f:id:crimsonbutterfly0zero0:20200604221034p:plain

右上の「PITCH」と書かれているボタンをクリックする必要があります。
f:id:crimsonbutterfly0zero0:20200604220300j:plain

ピッチを編集している間はノートが弄れませんので要注意。

※1初音ミクNTではビブラートを付与するUIをクリックするとpiapro  studioが落ちるので手書きビブラートがほぼ必須になります。

※2アップデートで改善される模様

バックグラウンドレンダリング

波形をリアルタイムで表示してくれます。

NTパラメータを編集すると、その度に波形をレンダリングし直して表示してくれます。

(Voice Driveは後から処理するタイプのエフェクトなので更新されない)

f:id:crimsonbutterfly0zero0:20200604220602j:plain

重い場合もあるので、オフにする場合はトラックのこの部分や

f:id:crimsonbutterfly0zero0:20200604220801p:plain

波形が表示される部分にある青い波形マークをクリックすることで止めることができます。

f:id:crimsonbutterfly0zero0:20200604220919p:plain
オートエンベロープ

ある程度、発音を自動調整してくれる機能です

プロト版では子音とノート先頭部分を明瞭化してくれるみたいです(20%くらい)

f:id:crimsonbutterfly0zero0:20200605145435g:plain

3挙動編

まさかの単音階音源!?

色んな音階にノートを設置した後、ピッチでC4に全部持っていくと全て同じ波形になりました。

※追記 実際のところ5音階音源らしいのですが、急激なピッチシフトが行われたときに一番近いサンプルで合成されるようになってるみたいです!

f:id:crimsonbutterfly0zero0:20200605195142p:plain

歌詞の表示方式

f:id:crimsonbutterfly0zero0:20200604222811j:plain

歌詞と発音記号の表示が別々になってしまったので編集する際はどちらか片方のみの表示になりました。

(もしかしたらヤマハの特許の可能性?)

発音記号

発音記号に関してはVOCALOIDに引き続き、X-SAMPAを採用。

ただ、いくつかの発音記号などが使用不可に。

【Sil】……使用可能(小さい「っ」など)

【br1~5】……使用可能

Asp】……使用可能(ノートにピッチが引っ張られる)

【?】……使用不可(実質意味のない歌詞を入力したときと同じ挙動になる)

【_0】……使用不可(代用するならBreathinessが妥当?)

無声化?

前のノートの長さが短い場合、Consonant Rate(子音速度)をLongにすることで無声化っぽい感じになる時があります。

f:id:crimsonbutterfly0zero0:20200604221300j:plain

子音単体ノート

s, S, hなどは使用可能。

それ以外はノートの最後にほんの少し音が鳴る程度。

f:id:crimsonbutterfly0zero0:20200604222603j:plain

語尾に「g」を置いたからといって、軟口蓋を閉鎖してくれたりはしないので、そういった音が欲しい場合はノートを置く→要らない音を後から削るという方法を使うしかなさそうです。(今のところは)

発音記号の編集

1つのノートに2つ以上の発音記号を入力すると大体の場合反応しなくなります。

発音記号に【母音+子音】(例:【a s】)と入力すると、ノートの開始位置から鳴るのが子音、それ以前が母音になります。

f:id:crimsonbutterfly0zero0:20200604223608j:plain

Consonant RateやAttack Speedで各種タイミングを調整することも可能です

※【a g】などと配置しても母音の閉じ方は変わってくれないので、基本的にはノート単体入力を推奨

 

4おまけ

VOCALOIDトラック

もしかしたら、クリプトンのVOCALOIDがNTエディタで使用可能になるかも知れませんね……!

f:id:crimsonbutterfly0zero0:20200604223857p:plain

NTエンジンかVOCALOID4エンジンか、サードパーティのボカロも使えるのかは不明ですが。

 

感想

重いのだけなんとかすれば結構使えると思う。