未分類の雑記

・睡眠時間7時間半くらい。眠い。予報では今朝の気温は0度だったので、少し早めに暖房がつくようにしていたが、それよりも早く寒さで目が覚めてしまった。体調はフツー。思考もたぶんフツー。


・そういえば、トリセツは読まないけど本は読むな。てか、それは前に考えたっけか。でも、実践はまだだったはず。なんにせよ、今は忙しくて実験は無理。


・時間ができたので、いくつかメモ。まずは、最近の成長の実感について。
入社したての頃にあった「1ヶ月単位で成長が実感できる」というあの感覚が、再び発生。おそらくはモデルの構造の理解の比重が一番大きい。「頂点バッファ」と「ボーンの計算」と「マテリアル」と「シェーダ」までやったので、かなり色んなことができるようになったはず。「できるようになった」のが嬉しいのかどうかはわからんが。


・そんなこと言っておきながら、さっそくビルボードのやり方を間違ってた。


・音声版の「モーションキャプチャ」の件。実際の音声をWAVで保存しておいて、WaveToneみたいに「時間」と「周波数」を軸にする平面状で、「音の大きさ」に基づいて画像を生成。それに対して、同じ文字列をVOCALOIDに発話させた音声を同様にして画像化。
「実際の音声」の画像に近づくように「VOCALOIDの音声」の画像を変換させる。その画像の変換と音声の変換の対応を取って、それをもとに音声を変換すれば、VOCALOIDに発話させたようになる?
実際には同じにしちゃうとまったく同じ声になっちゃうし、やってることは関数近似とやらと同じことなんだろうけど、GUIで画像を見ながら直感的に近づけられるかなぁとか。
必要そうなのは、「間(文字間の時間)」「抑揚:音量、音程の上下動」あたりか。それ以外を無視する仕組みが必要?


・今日はなかなか調子が良かった。集中してて久しぶりに一食抜かした。腹減ってない。