・前日。
0930:ミックスナッツ×2。
1130:焼き鳥。
1230:ハーゲンダッツ。糖質摂取して睡眠圧を高めてからの昼寝を試みたが微妙だった。
1600:プロテインバー。
2000:サバ缶+ウスターソース。以前にグラタンで試したやつをチーズなしでやってみるなど。こうなるとマヨネーズが欲しくなるなこれ。
瞑想:多少。
パワーナップ:13時からは微妙だったが夕方に少し。
運動:スクワット少し。その場ダッシュ少し。徒歩川崎+ジョギング数回。
性欲:中。依然として高め。


・睡眠時間5時間くらい。
昨夜も寝る直前まで眠気は特になかったので短縮してみても良かったが、改めて考えると仕事の影響を今週までは抑えてはおきたくなった。なのでまぁ折衷案として「1サイクルは減らさないけど、30分程度早く勝手に起きるくらいは許容しよう」という感じで早速30分ほど早く目覚めたのでそのまま起床。パワーナップはちゃんとしてあげる必要がありそうだが。


・Stable Diffusion。
自分のやりたいことはなんとなくわかってきたかな。「構図(ポーズ)」「モチーフ(キャラ造形)」「塗り」を個別にLORAで用意して適用したい感じだ。キャラデザは自前でやったものをできるだけ簡単にLORA化したくて、それをControlNetなりでポーズ付けをして、同じ塗りのLORAを適用して塗りを共通化したい。
で、これらを個別に学習させたLORAというのはおそらく「学習させたいものだけ固定して、残りの2つはバラバラにして学習させる」ことでできるのではないかとは思う。絵描きの人なら塗りに関しては自分の作品がすでに「塗り固定で他のがバラバラ」のものになっているかと思うので学習は容易そうだが、絵描きの人でもそれ以外の学習に関しては自前のデータだけでは難しそうかな。まぁ自分の塗りのままで良ければ特に問題はないんだろうか。
ともあれ自分はそのレベルではないので全てなんとかしてクリアしていかないといけないんだけど、そもそもなんとか用意したデータで学習させてみてもやはり他の要素が入ってしまってる感じがある。概ね「LORA自体に他のレイヤーの要素が入ってしまっている」のと「特定レイヤーの単語が別のレイヤーに影響してしまっている」のが問題かな。
「LORAに他のレイヤーの要素が入ってる」件に関しては学習のパラメータとかでどれくらい調整できるかがまだ未検証。結構時間がかかりそうだが、まぁ個人開発で使っていくためには検証必須かな。とりあえず「回す数の増減(epochだのrepeatだの)」×「batch sizeやresolution」×「画像自体の傾向」を色々と調整して確認していくしかないか。
「単語が別レイヤーに影響している」ってのはたとえば「black hair」みたいな色の指定がポーズや塗りそのもの影響してしまっているような状態。おそらくモデル自体の学習の影響を受けている可能性があり、さらに他のレイヤーのLORAにその単語が含まれていると学習のその部分が強めに表出する感じになるかと思う。なので、できれば単語の利用は最小限に抑えたい感じはあるが、そうすると同じキャラでも差分を作るのが難しくなったりする。個人開発なら衣装はほぼそのままになるとは思うが、表情とかが固定となると厳しいものがある。
あとは「完成品までの適用手順」かな。上記3つのLORAを一度に適用して上手くいくならそれがベストではあるが、現実問題そうもいかないだろう。なので適用順序や適用方法を考える必要がある。原理的に考えるのであれば「他のレイヤーへの影響が低いLORAを後回しにする」のがベストかとは思う。ただ、現状ではそもそも「他のレイヤーへの影響が低いLORAはどれか」というデータがない。ので、これもまた上記の検証と合わせて確認していく必要がありそうか。
といったところかな。思考がゴチャゴチャしてたり不完全だったりしてたけど、やはりこうして言語化すると整理されるな。というわけで次やるのは「各レイヤー特化のLORAの作成を検証」と、それをもとに「他のレイヤーへの影響度が大きい順序」を確認する感じ。個人開発で使うとなると検証用データが他の人の作ったデータをもとにしたものになるので利用しづらいが、まぁやり方さえわかればあとは全て自前で用意することも不可能ではなさそうな気はする。画像の枚数とかをどれくらい用意しないといけないかってのが現時点では不明ではあるが。


・予定。
今日は晴れてるので普通に徒歩川崎しとくか。ただ、なんか太ももの前面に筋肉痛っぽい痛みの症状が出てるんだよな。立ってる時に負荷がかかってる感じ。昨日も立ちながらティアキンし過ぎたせいかなと思うが、まぁ歩けるとは思う。ダメそうなら途中から電車に乗ろう。


・外出終了。
瞑想は多少できてたかな。世界瞑想とは少し違う気もするが、改めてまた少し進展があった。
やっていることは「意識さえなかったらさっきのタイミングで眠れてたのに!」というあの「意識・自我」をなくすこと。
人混みの中を移動する際の認識が多少は近い気がする。アレは動体検知の比重が高いが、どう動くべきかをいちいち思考せずに動けてるので、あとはそれを動体だけでなく世界全体に拡張するだけ?
あるいは「興味を失う」のにも近い。「執着を手放す」というのはよく言われることだが、感覚的には「興味を失う」のに近い。ただ、これは枝葉の方なんだよな。まぁ枝葉を辿って根幹に辿り着くこともあるだろうから悪いわけではないと思うが。
あとは瞑想とは関係ないが「歩行リズムが一定なので副交感神経系が活発になって眠くなっている」のではないかと思った。まぁ今朝は睡眠時間を少し縮めた影響もあるとは思うし、副交感神経系が活発になっているのは休憩の面では悪くないものの、眠いと逆に瞑想しづらいんだよな。難易度が上がる。


・Stable Diffusion。
そういや特殊構文の存在を忘れてたな。ステップ数の途中からタグを反映するやつ。[XX:YY:0.5]みたいな。これを使えば「序盤だけポーズ指定」「終盤だけ塗り指定」みたいな形ができるはず。ただ、これとLORAの組み合わせ方を網羅しようとなると組合せ爆発的なものが起こるので、ある程度は事前に絞り込んでから進めていくか。


・Stable Diffusion。
ある程度はわかってきたが、warmupの値もいじらないといけないっぽいし、実行時のステップ数も調整した方が良さそうな気配がある。想像以上の沼ではあるが、すでにわりと近づいてはいるのであとは妥協点を考えつつ進めていく感じかな。