「恥、善悪の概念に服従する」から「恥、善悪の概念をまるっきり無視する」という心情の変化を観察して、相変わらず俺は極端から極端へ走るなーと思い、なんでそうなるのかを思いつきで列挙。
レンジが100〜-100であり、自分は100を支持していたとして
- 100の場合よりも-100の利得が高いことを知った
- 単に利得の最大化をはかるよ
- 100は間違っていると知った
- 局所最適解から抜け出すため、反対側の検証から開始
- -100近辺の値を知らない
- 局所最適解に陥ってるかチェック
とか。
なんか違う気がする。たぶん、もっと別の原因が大きいんだろう。