2020-01-01から1年間の記事一覧

強化学習の勉強 方策勾配法でMountainCarを試す

OpenAI Gym 入門 - Qiita この方の記事を参考に方策勾配法でMountainCarを試しました。強化学習の勉強をする上で環境(ゲーム)を作るが大変だったのですが、OpenAIのgymは一瞬で環境を構築できるので感動しました。使うのはこれだけ import gym import nump…

Swiftでガウス過程

ガウス過程回帰をSwiftで実装します。ガウス過程は線形回帰の重みパラメータを積分消去し、カーネル関数(基底関数の内積)のみで関数を表現するモデルです。 確率モデルなので、予測に対する分散も表現できます。Pythonで実装したものがあるので、これを参…

Swiftの行列計算など

使用頻度の高い計算を簡単にできるようにしました。 行列式の算出のためにLU分解についても書きましたが、ピボットの実装をしていません。 行列の対角要素に0が含まれている場合に不安定になります。いつかはピボットを実装して、より汎用的に使えるようにし…