Pytorchで自学自習で実装した強化学習ユースケース集

このリポジトリでは、Pytorchを使って自学自習で作ってみた強化学習のコードを紹介しています。

A2C、PPO、SAC、MPC、MBPO、CQL、Dreamer、Decision Transformerに関心がある方に適しています。

🔧 使用技術

ディレクトリ名	概要
`actor-critic_optimize-price`	Actor-Criticを理解するために基本的なA2Cを環境も含めて実装したもの
`ppo_optimize-price`	性能向上のために基本的なPPOを環境も含めて実装したもの
`sac_optimize-price`	オフポリシーのために基本的なSACを環境も含めて実装したもの
`sac-mpc_optimize-price`	基本的なSACに環境も推論するMPCを組み込んだものを環境も含めて実装したもの
`sac-mbpo_optimize-price`	基本的なSACに環境も推論するMBPOを組み込んだものを環境も含めて実装したもの
`cql-sac_optimize-operator`	基本的なSACにオフライン学習のためのCQLを組み込んだものを環境も含めて実装したもの
`dreamer-v2_optimize-price`	基本的なSACに世界モデルのDreamer v2を組み込んだものを環境も含めて実装したもの
`decision-transformer_optimize-price`	オフライン学習の基本的なDecision Transformerを環境も含めて実装したもの

Name		Name	Last commit message	Last commit date
Latest commit History 43 Commits
actor-critic_optimize-price		actor-critic_optimize-price
cql-sac_optimize-operator		cql-sac_optimize-operator
d3rlpy_or-gym_cql-ddqn_stable-baseline3_ppo		d3rlpy_or-gym_cql-ddqn_stable-baseline3_ppo
d3rlpy_or-gym_cql-sac_stable-baseline3_sac		d3rlpy_or-gym_cql-sac_stable-baseline3_sac
decision-transformer_optimize-price		decision-transformer_optimize-price
dreamer-v2_optimize-price		dreamer-v2_optimize-price
ppo_optimize-price		ppo_optimize-price
sac-mbpo_optimize-price		sac-mbpo_optimize-price
sac-mpc_optimize-price		sac-mpc_optimize-price
sac_optimize-price		sac_optimize-price
stable-baselines3_or-gym_ppo_sac		stable-baselines3_or-gym_ppo_sac
LICENSE		LICENSE
README.md		README.md