pytorch-policy-gradient-example

Train an agent for CartPole-v0 using naive Policy Gradient.

Solved in 500 episodes (Avg Reward):

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
LICENSE		LICENSE
README.md		README.md
graph.png		graph.png
pg.py		pg.py

Provide feedback