Перцептрон, обучающийся играть в змейку алгоритмом Q-Learning.
- 1.py - обучение без использования коэффициента дисконтирования награды,
- 2.py - с коэффициентом дисконтирования.
Подробное описание: Хабр
| Name | Name | Last commit date | ||
|---|---|---|---|---|
Перцептрон, обучающийся играть в змейку алгоритмом Q-Learning.
Подробное описание: Хабр