1 学习目标 复习Q-Learning; 理解什么是值函数近似(Function Approximation); 理解什么是DQN& ...
1. 急切学习 v.s. 惰性学习 急切学习法(Eager leaner) 在接收检验元组前就构造泛化模型(分类模型),学习后 ...

关注我们的公众号

微信公众号