问答题

强化学习中,()主要探索未知的动作会产生的效果,有利于更新Q值,获得更好的策略。

答案: 探索===
题目列表

你可能感兴趣的试题

微信扫码免费搜题