在强化学习过程中,()表示随机地采取某个动作,以便于尝试各种结果;()表示采取当前认为最优的动作,以便于进一步优化评估当前认为最优的动作的值。
A:探索;开发
B:开发;探索
C:探索;输出
D:开发;输出
发布时间:2024-06-11 01:12:21
A:探索;开发
B:开发;探索
C:探索;输出
D:开发;输出
以下文字与答案无关
提示:有些试题内容 显示不完整,文字错误 或者 答案显示错误等问题,这是由于我们在扫描录入过程中 机器识别错误导致,人工逐条矫正总有遗漏,所以恳请 广大网友理解。
A.探索;开发
B.开发;探索
C.探索;输出
D.开发;输出