在ε-greedy策略当中,ε的值越大,表示采用随机的一个动作的概率越(),采用当前Q函数值最大的动作的概率越()。 选项: A:大 B:小 C:大 D:大 E:小 F:小 动作 概率 随机 发布时间:2024-03-27 16:57:09