在ε-greedy策略当中,ε的值越大,表示采用随机的一个动作的概率越(),采用当前Q函数值最大的动作的概率越()。 选项: A:大;小 B:大;大 C:小;小 D:小;大 动作 概率 随机 发布时间:2024-03-27 16:57:09