下列关于强化学习的说法正确的是选项: A:在强化学习中,计算机通过不断与环境交互并通过环境反馈来逐渐适应环境; B:强化学习的概念是从Alphago战胜李世石之后才提出的; C:强化学习属于无监督学习的一种,不需要有监督信息; D:强化学习和有监督学习的过程相似,是“开环”的过程 计算机 适应环境 李世石 发布时间:2024-03-27 16:41:23