強化學習是一種重要的機器學習方法,在智能控制機器人及分析預測等領域有許多應用。但在傳統的機器學習分類中沒有提到過強化學習,而在連接主義學習中,把學習算法分為三種類型,即非監督學習、監督學習、強化學習。
強化學習就是智能系統從環境到行為映射的學習,以使獎勵信号函數值最大,強化學習不同于連接主義學習中的監督學習,主要表現在教師信号上,強化學習中由環境提供的強化信号是對産生動作的好壞作一種評價。
強化學習是從動物學習、參數擾動自适應控制等理論發展而來。
強化學習是一種重要的機器學習方法,在智能控制機器人及分析預測等領域有許多應用。但在傳統的機器學習分類中沒有提到過強化學習,而在連接主義學習中,把學習算法分為三種類型,即非監督學習、監督學習、強化學習。
強化學習就是智能系統從環境到行為映射的學習,以使獎勵信号函數值最大,強化學習不同于連接主義學習中的監督學習,主要表現在教師信号上,強化學習中由環境提供的強化信号是對産生動作的好壞作一種評價。
強化學習是從動物學習、參數擾動自适應控制等理論發展而來。