第8回学生ゼミを行いました。
今回はPRMLではなく、佐藤さんから Reinforcement Learning (RL、強化学習)について発表を行って、RLの基礎知識とQ-learningを紹介しました。
「Q」関数について各変数を議論して、機械は実際にどのようなものを学習していることの理解を深めることができました。
次回はPRMLに戻って、分類の問題に進みましょう。
投稿者|邱
第8回学生ゼミを行いました。
今回はPRMLではなく、佐藤さんから Reinforcement Learning (RL、強化学習)について発表を行って、RLの基礎知識とQ-learningを紹介しました。
「Q」関数について各変数を議論して、機械は実際にどのようなものを学習していることの理解を深めることができました。
次回はPRMLに戻って、分類の問題に進みましょう。
投稿者|邱