【AI入門】強化学習の基本概念とSarsaアルゴリズムを用いた迷路探索の実装
Zenn
Share
2026年03月22日AI(その他)

【AI入門】強化学習の基本概念とSarsaアルゴリズムを用いた迷路探索の実装

要約・抽出情報

はじめに こんにちは、野村です。 学生をしながら静岡のHIBARI株式会社でAIを用いたプロダクト開発をしています。大学では情報通信分野で研究を行っています。 本記事は、強化学習とその学習手法について学んだ内容をまとめたものです。学習および実装にあたっては、次の書籍と公式リポジトリを参考にしています。 参考書籍: 小川雄太郎:作りながら学ぶ! 深層強化学習 PyTorchによる実践プログラミング(マイナビ出版) 参考リポジトリ: GitHub サポートリポジトリ(MIT License) 強化学習の位置づけ まず、「AI」、「機械学習」、「強化学習」という言葉の関係...

この記事をシェアする

Share

この記事の詳細はオリジナルサイトでご確認ください

オリジナルサイトで読む