蔵書情報
この資料の蔵書に関する統計情報です。現在の所蔵数 在庫数 予約数などを確認できます。
資料の状態
各蔵書資料に関する詳細情報です。
No. |
資料番号 |
資料種別 |
請求記号 |
配架場所 |
状態 |
貸出
|
1 |
0014869531 | 図書一般 | 417.1/ナカ19/ | 2F自然 | 貸出可 |
○ |
この資料に対する操作
カートに入れる を押すと この資料を 予約する候補として予約カートに追加します。
いますぐ予約する を押すと 認証後この資料をすぐに予約します。
この資料に対する操作
電子書籍を読むを押すと 電子図書館に移動しこの資料の電子書籍を読むことができます。
書誌情報サマリ
タイトル |
マルコフ決定過程
|
人名 |
中出 康一/著
|
人名ヨミ |
ナカデ コウイチ |
出版者・発行者 |
コロナ社
|
出版年月 |
2019.4 |
書誌詳細
この資料の書誌詳細情報です。
書誌種別 |
図書 |
タイトル |
マルコフ決定過程 |
サブタイトル |
理論とアルゴリズム |
シリーズ名 |
シリーズ情報科学における確率モデル |
シリーズ番号 |
4 |
タイトルヨミ |
マルコフ ケッテイ カテイ |
サブタイトルヨミ |
リロン ト アルゴリズム |
シリーズ名ヨミ |
シリーズ ジョウホウ カガク ニ オケル カクリツ モデル |
シリーズ番号ヨミ |
4 |
人名 |
中出 康一/著
|
人名ヨミ |
ナカデ コウイチ |
出版者・発行者 |
コロナ社
|
出版者・発行者等ヨミ |
コロナシャ |
出版地・発行地 |
東京 |
出版・発行年月 |
2019.4 |
ページ数または枚数・巻数 |
8,190p |
大きさ |
21cm |
価格 |
¥2900 |
ISBN |
978-4-339-02834-8 |
ISBN |
4-339-02834-8 |
注記 |
文献:p186〜188 |
分類記号 |
417.1
|
件名 |
マルコフ過程
|
内容紹介 |
一冊でマルコフ決定過程の理論を学べるように、基礎となる動的計画法、確率変数、確率過程と、マルコフ決定過程の各種最適化規範について詳しく解説。近似アルゴリズムと強化学習に関連する事項の基本的な内容も記述する。 |
著者紹介 |
京都大学大学院工学研究科修士課程修了(数理工学専攻)。名古屋工業大学教授。 |
言語区分 |
JPN |
タイトルコード |
1009812295326 |
目次 |
第1章 マルコフ決定過程の概要 |
|
1.1 ORと確率モデル/1.2 動的計画法/1.3 マルコフ決定過程/1.4 定式化の例/1.5 マルコフ決定過程の拡張と発展 |
|
第2章 マルコフ連鎖と再生過程 |
|
2.1 離散型確率変数/2.2 連続型確率変数/2.3 離散時間マルコフ連鎖/2.4 周期/2.5 マルコフ連鎖の定常確率と極限確率/2.6 有限マルコフ連鎖/2.7 再生過程/2.8 再生報酬過程/2.9 マルコフ報酬過程/2.10 セミマルコフ過程/2.11 連続時間マルコフ連鎖 |
|
第3章 有限期間総期待利得マルコフ決定過程 |
|
3.1 有限期間総期待利得問題/3.2 最適性方程式/3.3 値反復法/3.4 数値例 |
|
第4章 総割引期待利得マルコフ決定過程 |
|
4.1 無限期間総割引期待利得/4.2 最適性方程式と理論的性質/4.3 計算アルゴリズム |
|
第5章 平均利得マルコフ決定過程 |
|
5.1 平均利得/5.2 平均利得に関する関係式/5.3 相対値と平均利得/5.4 総割引期待利得と平均利得の関係/5.5 マルコフ決定過程の分類/5.6 計算アルゴリズム(単一連鎖の場合)/5.7 計算アルゴリズム(多重連鎖の場合) |
|
第6章 セミマルコフ決定過程 |
|
6.1 セミマルコフ決定過程とは/6.2 総割引期待利得/6.3 平均利得/6.4 連続時間マルコフ決定過程(推移間隔が指数分布に従う場合) |
|
第7章 部分観測可能マルコフ決定過程 |
|
7.1 部分観測可能マルコフ決定過程とは/7.2 信念/7.3 定式化/7.4 値関数の線形性/7.5 ベクトル集合の生成 |
|
第8章 マルコフ決定過程の展開 |
|
8.1 近似最適化アルゴリズム/8.2 強化学習とマルコフ決定過程/8.3 決定直後の状態を用いた近似アルゴリズム/8.4 最適政策の性質 |
目次
内容細目
関連資料
この資料に関連する資料を 同じ著者 出版年 分類 件名 受賞などの切り口でご紹介します。
もどる