検索結果書誌詳細：蔵書検索システム

ログインの状態：ログインしていません。ログインすると利用状況の確認等のサービスを利用できます。		カート（予約候補） 0 登録されていません。

蔵書情報

この資料の蔵書に関する統計情報です。現在の所蔵数在庫数予約数などを確認できます。

所蔵数	1	在庫数	1	予約数	0

資料の状態

各蔵書資料に関する詳細情報です。

No.	資料番号	資料種別	請求記号	配架場所	状態	貸出
1	0014869531	図書一般	417.1/ﾅｶ19/	2F自然	貸出可	○

この資料に対する操作

カートに入れるを押すとこの資料を予約する候補として予約カートに追加します。

いますぐ予約するを押すと認証後この資料をすぐに予約します。

この資料に対する操作

電子書籍を読むを押すと電子図書館に移動しこの資料の電子書籍を読むことができます。

登録するリストログインメモ

書誌情報サマリ

タイトル	マルコフ決定過程
人名	中出康一／著
人名ヨミ	ナカデコウイチ
出版者・発行者	コロナ社
出版年月	2019.4

書誌詳細

この資料の書誌詳細情報です。

書誌種別	図書
タイトル	マルコフ決定過程
サブタイトル	理論とアルゴリズム
シリーズ名	シリーズ情報科学における確率モデル
シリーズ番号	4
タイトルヨミ	マルコフケッテイカテイ
サブタイトルヨミ	リロントアルゴリズム
シリーズ名ヨミ	シリーズジョウホウカガクニオケルカクリツモデル
シリーズ番号ヨミ	4
人名	中出康一／著
人名ヨミ	ナカデコウイチ
出版者・発行者	コロナ社
出版者・発行者等ヨミ	コロナシャ
出版地・発行地	東京
出版・発行年月	2019.4
ページ数または枚数・巻数	8,190p
大きさ	21cm
価格	￥２９００
ISBN	978-4-339-02834-8
ISBN	4-339-02834-8
注記	文献:p186〜188
分類記号	417.1
件名	マルコフ過程
内容紹介	一冊でマルコフ決定過程の理論を学べるように、基礎となる動的計画法、確率変数、確率過程と、マルコフ決定過程の各種最適化規範について詳しく解説。近似アルゴリズムと強化学習に関連する事項の基本的な内容も記述する。
著者紹介	京都大学大学院工学研究科修士課程修了(数理工学専攻)。名古屋工業大学教授。
言語区分	JPN
タイトルコード	1009812295326
目次	第1章マルコフ決定過程の概要
	1.1 ORと確率モデル／1.2 動的計画法／1.3 マルコフ決定過程／1.4 定式化の例／1.5 マルコフ決定過程の拡張と発展
	第2章マルコフ連鎖と再生過程
	2.1 離散型確率変数／2.2 連続型確率変数／2.3 離散時間マルコフ連鎖／2.4 周期／2.5 マルコフ連鎖の定常確率と極限確率／2.6 有限マルコフ連鎖／2.7 再生過程／2.8 再生報酬過程／2.9 マルコフ報酬過程／2.10 セミマルコフ過程／2.11 連続時間マルコフ連鎖
	第3章有限期間総期待利得マルコフ決定過程
	3.1 有限期間総期待利得問題／3.2 最適性方程式／3.3 値反復法／3.4 数値例
	第4章総割引期待利得マルコフ決定過程
	4.1 無限期間総割引期待利得／4.2 最適性方程式と理論的性質／4.3 計算アルゴリズム
	第5章平均利得マルコフ決定過程
	5.1 平均利得／5.2 平均利得に関する関係式／5.3 相対値と平均利得／5.4 総割引期待利得と平均利得の関係／5.5 マルコフ決定過程の分類／5.6 計算アルゴリズム(単一連鎖の場合)／5.7 計算アルゴリズム(多重連鎖の場合)
	第6章セミマルコフ決定過程
	6.1 セミマルコフ決定過程とは／6.2 総割引期待利得／6.3 平均利得／6.4 連続時間マルコフ決定過程(推移間隔が指数分布に従う場合)
	第7章部分観測可能マルコフ決定過程
	7.1 部分観測可能マルコフ決定過程とは／7.2 信念／7.3 定式化／7.4 値関数の線形性／7.5 ベクトル集合の生成
	第8章マルコフ決定過程の展開
	8.1 近似最適化アルゴリズム／8.2 強化学習とマルコフ決定過程／8.3 決定直後の状態を用いた近似アルゴリズム／8.4 最適政策の性質