策略前展、策略迭代与分布式强化学习 下载 网盘 txt 地址 rtf kindle docx pdf

策略前展、策略迭代与分布式强化学习电子书下载地址
寄语:
本书目的是从作者近出版的《强化学习与控制》教科书中更深入地发展一些方法。特别是,提出了有关涉及多个代理,分区架构和分布式异步计算的系统的新研究。本书还将详细讨论该方法在挑战离散/组合优化问题(例
内容简介:
本书目的是从作者近出版的《强化学习预控制》教科书中更深入地发展一些方法。特别是,提出了有关涉及多个代理,分区架构和分布式异步计算的系统的新研究。本书还将详细讨论该方法在挑战离散/组合优化问题(例如路由,调度,分配和混合整数编程)中的应用,包括在这些情况下使用神经网络近似。
本书可作为计算机科学与技术、控制科学与技术、电子科学与技术等相关领域研究生和高年级本科生的教学参考书,也可供信息、通信、控制、优化等领域的科研人员参考。
书籍目录:
暂无相关目录,正在全力查找中!
作者介绍:
Dimitri P. Bertsekas,德梅萃 P.博塞克斯(Dimitri P. Bertseka),美国MIT终身教授,美国国家工程院院士,清华大学复杂与网络化系统研究中心客座教授。电气工程与计算机科学领域国际知名作者,著有《非线性规划》《网络优化》《动态规划》《凸优化》《强化学习与控制》等十几本畅销教材和专著。
出版社信息:
暂无出版社相关信息,正在全力查找中!
书籍摘录:
暂无相关书籍摘录,正在全力查找中!
在线阅读/听书/购买/PDF下载地址:
原文赏析:
暂无原文赏析,正在全力查找中!
其它内容:
编辑推荐
读者通过本书可以了解强化学习中策略迭代,特别是Rollout方法在分布式和多智能体框架下的进展和应用。本书可用作人工智能或系统与控制科学等相关专业的高年级本科生或研究生作为一个学期的课程教材。也适用于开展相关研究工作的专业技术人员作为参考书阅读。
前言
本书作者德梅萃·P.博赛卡斯(Dimitri P.Bertsekas)是美国麻省理工学院教授和亚利桑那州立大学教授,也是美国工程院院士。本书是作者近年来相关研究成果的总结。
强化学习,也称为近似动态规划、神经元动态规划。本书的内容围绕强化学习中的策略迭代这一核心概念展开。策略迭代指从某个策略出发,不断产生改进策略的过程。如果仅仅生成一步改进策略,就称为策略前展(Rollout)。大量经验表明,策略前展是当前用得广、为可靠的强化学习方法之一。主要内容: 第1章为动态规划原理; 第2章为策略前展与策略改进; 第3章为专用策略前展算法; 第4章为值和策略的学习; 第5章为无限时间分布式和多智能体算法。
横空出世的围棋软件AlphaZero算法对本书有很大影响。本书内容同样基于策略迭代、值网络和策略网络的神经网络近似表示、并行与分布式计算和前瞻小化约简技术的核心框架构建,并对算法的适用范围做了拓展。本书的特色在于给出了分布式计算和多智能体系统框架下的强化学习策略改进计算的效率提升技术,建立了一步策略改进策略前展方法同控制系统中广泛使用的模型预测控制(MPC)设计方法之间的联系,并描述了策略前展方法在复杂离散和组合优化问题方面的应用。
通过阅读本书,读者可以了解强化学习中的策略迭代,特别是策略前展方法在分布式和多智能体框架下的进展和应用。本书可用作人工智能或系统与控制科学等相关专业的高年级本科生或研究生的教材,也适合开展相关研究工作的专业技术人员作为参考书。
赵千川
清华大学自动化系教授
清华大学智能与网络化系统研究中心主任
2021年10月
网站评分
书籍多样性:4分
书籍信息完全性:4分
网站更新速度:7分
使用便利性:5分
书籍清晰度:9分
书籍格式兼容性:8分
是否包含广告:9分
加载速度:3分
安全性:4分
稳定性:8分
搜索功能:4分
下载便捷性:5分
下载点评
- 一般般(642+)
- 体验好(92+)
- 无漏页(203+)
- 内容完整(392+)
- 无颠倒(448+)
- 无多页(121+)
- 无广告(249+)
- 书籍多(162+)
下载评价
- 网友 邱***洋:
不错,支持的格式很多
- 网友 宫***凡:
一般般,只能说收费的比免费的强不少。
- 网友 师***怀:
好是好,要是能免费下就好了
- 网友 马***偲:
好 很好 非常好 无比的好 史上最好的
- 网友 芮***枫:
有点意思的网站,赞一个真心好好好 哈哈
- 网友 游***钰:
用了才知道好用,推荐!太好用了
- 网友 居***南:
请问,能在线转换格式吗?
- 网友 濮***彤:
好棒啊!图书很全
- 网友 冷***洁:
不错,用着很方便
- 网友 谢***灵:
推荐,啥格式都有
- 网友 薛***玉:
就是我想要的!!!
- 网友 扈***洁:
还不错啊,挺好
- 网友 印***文:
我很喜欢这种风格样式。
喜欢"策略前展、策略迭代与分布式强化学习"的人也看了
水煤浆制备及应用/再生资源科学与工程技术丛书 下载 网盘 txt 地址 rtf kindle docx pdf
豪门奇谭 下载 网盘 txt 地址 rtf kindle docx pdf
为什么精英都是时间控( 货号:754048470) 下载 网盘 txt 地址 rtf kindle docx pdf
100串珠美饰 下载 网盘 txt 地址 rtf kindle docx pdf
期货从业资格考试教材2021配套必刷题:期货基础知识 下载 网盘 txt 地址 rtf kindle docx pdf
9787516501696 下载 网盘 txt 地址 rtf kindle docx pdf
新TOPIK Ⅰ一本通 新韩国语能力考试精讲精练 下载 网盘 txt 地址 rtf kindle docx pdf
正版新概念美语从ABc英语口语书籍日常交际英语口语 自学商务英语口语日常交流 英语口语教程零基础学英语 零起点英语口语图书籍正版 下载 网盘 txt 地址 rtf kindle docx pdf
Q书架 爱拼3D益智手工 动力兵器 骆驼战斗机 下载 网盘 txt 地址 rtf kindle docx pdf
Flash动画教程/动画专业“十三五”规划应用型本科系列教材 下载 网盘 txt 地址 rtf kindle docx pdf
- 新时代大学英语口语教程——学术交流 下载 网盘 txt 地址 rtf kindle docx pdf
- 翰林书院 帝王史系列:武则天秘史 雷薇 著作 中国华侨出版社【正版书】 下载 网盘 txt 地址 rtf kindle docx pdf
- 前瞻眼光选专业:智能时代全球就业指南 詹建国,严红 主编 广西师范大学出版社【正版可开发票】 下载 网盘 txt 地址 rtf kindle docx pdf
- 梦的解析(德文原版直译,无删节完整全译本,附赠思维导图) 下载 网盘 txt 地址 rtf kindle docx pdf
- 中国礼仪要义 彭林著 南京大学出版社,【正版保证】 下载 网盘 txt 地址 rtf kindle docx pdf
- 社会工作综合能力和实务(中级)全真模拟试卷 下载 网盘 txt 地址 rtf kindle docx pdf
- 全素材照片:实景速写·主题场景 下载 网盘 txt 地址 rtf kindle docx pdf
- 中俄学校体育课程改革新视野--中俄普通高中体育课程标准实施的比较研究 下载 网盘 txt 地址 rtf kindle docx pdf
- 2020中国历史地图和年表+世界历史地图和年表地图墙贴 约1.2*0.9米初高中小学生历史学习 历史通史地图年表速记知识折叠墙贴图 下载 网盘 txt 地址 rtf kindle docx pdf
- 山西秘境-发现最美古中国 下载 网盘 txt 地址 rtf kindle docx pdf
书籍真实打分
故事情节:3分
人物塑造:5分
主题深度:4分
文字风格:8分
语言运用:3分
文笔流畅:5分
思想传递:8分
知识深度:4分
知识广度:9分
实用性:9分
章节划分:4分
结构布局:3分
新颖与独特:7分
情感共鸣:6分
引人入胜:7分
现实相关:6分
沉浸感:4分
事实准确性:7分
文化贡献:5分