浩克网 手游攻略 软件教程 游戏AI必备新框架,谷歌发布基于TensorFlow的「多巴胺」开源框架

游戏AI必备新框架,谷歌发布基于TensorFlow的「多巴胺」开源框架

时间:2025-04-22 16:02:32 来源:网络整理 浏览:0

郭原籍寺。

量子比特报告|微信官方账号QbitAI

上周,在DOTA2 TI8竞技场“假装失败”的OpenAI Five受到强化学习的提振。

其实不只是OpenAI Five,AlphaGo和AlphaGo Zero玩围棋,DeepMind DQN(deep Q-network)玩雅达利街机游戏。

都离不开强化学习。

现在,谷歌发布了一个基于TensorFlow的强化学习开源框架,叫做多巴胺。

此外,还有一群多巴胺教colab。

就像它的名字多巴胺一样,新的框架听起来令人兴奋。

清晰、简洁且易于使用

新框架的设计理念清晰简洁,所以代码比较紧凑,大概15个Python文件,基于街机学习环境(ALE)基准。

It integrates DQN, C51, Rainbow Proxy Simplified Edition and the implicit quantile network on ICML 2018.

可再生的

新框架中的代码被完整的测试覆盖,可以作为补充文档,也可以由ALE评估。

基准测试

为了让研究人员快速将他们的想法与现有方法进行比较,

该框架提供了基于DQN、C51、Rainbow agent简化版和隐式分位数网络游戏ALE基准的60个Atari游戏的完整训练数据。

以Python pickle文件和JSON数据文件的格式存储,放入可视化的网页中。

此外,新框架中还有经过训练的深度网络、原始统计日志和TensorBoard标记的TensorFlow。。文件。

门户开放源码框架资源

多巴胺谷歌博客:

https://ai.googleblog.com/2018/08/introducing-new-framework-for-flexible.html

Dopamine github download:

https://github.com/google/dopamine/tree/master/docs#downloads

colabs:

https://github.com/google/dopamine/blob/master/dopamine/colab/README.md

游戏训练的可视化网页:

https://google.github.io/dopamine/baselines/plots.html

相关资料

ALE基准:

https://arxiv.org/abs/1207.4708

DQN(DeepMind):

https://storage.googleapis.com/deepmind-media/dqn/DQNNaturePaper.pdf

C51(ICML 2017):

https://arxiv.org/abs/1707.06887

Rainbow:

https://arxiv.org/abs/1710.02298

Implicit Quantile Networks(ICML 2018):

https://arxiv.org/abs/1806.06923

— 完—

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位QbitAI 头条号签约作者

'' 追踪AI技术和产品新动态

标题:游戏AI必备新框架,谷歌发布基于TensorFlow的「多巴胺」开源框架
链接:https://www.52hkw.com/news/rj/62741.html
版权:文章转载自网络,如有侵权,请联系删除!
资讯推荐
更多
Tiktok专用的梯子加速器(TK加速器全球加速)

Tiktok作为当前最火爆的短视频平台,受到了全球用户的热烈欢迎。然而,由于网络限制或者其他原因,很多用户在观看

2025-04-22
怎么不让快递放菜鸟驿站

菜鸟裹裹怎么禁止放快递?经常网购的小伙伴都知道,如果附近有菜鸟驿站,那么驿站的快递员会默认选择放在驿站中,并

2025-04-22
德国游戏排行榜前十名(德国出品的游戏)

中国的玩家可能在新闻里听过德国科隆游戏展,但对德国的游戏却感觉很陌生。游戏玩家大部分多少应该都体验过SL

2025-04-22
菜鸟驿站怎么送货上门

菜鸟裹裹怎么送货上门?有过菜鸟驿站拿快递的小伙伴都知道,很多菜鸟驿站在派送快递时,默认是放在菜鸟驿站,需要我

2025-04-22