鱼羊从凹寺量子势报告|微信官方账号QbitAI
让AI玩《2048》这样的游戏会是什么样的?
现在有人用强化学习法练习。
于是,插上了DQN的翅膀,AI从零开始,想出了《2048》的玩法:
牵手,是不是有一种内在的味道?
这种操作清晰舒适。“1000,没有;“1024,是”的强迫症忍不住赞了一句,为这个AI贡献了800 reddit热。
和DQN打《2048》说明是巴西一哥马塞利诺只会打《2048》 AI。目前在米纳斯吉拉斯联邦大学攻读CS硕士学位。
首先,他利用OpenAI Gym搭建了一个定制化的强化学习环境。
有两种2048棋盘表示法:
二进制——使用二次幂矩阵来表示棋盘中的每个区域。非二进制——原始数字矩阵模型包含两种类型的神经网络:CNN和MLP(多层感知器)。
根据Felipe的说法,与MLP相比,以CNN作为特征提取器的代理表现更好。
培训结束后,我哥测试了一下。1000场比赛,AI达到2048 100次。
玩《2048》的AI玩家。目前,这个由DQN训练的人工智能将在2048年前停止比赛。
不过巴西哥抛砖引玉,吸引了不少前来献玉的盆友。
比如2048控制器也采用了强化学习的方法,将时序微分学习和最大期望搜索相结合。
在10步/秒的策略下,最高可以到32768。
在追求高分的道路上,一位来自日本的选手表现出色。
依靠7个卷积层的深度卷积网络,这款游戏在《2048》只拿到了401912分的最高分。
正如一位网友所说:这是一个有趣又不复杂的强化学习案例。
如果你是刚开始学强化学习,不妨用这个小项目练练手~
参考链接
《2048》 相关开源项目:https://github。com/FelipeMarcelino/2048-健身房https://github。com/aszczepanski/2048https://github。com/Thomas ahle/mcts-2048/
相关论文:https://www.jstage.jst.go.jp/article/ipsjjip/27/0/27_340/_pdfhttp://arxiv.org/abs/1604.05085
— 完—
量子位QbitAI 头条号签约
关注我们,第一时间获知前沿科技动态
标题:2048最高能玩到多少(2048最高分记录)
链接:https://www.52hkw.com/news/rj/57993.html
版权:文章转载自网络,如有侵权,请联系删除!