亲测可用的 Linux(Ubuntu18.04下)可运行的俄罗斯方块游戏的仿真环境—————————可用于强化学习算法的游戏模拟器环境

俄罗斯方块模拟器(tetris 游戏),Python库地址:

https://gitee.com/devilmaycry812839668/gym-tetris

在Python3.7环境下亲测可用:

安装:

pip install gym-tetris

安装好后测试代码:

from nes_py.wrappers import JoypadSpace
import gym_tetris
from gym_tetris.actions import MOVEMENT

env = gym_tetris.make('TetrisA-v0')
env = JoypadSpace(env, MOVEMENT)

done = True
for step in range(5000):
    if done:
        state = env.reset()
    state, reward, done, info = env.step(env.action_space.sample())
    env.render()

env.close()

由于上面代码运行过快,不易观察,于是给出修正代码:

from nes_py.wrappers import JoypadSpace
import gym_tetris
from gym_tetris.actions import MOVEMENT

import time

env = gym_tetris.make('TetrisA-v0')
env = JoypadSpace(env, MOVEMENT)

done = True
for step in range(5000):
    if done:
        state = env.reset()
    state, reward, done, info = env.step(env.action_space.sample())
    print(info)
    env.render()
    time.sleep(0.5)

env.close()
View Code

运行图:

该游戏也可以使用命令启动,进行随机或者人为交互:

命令:

gym_tetris -e <environment ID> -m <`human` or `random`>

其中,

<environment ID>  可以是:

TetrisA-v0

TetrisA-v1

TetrisA-v2

TetrisA-v3

TetrisB-v0

TetrisB-v1

TetrisB-v2

TetrisB-v3

如:

gym_tetris -e TetrisA-v0 -m random

如:

gym_tetris -e TetrisA-v0 -m human

消除的行数与得分关系:(游戏规则)

引自:http://news.4399.com/gonglue/elsfangkuai/xinde/m/321661.html

俄罗斯方块是通过消除填满的行数来进行计分的,最高同时消除4行。消除行数最高,分数得到也就越多。

1.消除1行得10分,因为单行消除时最简单的,分数高不到哪去。

2.消除2行得30分,分数开始激增了,30分还不错。

3.消除3行得60分,分数更高,但是难度也是随之增加。

4.消除4行得100分,用这个来打高分是最快的,但是一不小心就可能挂掉。

 

这里说的几行是指一次性消除的行数。

==============================================================

其中,使用该模拟器与环境交互时返回的info消息的格式如下:

更多消息参看项目说明文件。

==============================================================

补充一下:

info 信息中的 board_height  是指当前落底的方块最高的高度:

可以看到上图中落底方块的最高高度为4, 于是 board_height 的数值为4 。

在  'statistics'   中, 方块的种类分别表示为:

'T'

'J'

'Z'

'O'

'S'

'L'

'I'

而每一种类型由于可以选择变形,变形不同样式后又用不同字符串表示:

 r  、 l  、u 、 d    分别代表 right, left, up ,down 四个变形格式。

v,h 分别代表 垂直和水平。

如:块类型 T, 他可以被表示为四种变化格式,"Tr", "Tl", "Tu", "Td"    , 这也是'current_piece'中所进行的表示。

块类型I, 可以表示为 v, h 两个格式,于是有 "Iv",    "Ih" 这两种'current_piece'中所进行的表示 。

next_piece 可以指出下一个新块的类型,如下图,"I"块(和‘I块的两个具体格式  Iv 或 Ih 无关’)的下一个块为‘Td’块:

===========================================================

该游戏进行 human 模式 人为交互是 ,上下左右使用   w、a、s、d 键, 变形使用 O 或 P 键。

本博客是博主个人学习时的一些记录,不保证是为原创,个别文章加入了转载的源地址还有个别文章是汇总网上多份资料所成,在这之中也必有疏漏未加标注者,如有侵权请与博主联系。
原文地址:https://www.cnblogs.com/devilmaycry812839668/p/14963167.html