用TensorFlow做一个玩微信跳一跳的AI

作为python和机器学习的初学者，目睹了AI玩游戏的各种风骚操作，心里也是跃跃欲试。

然后发现微信跳一跳很符合需求，因为它不需要处理连续画面（截屏太慢了）和复杂的操作，很适合拿来练手。于是…这个东西诞生了，目前它一般都可以跳到100多分，发挥好了能上200。

1.需要设备：

2.大致原理

使用adb模拟点击和截屏，使用两层卷积神经网络作为训练模型，截屏图片作为输入，按压毫秒数直接作为为输出。

3.训练过程

最开始想的用强化学习，然后发现让它自己去玩成功率太！低！了！，加上每次截屏需要大量时间，就放弃了这个方法，于是考虑用自己玩的数据作为样本喂给它，这样就需要知道每次按压的时间。

我是这样做的，找一个手机写个app监听按压屏幕时间，另一个手机玩游戏，然后两个手指同时按两个手机o(╯□╰)o

4.上代码

首先，搭建模型：

其次，获取屏幕截图并转换为模型输入：

# 获取屏幕截图并转换为模型的输入
def get_screen_shot():
# 使用adb命令截图并获取图片，这里如果把后缀改成jpg会导致TensorFlow读不出来
os.system('adb shell screencap -p /sdcard/jump_temp.png')
os.system('adb pull /sdcard/jump_temp.png .')
# 使用PIL处理图片，并转为jpg
im = Image.open(r"./jump_temp.png")
w, h = im.size
# 将图片压缩，并截取中间部分，截取后为100*100
im = im.resize((108, 192), Image.ANTIALIAS)
region = (4, 50, 104, 150)
im = im.crop(region)
# 转换为jpg
bg = Image.new("RGB", im.size, (255, 255, 255))
bg.paste(im, im)
bg.save(r"./jump_temp.jpg")
img_data = tf.image.decode_jpeg(tf.gfile.FastGFile('./jump_temp.jpg', 'rb').read())
# 使用TensorFlow转为只有1通道的灰度图
img_data_gray = tf.image.rgb_to_grayscale(img_data)
x_in = np.asarray(img_data_gray.eval(), dtype='float32')
# [0,255]转为[0,1]浮点
for i in range(len(x_in)):
for j in range(len(x_in[i])):
x_in[i][j][0] /= 255
# 因为输入shape有batch维度，所以还要套一层
return [x_in]

以上代码过程大概是这样：

最后，开始训练：

while True:
…………
# 每训练100个保存一次
if train_count % 100 == 0:
saver_init.save(sess, "./save/mode.mod")
…………
sess.run(train_step, feed_dict={x: x_in, y_: y_out, keep_prob: 0.6, learn_rate: 0.00005})

训练所用数据是直接从采集好的文件中读取的，由于样本有限（目前采集了800张图和对应800个按压时间，在github上train_data文件夹里），并且学习率太大又会震荡，只能用较小学习率反复学习这些图片。

5.总结

1.样本的按压时间大都分布在300ms到900ms之间，刚开始训练的时候发现不论什么输入，输出都一直很谨慎的停留在600左右，还以为这种方法不可行。不过半个小时后再看发现已经有效果了，对于不同的输入，输出值差距开始变大了。所以…相信卷积网络的威力，多给它点耐心。

2.由于我自己最多玩到100多分，后面的数据没法采集到，所以当后面物体变得越来越小时，这个AI也会变得容易挂掉。理论上说让它自己探索不会有这个瓶颈，只是截屏时间实在难以忍受。

3.目前还是初级的版本，有很多可以优化的地方，比如说识别左上角的分数，如果某次跳跃得分较高，那么可以把这次的学习率增大；检测特殊物体，比如超市音乐盒，就停留几秒再进行下一次跳跃，等等。

下面是github地址，源码加注释总共不到300行：

Enjoy yourself！