Mysql求留存率(困难)——游戏玩法分析Ⅲ

以游戏玩法分析为例求玩家的留存率

问题描述

Column Name Type
player_id int
device_id int
event_date date
games_played int

 (player_id,event_date)是此表的主键,这张表显示了某些游戏的玩家的活动情况。每一行是一个玩家的记录,他在某一天使用某个设备注销之前登录并玩了很多游戏(可能是 0)

 我们将玩家的安装日期定义为该玩家的第一个登录日。

 我们还将某个日期 X 的第 1 天留存时间定义为安装日期为 X 的玩家的数量,他们在 X 之后的一天重新登录,除以安装日期为 X 的玩家的数量,四舍五入到小数点后两位。

 编写一个 SQL 查询,报告每个安装日期、当天安装游戏的玩家数量和第一天的留存时间。

示例

Activity 表:

player_id device_id event_date games_played
1 2 2016-03-01 5
1 2 2016-03-02 6
2 3 2017-06-25 1
3 1 2016-03-01 0
3 4 2016-07-03 5

Result 表:

install_dt installs Day1_retention
2016-03-01 2 0.50
2017-06-25 1 0.00

 玩家 1 和 3 在 2016-03-01 安装了游戏,但只有玩家 1 在 2016-03-02 重新登录,所以 2016-03-01 的第一天留存时间是 1/2=0.50
 玩家 2 在 2017-06-25 安装了游戏,但在 2017-06-26 没有重新登录,因此 2017-06-25 的第一天留存时间为 0/1=0.00

解答

select install_dt, count(distinct player_id) as installs, 
round(sum(if(datediff(event_date, install_dt)=1, 1, 0)) / count(distinct player_id), 2) as Day1_retention
from (
    select *,  
    min(event_date) over(partition by player_id order by event_date asc) as install_dt
    from Activity
) as t
group by install_dt

分析

 用窗口函数,但要注意group by 的用法,另外在select中,不能将前一个查询的字段用于后续中,比如用count(distinct player_id),而不能用installs。

猜你喜欢

转载自blog.csdn.net/TSzero/article/details/112761650