FFM参考文档:
https://tech.meituan.com/deep-understanding-of-ffm-principles-and-practices.html
数据不均衡即是正负样本的比例相差很大,对于数据不均衡有一些解决方法和经验:
1.决策树在样本不均衡的问题上会表现的好
2.在划分样本的时候,给较少的样本大的权重
lgb_eval = lgb.Dataset(
x_test, label=y_test, reference=lgb_train,
weight=[1 if y == 1 else 0.02 for y in y_test])
另外这类问题的重点我认为是找特征,挖掘user特征、item特征等