大数据 球队比赛结果预测 思路 分析

问题背景

       随着互联网的发展数据变得更加容易获得和统计、从而互联网数据发掘在很多领域有了推广和应用,对体育比赛也是其中的一种类型,同时也可以给球迷提供一下观看参考。

一数据来源

       通过国外专门统计各类篮球比赛历史信息的网站。其中包含教练、球员、球队、赛季等各方面的记录和统计信息,在网站上都已表格的方式展示,从数据采集的角度看,非常方便爬取和格式转换。

二数据采集和方法

        采集数据采用python语言编写,简单的网络爬虫就可以将数据获取下来,存到本地货近点的服务器,方便使用。

三原始数据

       通过浏览网页反向分析出当前网站的数据结构和获取数据的接口以及简单复杂的原理,选择一年的数据进行爬取出来

四整合后数据结构

       上场时间

       俩分球得分次数

       俩分球出手次数

       俩分球准确率

       三分球得分次数

       三分球出手次数

       三分球准确率

       发球的分次数

       罚球出手次数

       罚球命中率

       前场篮板球个数

       后场篮板个数

       篮板球总数

       助攻次数

       强短次数

       盖帽次数

       失误次数

       犯规次数

       得分

五挖掘目标和思路

 选取一种预测策率

根据策率对特征进行扩张和计算

预处理

特征选取

选用不同的算法分类,以准确率为指标比较分类效果

通过对数据预处理、分类、回归、聚类、关联规则挖掘、以及可交互的数据可视化的算法

六预测结果的分析对比

通过球队以往胜率、队员的分平均分

最近十场、最近五常、最近三场、上一场

把每一场比赛的结果的出平均值和另外一只队伍的平均值相比较得出最终的胜率

     

猜你喜欢

转载自blog.csdn.net/weixin_42749765/article/details/81841651
今日推荐