论文略读:X-VARS: Introducing Explainability in Football Refereeingwith Multi-Modal Large Language Model

 数据集+模型

1 SoccerNet-XFoul数据集

  • 用于足球犯规视频识别和解释的数据集
    • 包含高质量的视频文本对,超过10k个视频剪辑和22k个问题,由70多名经验丰富的裁判进标注
    • 是体育领域中最大的数据集,涵盖了复杂问题,并且是唯一专注于裁判问题的数据集

1.1 关键问题

  • “这是犯规吗?为什么?” ;

  • “你会给出什么牌?为什么?”;

  • “防守者是否阻止了有希望的进攻或进球机会?” ;

  • “裁判是否可以给予优势?”。(进攻有利之类)

1.2 标注数据

  • 精选了经验丰富的裁判进行标注,这些裁判平均执裁了655场正式比赛,经验丰富

1.3 判罚主观性应对

  • 裁判在判决时带有很强的主观性
    • ——>数据集会收集同一行为的多个答案,而不是为每个问题收集单一的决定和解释
    • ——>可以提高 AI 模型的鲁棒性,使其能够在模糊或主观情况下做出明智的决策

2 模型

3 结果

猜你喜欢

转载自blog.csdn.net/qq_40206371/article/details/143248278