泰坦尼克灾难 到底是个什么东西

文章目录

  • 这是传奇性的Titanic ML竞赛-参加ML竞赛并熟悉Kaggle平台的工作原理的最佳,首要挑战。
  • 这是国外Kaggle大数据网站的一个经典的入门比赛。这个网站要翻墙。
    简单来说,就是一个简单的大数据预测的题目:我们知道一些人的信息,比如这个人是否有兄弟姐妹,是否是头等舱,这样的信息,然后通过这些信息来预测这个人是否会在 泰坦尼克灾难中 幸存
    我们先来看看这次比赛提供的数据:
    在这里插入图片描述
  • survival:这个人幸存下来了,这也是我们要预测的值
  • pclass:就是这个人做的是不是头等仓, class 1 = 1st, 2 = 2nd, 3 = 3rd
  • sex: 性别
  • Age:年龄
  • sibsp:船上是否有他的兄弟姐妹
  • parch:船上是否有他的父母
  • ticket:船票的号码
  • fare:所花费的船票的费用
  • cabin:船舱的号码
  • embarked:登船港口,泰坦尼克号总共有三个登船港口

这里有一部分的样本:
在这里插入图片描述
之后我也会讲解一些大神的做法,然后回详细介绍相关算法和知识

附件里:
train是训练集
test是测试机
然后我把标准答案也附在里面了,可以自己测试看看准确率。

发布了47 篇原创文章 · 获赞 4 · 访问量 2275

猜你喜欢

转载自blog.csdn.net/qq_34107425/article/details/104057647