【经典大数据竞赛科普】泰坦尼克灾难 到底是个什么东西

@

目录

    • 这是传奇性的Titanic ML竞赛-参加ML竞赛并熟悉Kaggle平台的工作原理的最佳,首要挑战。
    • 这是国外Kaggle大数据网站的一个经典的入门比赛。这个网站要翻墙。
      简单来说,就是一个简单的大数据预测的题目:我们知道一些人的信息,比如这个人是否有兄弟姐妹,是否是头等舱,这样的信息,然后通过这些信息来预测这个人是否会在 泰坦尼克灾难中 幸存
      我们先来看看这次比赛提供的数据:
      在这里插入图片描述
    • survival:这个人幸存下来了,这也是我们要预测的值
    • pclass:就是这个人做的是不是头等仓, class 1 = 1st, 2 = 2nd, 3 = 3rd
    • sex: 性别
    • Age:年龄
    • sibsp:船上是否有他的兄弟姐妹
    • parch:船上是否有他的父母
    • ticket:船票的号码
    • fare:所花费的船票的费用
    • cabin:船舱的号码
    • embarked:登船港口,泰坦尼克号总共有三个登船港口

    这里有一部分的样本:
    在这里插入图片描述
    之后我也会讲解一些大神的做法,然后回详细介绍相关算法和知识

    附件里:
    train是训练集
    test是测试机
    然后我把标准答案也附在里面了,可以自己测试看看准确率。

    猜你喜欢

    转载自www.cnblogs.com/PythonLearner/p/12907819.html