Python机器学习入门1.8《使用集成模型预测泰坦尼克号乘客的生还情况预测》 - 代码天地

Python机器学习入门1.8《使用集成模型预测泰坦尼克号乘客的生还情况预测》

其他 2018-10-27 19:28:54 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/qq_40883132/article/details/83176110

# -*- coding: utf-8 -*-
"""
Created on Fri Oct 19 08:11:26 2018

@author: asus
"""

import pandas as pd
titanic=pd.read_csv('http://biostat.mc.vanderbilt.edu/wiki/pub/Main/DataSets/titanic.txt')

#人工选取pclass age sex 作为判断乘客是否生还的特征
X=titanic[['pclass','age','sex']]
y=titanic['survived']

#用平均年龄代替缺失的信息
X.fillna(X['age'].mean(),inplace=True)

#数据分割，25%用于测试数据
from sklearn.cross_validation import train_test_split
X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.25,random_state=33)

#类别型特征转化为特征向量(特征提取)
from sklearn.feature_extraction import DictVectorizer
vec=DictVectorizer(sparse=False)
X_train=vec.fit_transform(X_train.to_dict(orient='record'))
X_test=vec.transform(X_test.to_dict(orient='record'))

#使用单一决策树进行模型训练以及预测分析
from sklearn.tree import DecisionTreeClassifier
dtc=DecisionTreeClassifier()
dtc.fit(X_train,y_train)
dtc_y_pred=dtc.predict(X_test)

#使用随机深林分类器进行集成模型的训练以及预测分析
from sklearn.ensemble import RandomForestClassifier
rfc=RandomForestClassifier()
rfc.fit(X_train,y_train)
rfc_y_pred=rfc.predict(X_test)

#使用梯度提升决策树进行集成模型训练以及预测分析
from sklearn.ensemble import GradientBoostingClassifier
gbc=GradientBoostingClassifier()
gbc.fit(X_train,y_train)
gbc_y_pred=gbc.predict(X_test)

#集成模型的预测性能分析
from sklearn.metrics import classification_report

#输出单一决策树在测试集上的分类准确性，以及更加详细的精确率、召回率、F1指标
print('The accuracy of decision tree is',dtc.score(X_test,y_test))
print(classification_report(y_test,dtc_y_pred))

#输出随机深林分类器在测试集上的分类准确性，以及更加详细的精确率、召回率、F1指标
print('The accuracy of random forest classifier is',rfc.score(X_test,y_test))
print(classification_report(y_test,rfc_y_pred))

#输出梯度提升决策树在测试集上的分类准确性，以及更加详细的精确率、召回率、F1指标
print('The accuracy of gradient boosting classifier is',gbc.score(X_test,y_test))
print(classification_report(y_test,gbc_y_pred))

猜你喜欢

转载自blog.csdn.net/qq_40883132/article/details/83176110

Python机器学习入门1.8《使用集成模型预测泰坦尼克号乘客的生还情况预测》

Python机器学习入门1.7《使用决策树模型预测泰坦尼克号乘客的生还情况》

使用决策树模型预测泰坦尼克号乘客的生还情况

机器学习泰坦尼克号乘客生还情况 ——数据集无法获取解决

第15关预测泰坦尼克号乘客生还情况_人工智能课程 - 小象学院

机器学习 - 泰坦尼克号预测生还

预测泰坦尼克号乘客生还率

泰坦尼克号生还预测

Kaggle入门——泰坦尼克号生还者预测 Python机器学习笔记：使用sklearn做特征工程和数据挖掘 Python机器学习笔记集成学习总结

机器学习入门之泰坦尼克号预测存活情况（Taggle）

【机器学习】随机森林预测泰坦尼克号生还概率

泰坦尼克号上的乘客是否生还的预测分析

【机器学习实践】泰坦尼克号乘客获救预测

机器学习基础之《分类算法（7）—案例：泰坦尼克号乘客生存预测》

量化投资学习笔记23——支持向量机:实操，泰坦尼克号乘客生还机会预测

机器学习之路: python 决策树分类预测泰坦尼克号乘客是否幸存

泰坦尼克号预测生还案例的分析（一）

泰坦尼克号乘客存活预测详细笔记

机器学习之泰坦尼克号遇难预测

机器学习实战泰坦尼克号生存预测

机器学习项目 - 泰坦尼克号乘客生还率

机器学习——逻辑回归案例——泰坦尼克号乘客生还

tf神经网络模型预测泰坦尼克号生还

Kaggle实战入门：泰坦尼克号生还预测（进阶版）

Kaggle实战入门：泰坦尼克号生还预测（基础版）

深度学习实现案例一：预测泰坦尼克号上旅客生还概率

泰坦尼克号生存预测（三）-- 预测模型

量化投资学习笔记19——回归分析:实操，泰坦尼克号乘客生还机会预测，线性回归方法。

量化投资学习笔记20——回归分析:实操，泰坦尼克号乘客生还机会预测，逻辑回归方法。

量化投资学习笔记25——朴素贝叶斯:实操，泰坦尼克号乘客生还机会预测

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)