机器学习之决策树--使用微信公众号数据

使用微信公众号数据进行分析

# 导入包
import pandas as pd
import numpy as np
%matplotlib inline
%matplotlib notebook
import matplotlib.pyplot as plt
from numpy import *

from pylab import mpl
mpl.rcParams['font.sans-serif'] = ['SimHei']

import trees
import treePlotter
# 导入资料
fr = open('lenses.txt')
lenses = [inst.strip().split('\t') for inst in fr.readlines()]

lensesLabels=['标题吸引', '文章置顶', '公司信息', '公司政策','影响范围大']
lensesLabels

#lensesLabels2避免标签被更改
lensesLabels2 = lensesLabels[:]
# 构建决策树
lensesTree = trees.createTree(lenses,lensesLabels)
lensesTree

{
    
    '标题吸引': {
    
    'N': {
    
    '文章置顶': {
    
    'N': {
    
    '影响范围大': {
    
    'N': {
    
    '公司信息': {
    
    'N': {
    
    '公司政策': {
    
    'N': '<1K',
          'Y': '<1K'}},
        'Y': {
    
    '公司政策': {
    
    'N': '<1K', 'Y': '<1K'}}}},
      'Y': {
    
    '公司信息': {
    
    'N': {
    
    '公司政策': {
    
    'N': '<1K', 'Y': '<1K'}},
        'Y': {
    
    '公司政策': {
    
    'N': '<1K', 'Y': '<1K'}}}}}},
    'Y': {
    
    '影响范围大': {
    
    'N': {
    
    '公司信息': {
    
    'N': '>1K',
        'Y': {
    
    '公司政策': {
    
    '<1K': '<1K', '>1K': '>1K'}}}},
      'Y': {
    
    '公司政策': {
    
    'N': {
    
    '公司信息': {
    
    'N': '>1K', 'Y': '>1K'}},
        'Y': {
    
    '公司信息': {
    
    '<1K': '<1K', '>1K': '>1K'}}}}}}}},
  'Y': {
    
    '文章置顶': {
    
    'N': '>1K',
    'Y': {
    
    '公司政策': {
    
    'N': {
    
    '影响范围大': {
    
    'N': {
    
    '公司信息': {
    
    '<1K': '<1K', '>1K': '>1K'}},
        'Y': {
    
    '公司信息': {
    
    '<1K': '<1K', '>1K': '>1K'}}}},
      'Y': {
    
    '影响范围大': {
    
    '<1K': '<1K', '>1K': '>1K'}}}}}}}}
# 画出决策树
treePlotter.createPlot(lensesTree)

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/m0_46629123/article/details/110089566