决策树面试知识点最全总结(五)——CART分类树

CART分类树用基尼指数选择最优特征,同时决定该特征的最优二值切分点。 **基尼指数:**分类问题中,假设有K个类,样本点属于第k类的概率为pkp_kpk​ 则概率分布的基尼指数定义为: Gini(p)=∑k=1Kpk(1−pk)=1−∑k=1Kpk2Gini(p) =\displaystyle\sum_{k=1}^{K}p_k(1-p_k)=1-\displaystyle\sum_{k=1}^{...
分类: 其他 发布时间: 10-17 23:48 阅读次数: 0

集成学习之boosting,Adaboost、GBDT 和 xgboost(一)

在前面的博客(https://blog.csdn.net/qq_16608563/article/details/82878127) 介绍了集成学习的bagging方法及其代表性的随机森林。此次接着介绍集成学习的另一个方法boosting以及boosting系列的一些算法,具体包括 Adaboost、GBDT和xgboost boosting(提升)方法是一种常用的统计学习方法,应用广泛且有效。在...
分类: 其他 发布时间: 10-17 23:48 阅读次数: 0

集成学习之boosting,Adaboost、GBDT 和 xgboost(二)

AdaBoost 算法的训练误差分析 AdaBoost最基本的性质是它能在学习过程中不断减少训练误差,即在训练数据集上的分类误差率。 定理:AdaBoost的训练误差界: 1N∑i=1NI(G(xi))\frac{1}{N}\displaystyle\sum_{i=1}^{N}I(G(x_i))N1​i=1∑N​I(G(xi​)) ...
分类: 其他 发布时间: 10-17 23:48 阅读次数: 0

集成学习之boosting,Adaboost、GBDT 和 xgboost(三)

AdaBoost算法的解释——前向分步法与提升树(GBDT) 可以认为AdaBoost算法是模型为加法模型,损失函数为指数函数、学习算法为前向分步算法时的二类分类学习方法。 前向分步算法: 考虑加法模型f(x)=∑m=1Mβmb(x;γm)f(x)=\displaystyle\sum_{m=1}^{M}β_mb(x;γ_m)f(x)=m=1∑M​βm​b(x;γm​) —— ...
分类: 其他 发布时间: 10-17 23:47 阅读次数: 0

广义线性回归之逻辑斯谛回归( Logistic Regression)

广义线性模型 逻辑斯谛回归概念可以认为是属于广义线性回归的范畴,但它是用来进行分类的。 线性模型的表达式为:f(x)=w0+w1x1+w2x2+...+wnxnf(x)=w_0+w_1x_1+w_2x_2+...+w_nx_nf(x)=w0​+w1​x1​+w2​x2​+...+wn​xn​——(1) 其中, x1 xnx_1~x_nx1​ xn​就是n个特征,作为模型的输入 ...
分类: 其他 发布时间: 10-17 23:47 阅读次数: 0

详解SVM系列(一):感知机

什么是感知机 感知机是二类分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别,取+1和-1二值。 感知机对应于输入空间(特征空间)中将实例分为正负两类的分离超平面,属于判别模型。 感知机旨在求出将训练数据进行线性划分的分离超平面,为此,导入基于误分类的损失函数,利用梯度下降法对损失函数进行极小化,求得感知机模型。 感知机模型 定义:假设输入空间(特征空间)是χ ...
分类: 其他 发布时间: 10-17 23:47 阅读次数: 0

详解SVM系列(二):拉格朗日对偶性

拉格朗日函数有什么用? 在约束最优化问题中,常常利用拉格朗日对偶性将原始问题转换为对偶问题,通过解对偶问题而得到原始问题的解。 原始问题: 假设f(x),Ci(x),hj(x)f(x),C_i(x),h_j(x)f(x),Ci​(x),hj​(x)是定义在RnR^nRn上的连续可微函数,考虑约束最优化问题: minf(x),x∈Rnminf(x),x∈R^nminf(x),x∈Rn s.t.ci(...
分类: 其他 发布时间: 10-17 23:47 阅读次数: 0

noip 2008 提高组初赛订正

1~5 aabca 6~10 ddebc 11 abd 12 abc 13 ac 14 abcd 15 abc 16 abd 17 bcd 18 abc 19 abc 20 abc ?1, 5 ?11, 14, 20 7 5169 22 1,3,2 132/213/231/312/321 /* abcdefguvwxyz -> defghijxyzabc -> efghijxyz...
分类: 其他 发布时间: 10-17 23:46 阅读次数: 0

noip 2005 提高组初赛 订正

文章目录选择题看程序写结果完型木材加工N叉树总结 选择题 1.字符串“ababacbab”和字符串“abcba”的最长公共子串是( )。 A. abcba B. cba C. abc D. ab E. bcba 子串要求连续,子序列可以不连续。 ans = C 6.处理器A每秒处理的指令数是处理器B的2倍。某一特定程序P分别编译为处理器A和处理器B的指令,编译结果处理器A的指令数...
分类: 其他 发布时间: 10-17 23:46 阅读次数: 0

windows和Ubuntu下的对拍和测试多组样例

文章目录shell语言测试random数据测试多组数据Bat测试random数据测试多组数据 shell语言 【Shell脚本攻略】-shell中各种括号()、(())、[]、[[]]、{}的作用 Shell 输入/输出重定向 Shell $0, $#, $*, $@, $?, $$和命令行参数 shell变量和引用 循环选择 测试random数据 测试多组数据 #!/bin/bash g++ m...
分类: 其他 发布时间: 10-17 23:46 阅读次数: 0

ABC难题

题意 给一个序列,给序列里每一种数一个字母"A",“B"或"C”,求有多少种方案使得序列中含有子序列"ABC"。 思路 对于有很多子序列"ABC"的情况,只在第一个"ABC"处统计它。 那么在当前枚举作为"A"的位置前面,不能出现"A"。在当前枚举作为"B"的位置前面,“A"的后面,不能出现"B”。"C"可
分类: 其他 发布时间: 10-17 23:45 阅读次数: 0

sqlserver 如何找到主键为空值的字段

做为主键,正常情况下不应该有空值,可是最近在做ogg转化时,发现之前的sqlserver主键里居然有空值。 当然,他不是单主键,他是多主键组合。 在这里纪录一下,以便以后寻找方便。 --1.因可能多次操作,先删除之前生成的表aaa drop table pdaux.dbo.aaa --2.把找到的表和字段生成到另一个库里 select tablename,colname,
分类: 其他 发布时间: 10-17 23:45 阅读次数: 0

ORA-04031的解决办法

status = 4031-ORA-04031: unable to allocate 12312 bytes of shared memory ("shared pool","unknown object","KKSSP^422","kglseshtTable")). 解决办法: 用如下命令修改SGA_MAX_SIZE与SGA_TARGET的值,调大一些,比如调整为5G,
分类: 其他 发布时间: 10-17 23:45 阅读次数: 0

在Oracle关闭的状态下,如何修改参数文件spfile

因为一些内存大小设置的问题,搞不定,一上火,我直接重启了整台服务器。 登录之后,启动数据库,还是出错: ORA-00844: Parameter not taking MEMORY_TARGET into account ORA-00851: SGA_MAX_SIZE 2147483648 cannot be set to more than MEMORY_TARGET 1258291200
分类: 其他 发布时间: 10-17 23:44 阅读次数: 0

Oracle执行命令没有任何反应,可能是日志无法写入

2017.12.8 操作纪录 请检查一下空间 df -h,空间满了,删除了部分log文件,还是日志无法写入。 alter日志显示: ORA-19809: limit exceeded for recovery files ORA-19804: cannot reclaim 199158784 bytes disk space from 8589934592 bytes limit 现在的
分类: 其他 发布时间: 10-17 23:44 阅读次数: 0

ORA-29275部分多字节字符

纪录一下关于:ORA-29275部分多字节字符的问题。 在做ogg的时候,因为字符占字节数的原因,我把编码从:AL32UTF8改成了ZHS16GBK 具体操作见:https://www.cnblogs.com/jay-xu33/p/5210098.html 未完,先吃饭
分类: 其他 发布时间: 10-17 23:44 阅读次数: 0

oracle12c 修改字符集 修改为ZHS16GBK

本文适用于11g和12c SQL> conn /as sysdba  Connected.  SQL> shutdown immediate;  Database closed.  Database dismounted.  ORACLE instance shut down.  SQL> startup mount  ORACLE instance started. 
分类: 其他 发布时间: 10-17 23:43 阅读次数: 0

Sql镜像同步卡死的一个案例

尝试切换镜像,发现提示出错(忘了什么出错信息,以为出错了就没有切换成功) 结果发现,虽然提示出错,但却切换成功了。原主体变成镜像,成镜像变成主体了。 要命的是:此时的镜像无法再次切换,因为:显示为:主体,正在同步。 当时的周五的下班时间,我想,既然不出错,就应该是有信息在同步,不用管它。 结果到了周一,2天的时间,仍然显示:正在同步。 此时去看双方的ldf,大小也不一样。 显示:卡死了
分类: 其他 发布时间: 10-17 23:43 阅读次数: 0

常用的密钥(cd-key)收集(更新中...)

声明,这不是转载。这里收集的密钥都是可用的。至少是曾经用过的,亲测过的。 Visual Studio Premium 2013 KEY(密钥): FBJVC-3CMTX-D8DVP-RTQCT-92494 PLSQL Developer 64bit 12.0.4.1826官方最新版本带序列号 PLSQL Developer 64bit 12.0.4.1826官方最新版本,亲测
分类: 其他 发布时间: 10-17 23:43 阅读次数: 0

oracle备份之exp/imp

测试环境:oracle 11g, redhat 5.5 纯命令方式: exp der322/der322 owner=der322 file=wox1455.dmp log=wox1455.log buffer=6000000 Drop user der322 cascade; drop tablespace der322 including contents and datafiles;
分类: 其他 发布时间: 10-17 23:43 阅读次数: 0