决策树--熵(Entropy),互信息(Mutual Info)
互信息公式:g(D,A) = H(D) - H(D|A) 其中H(D)为熵,也叫经验熵,香农熵。H(D|A)是指在A条件下的熵,即条件熵。 H(D|A) = sum Pi * H(D|A=Ai), i=1,…,n Pi为Ai条件出现的概率,H(D|A=Ai)为Ai条件的熵。 这里写代码片
def
CentOS7中mysql5.7.23配置
CentOS中mysql5.7.23配置 1、在mysql官方网站下载yum repository,此处下载的是mysql5.7 在Linux的root权限下,用命令rpm -ivh xxx.rpm安装下载的包 然后通过yum install -y mysql,如果想查看安装的列表看通过命令 yum list|grep mysql yum -y list mysql* 2、启动mysql,通过如下命令 /bin/systemctl start mysqld.service 开启 /bin/sy
Linux安装anaconda与环境变量的配置
Linux安装anaconda的步骤: 下载anaconda的安装包,后缀名为.sh,然后在root用户下执行bash XXX.sh Linux配置anaconda环境变量: 1、命令的路径在/usr/local/anaconda3/bin; 2、通过vim /etc/profile,在文件的末尾添加 PATH=$PATH:/usr/local//anaconda3/bin export PATH 3、source /etc/profile或者./profile 多个用户共享anaconda环
Linux相关命令集
1、查看Linux相关进程命令 查看所有进程:ps -aux 查看指定进程:ps -aux | grep 指定名称 2、查看当前目录文件个数 ls -l | grep -c '^-' 3、查询日志文件 动态查询文件命令:tail -f 文件 查询文件所有内容:cat 文件 4、window与Linux之间的上传与下载 上传文件的命令:rz,运行rz会弹出windows的文件添加窗口 下载文件的命令:sz 下载文件名,不能下载目录文件 下载的目录在客户端设计的下载目录 5、Linux后台执行Py
python的for与enumerate使用
for_list = [数据] condition_list = [数据] # for_list和condition_list的数据长度大小一致 list = [x for index, x in enumerate(for_list) if condition_list[index] == condition ] 这句话的意思是:通过enumerate把for_list的角标索引赋值给index, 把for_list中的元素赋值给x, 可以根据condition_list中的元素筛选出for
python程序转可执行文件
windows版本 1、需要安装pyinstaller,通过以下命令: 通过pip install pyinstaller 其中pyinstaller对python3.6不兼容问题,但是在打包时会出现问题。解决办法是升级python为3.7版本,python3.7支持pyinstaller 2、安装好了pyinstaller后,通过命令pyinstaller -F xx1.py xx2.py。生成和第一个py文件相同名的exe文件,其中如果出现依赖的py文件,需要添加py文件到到第一个文件之后
anaconda虚拟环境与pip安装源设置
1、设置pip安装镜像源为国内,使用的命令 阿里云 https://mirrors.aliyun.com/pypi/simple/ 中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/ 豆瓣(douban) http://pypi.douban.com/simple/ 清华大学 https://pypi.tuna.tsinghua.edu.cn/simple/ 中国科学技术大学 http://pypi.mirrors.ustc.edu.cn/simpl
DataFrame中resample函数时间戳筛选
例如 dataframe.resample('M',how=np.mean) # 按照每个月求平均值 dataframe.resample('M',how=np.median) # 按照月求中位数 最新的计算方式如下: data = df.loc[:,['total_purchase_amt','total_redeem_amt']].resample('D').apply(np.sum) # 计算dataframe名称为total_purchase_amt与total_redeem_amt两
数据挖掘、机器学习、人工智能、数据科学解释
数据挖掘(Data Mining) 有目的的从现有大数据中提取数据的模式(Pattern)和模型(Model),精选出最重要的信息,为机器学习与AI做准备。核心目的是找到数据之间的关系。 关键词:模式提取,大数据 机器学习(Machine Learning) 自动地从过往的经验中学习新知识。机器学习可以用程序和算法自动学习,一旦被设计好,程序可以进行自动优化。机器学习需要一定量的训练数据集(Train Data Set),用于构建过往的经验知识。机器学习在目前实践中最重要的功能便是预测结果。
CIFAR10图像生成与NN分类
1. CIFAR10的数据集描述 整个CIFAR10数据集包括5个batch,一个test,整个数据集文件如图1所示。其中数据集以字典形式存放,包括数据集的名称、标签、数据矩阵、图片文件名称四个数据。标签范围从0到9变化,数据矩阵大小为10000*(3*32*32),后面的数字表示图像的大小为32*32的彩色图像。具体键名称为'batch_label', 'labels', 'data', 'filenames'。 图1 CIFAR10数据集 CIFAR10的下载链接 2. CIFAR10图像
PCA(主成分分析方法)
目录 1. 降维问题 2. 向量与基变换 2.1 内积与投影 2.2 基 2.3 基变换的矩阵 3. 协方差矩阵及优化目标 3.1 方差 3.2 协方差 3.3 协方差矩阵 3.4 协方差矩阵对角化 4. 算法与实例 4.1 PCA算法 4.2 实例 5. 讨论 PCA(Principal Component Analysis)是常用的数据分析方法。PCA是通过线性变换,将原始数据变换为一组各维度线性无关的数据表示方法,可用于提取数据的主要特征分量,常用于高维数据的降维。 1. 降维问题 数据
CIFAR10中的KNN分类
1. KNN思路 相对于NN算法而言,KNN的关键在于,通过欧式距离计算待分类图像与训练集图像之间的距离,做距离之间从小到大的排序,找出前K个从小到大出现次数最多的标签作为预测分类标签。具体的示意图如图1所示。 图1 KNN分类CIFAR10大致思路 2. python代码实现 (1) 数据的提取
import pickle
import operator
import numpy as np
import pandas as pd
# 数据获取
def unpickle(file):
PyQt5界面快速开发(QtDesigner与PyUIC工具)
首先要实现PyQt5界面的快速快发,需要两个工具QtDesigner与PyUIC。它们功能分别是界面设计与界面代码转换工具。 (1) 打开PyCharm中file的setting,定位到Tools下的External Tools,如图1所示。 图1 扩展工具添加界面 (2) 通过加号对两个工具的环境添加,具体的添加如图2所示。在配置两个工具之前需要安装pyqt5_tools,安装的命令
pip install PyQt5-tools QtDesigner环境配置,设置名称为QtDesigne
深度学习图绘制工具汇总
1. NN-SVG 麻省理工学院弗兰克尔生物工程实验室, 该实验室开发可视化和机器学习工具用于分析生物数据。
GitHub地址:https://github.com/zfrenchee
画图工具体验地址:http://alexlenail.me/NN-SVG/ 2. PlotNeuralNet 萨尔大学计算机科学专业的一个学生开发。
https://github.com/HarisIqbal88/PlotNeuralNet 用LaTex语言编辑,所以可以发挥的空间比较大
相似工具:htt
ArcGIS 许可管理器常见问题(持续更新中……)
版权声明:未经作者允许,不得私自转载 https://blog.csdn.net/weixin_44616652/article/details/86749630 一、【单机版】 1.1、ArcMap 1.2、ArcGIS Pro 错误一 ArcGIS Pro单机许可安装授权,在Configure Authorization界面报“This functionality is not available without the ArcGIS Pro Licensing Service being
ArcGIS 发布服务的那些事儿——(1)动态服务
版权声明:未经作者允许,不得私自转载 https://blog.csdn.net/weixin_44616652/article/details/89454557 ArcGIS 现在的桌面产品有ArcMap 和ArcGIS Pro,它们都可以发布服务,但是有些许异同,从这篇文章开始,将开始记录ArcMap 和ArcGIS Pro在发布服务上的一些步骤与心得,将持续更新,欢迎关注。 从本文将开始记录相同服务在ArcMap端和ArcGIS Pro端发布的异同及不同方法,包括ArcTool Box和
【面试】我是如何在面试别人Spring事务时“套路”对方的
记一次“带套路”的面试 与这个面试者聊了一会儿,咦,发现他水平还可以,我内心有点儿喜出望外,终于遇到一个“合格”的“陪聊者”了,我要用Spring事务“好好套路”他一下。 我:你在开发中,一般都把事务加到哪一层? 他:都加到Service层。 我:现在基本都是基于注解的配置了,那和事务相关的注解是哪个? 他:我不太会读那个单词,就是以@T开头的那个。 我:我明白你的意思,就是@Transactional。 他:是的。 我:与自己写代码来开启和提交事务相比,(先给他来个小的套路),这种通过注解来
阿里P8架构师带你深入理解JAVA中的NIO
前言: 传统的 IO 流还是有很多缺陷的,尤其它的阻塞性加上磁盘读写本来就慢,会导致 CPU 使用效率大大降低。 所以,jdk 1.4 发布了 NIO 包,NIO 的文件读写设计颠覆了传统 IO 的设计,采用通道+缓存区使得新式的 IO 操作直接面向缓存区,并且是非阻塞的,对于效率的提升真不是一点两点,我们一起来看看。 通道 Channel 我们说过,NIO 的核心就是通道和缓存区,所以它们的工作模式是这样的: 通道有点类似 IO 中的流,但不同的是,同一个通道既
今日推荐
周排行