数据预处理—离散化 - 代码天地

数据预处理—离散化

其他 2018-10-25 20:21:14 阅读次数: 0

离散化，把无限空间中有限的个体映射到有限的空间中去，以此提高算法的时空效率。

通俗的说，离散化是在不改变数据相对大小的条件下，对数据进行相应的缩小。

举个栗子：

四个数：1,999999,345,34

离散化完后为：1,4,3,2

也就是说对于给的数，我们不需要知道他的值具体是多少，只需要知道他们之间的相对大小。

这里介绍离散化的两种方法：

一、

#include<bits/stdc++.h>
using namespace std;
const int N = 1e5+10;
int t[N],a[N],n;
int main()
{
	scanf("%d",&n);
	for(int i=1;i<=n;i++){
		scanf("%d",&a[i]);
		t[i]=a[i];
	}
	sort(t+1,t+1+n);
	int m=unique(t+1,t+1+n)-(t+1);
	for(int i=1;i<=n;i++)
	a[i]=lower_bound(t+1,t+m+1,a[i])-t;
}

unique函数是C++自带的函数，对一个数组中的元素去重，在后面减去数组的首地址即得去重后的元素个数。

二、

#include<bits/stdc++.h>
using namespace std;
const int N=1e5+10; 
struct node{
	int v,id;
	bool operator < (const node a)const{
	   return v<a.v;
	}
}a[N]; 
int n,rank[N];
int main()
{
	scanf("%d",&n);
	for(int i=1;i<=n;i++){
		scanf("%d",&a[i].v);
		a[i].id=i;
	}
	sort(a+1,a+1+n);
	for(int i=1;i<=n;i++){
		rank[a[i].id]=i;
	}
}

这个方法不能用于有重复元素的例子中。

猜你喜欢

转载自blog.csdn.net/curry___/article/details/83115690

数据预处理—离散化

python数据预处理：数据离散化

Python数据预处理 - 连续数据离散化

acm数据预处理 —— 离散化的两种方法

机器学习 - 数据预处理中的特征离散化方法

学习笔记（六）数据预处理之数据变换与数据离散化

【数据分析】数据预处理—数据离散化、信息熵

23.数据预处理之数据离散化处理

数据处理----离散化

Python实现数据预处理-离散值处理

4.pandas数据预处理（下）（标准化、哑变量、离散化、无监督分箱）（完）

数据预处理——正则化

数据预处理--持久化预处理后的数据

数据预处理 | 使用 Pandas 进行数值型数据的标准化归一化离散化二值化

机器学习入门-数据预处理-连续数据离散化(进行分段标记处理) 1.hist(Dataframe格式直接画直方图)

特征处理之数据离散化

pandas高级处理-数据离散化

数据预处理——标准化

数据预处理之标准化

数据预处理--归一化

数据预处理PCA，标准化

数据预处理-归一化

数据预处理；初始化权重

数据预处理之归一化

数据归一化预处理

Aizu-0531-Paint Color(离散化预处理+BFS或DFS求连通块个数)

数据预处理：半结构化数据处理

离散化的处理

pandas：数据离散化与离散化数据的后期处理(one-hot)

利用python对包含离散型特征和连续型特征的数据进行预处理

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)