数据处理----离散化

离散化的定义:离散化,把无限空间中有限的个体映射到有限的空间中去,以此提高算法的时空效率。(by百度百科)

为什么要离散化处理?
打个比方,某个题目告诉你有10^4个数,每个数大小不超过10^10,要你对这些数进行操作,需要开10^10的数组,当然这是不可能的,但是10^4的范围就完全没问题。

我们可以把这些数映射到一个新的数组中,只改变元素大小,但是不改变其相对大小。

所以离散化只能用在只考虑元素的相对大小,而不考虑元素本身的问题。

离散化操作用到了三个函数 sort, unique, lower_bound.

具体步骤看代码:

#include<bits/stdc++.h>
using namespace std;
const int N=1E5+7;
int arr1[N],arr2[N];
int rank[N];//离散化数组 
int main(){
    int n;
    cin>>n;
    for(int i=1;i<=n;i++) {
        cin>>arr1[i]; 
        arr2[i]=arr1[i];
    }
    sort(arr2+1,arr2+1+n);//首先对arr2排序 
    int len=unique(arr2+1,arr2+1+n)-arr2-1;//然后是去重以及去重后的大小 
    for(int i=1;i<=n;i++){
        rank[i]=lower_bound(arr2+1,arr2+1+len,arr1[i])-(arr2+1);//对输入的每个元素,在排序去重后的数组中查找它的相对位置,用它的想对位置来代表他的值 
    }
    for(int i=1;i<=n;i++){
        cout<<rank[i]<<endl;
    }
    return 0;
} 
 

 我们还可以直接用map来实现离散化,map里有个find函数,map.find(x)表示查找map中x是否出现过,如果没出现过,返回map.end(),否则返回的是x所在位置的迭代器。即iterator.

int pos=0;
int get(int x){ if(mp.find(x)==mp.end()) return mp[x]=pos++; return mp[x]; }

二维坐标离散化(待补)

原文地址:https://www.cnblogs.com/Accepting/p/12630329.html