数据处理----离散化

离散化的定义：离散化，把无限空间中有限的个体映射到有限的空间中去，以此提高算法的时空效率。（by百度百科）

为什么要离散化处理？
打个比方，某个题目告诉你有10^4个数，每个数大小不超过10^10，要你对这些数进行操作，需要开10^10的数组，当然这是不可能的，但是10^4的范围就完全没问题。

我们可以把这些数映射到一个新的数组中，只改变元素大小，但是不改变其相对大小。

所以离散化只能用在只考虑元素的相对大小，而不考虑元素本身的问题。

离散化操作用到了三个函数 sort, unique, lower_bound.

具体步骤看代码：

#include<bits/stdc++.h>
using namespace std;
const int N=1E5+7;
int arr1[N],arr2[N];
int rank[N];//离散化数组 
int main(){
    int n;
    cin>>n;
    for(int i=1;i<=n;i++) {
        cin>>arr1[i]; 
        arr2[i]=arr1[i];
    }
    sort(arr2+1,arr2+1+n);//首先对arr2排序 
    int len=unique(arr2+1,arr2+1+n)-arr2-1;//然后是去重以及去重后的大小 
    for(int i=1;i<=n;i++){
        rank[i]=lower_bound(arr2+1,arr2+1+len,arr1[i])-(arr2+1);//对输入的每个元素，在排序去重后的数组中查找它的相对位置，用它的想对位置来代表他的值 
    }
    for(int i=1;i<=n;i++){
        cout<<rank[i]<<endl;
    }
    return 0;
}

我们还可以直接用map来实现离散化，map里有个find函数，map.find(x)表示查找map中x是否出现过，如果没出现过，返回map.end()，否则返回的是x所在位置的迭代器。即iterator.

int pos=0;
int get(int x){
    if(mp.find(x)==mp.end()) return mp[x]=pos++;
    return mp[x];
}

二维坐标离散化（待补）