Hive虚拟列(翻译自Hive wiki)

虚拟列

Hive 0.8.0支持两个虚拟列:

 INPUT__FILE__NAME, mapper任务的输出文件名。

 BLOCK__OFFSET__INSIDE__FILE, 当前全局文件的偏移量。对于块压缩文件,就是当前块的文件偏移量,即当前块的第一个字节在文件中的偏移量。

简单例子

select INPUT__FILE__NAME, key, BLOCK__OFFSET__INSIDE__FILE from src;

select key, count(INPUT__FILE__NAME) from src group by key order by key;

select * from src where BLOCK__OFFSET__INSIDE__FILE > 12000 order by key;

翻译自 https://cwiki.apache.org/confluence/display/Hive/LanguageManual+VirtualColumns

原文地址:https://www.cnblogs.com/ggjucheng/p/2862402.html