hive--row_number（）组内排序函数--慧智精品网

网站整合营销

hive--row_number（）组内排序函数

1.要解决的问题

相对⽤⼀次请求得到的item的粗排进⾏排序，平时得到的粗排结果是[0,1]之间的⼀个值，但是想将其转换为index的形式。

2.解决⽅案

hive中的函数row_number()

使⽤⽅法：

select COLUMN_A,COLUMN_B,

row_number() OVER (partition BY COLUMN_A ORDER BY COLUMN_B ASC/DESC) rn

from table

rn 是排序的别名执⾏时每组的编码从1开始

partition by：类似hive的建表，分区的意思；COLUMN_A 是分组字段

order by ：排序，默认是升序，加desc降序；COLUMN_B 是排序字段

在分组内，进⾏排序。

3.结果

分析：

针对我的这个问题，COLUMN_A字段就表⽰⼀次请求，对⼀次请求召回的item粗排的结果，排序依据是按照COLUMN_B，就是粗排的得分，产⽣的结果是rn。

左边⼀列是得分，右边⼀列是排序结果：

问题：如果order by中的col2中元素相同，怎么序号怎么标注？

答：仍然按照顺序排列，但是每次运⾏的结果都不⼀样，⽐如:

col1col2col3rn col1col2col3rn

防晒霜排行榜q122a1q122b1

q122b2　q122a2

q123c3q123c3

q211q1q211q1

q211w2q211w2

q212e3q212e3

4.其他排序的函数

RANK() DENSE_RANK()

先来看个例⼦：

晴的组词select province,city,看眼科哪里好

rank() over (order by people desc) rank,

dense_rank() over (order by people desc) dense_rank,

row_number() over(order by people desc) row_number

from datatable

group by province,city,people;

运⾏结果：

province city rank

dense_rank row_number

浙江杭州 1 1

江苏苏州 2 2

江苏南京 3 3

如图直线ab cd相交于点o3

浙江温州 4 4

江苏某市 4 4

浙江宁波 6 5

江苏某某市 7 6

浙江嘉兴 7 6

主要注意打圈的:

row_number：顺序下来

rank：在遇到数据相同项时，会留下空位5,(第⼀列4,4,6)

dense_rank：在遇到数据相同项时，不会留下空位,(红框内第⼀列,4,4,5)动物给人类的启示

慧智精品网

hive--row_number（）组内排序函数

发表评论

推荐文章

【中国历史十五讲】读书说明与指导(吴树国)

中药泡脚的历史典故

关于司马迁的历史评价

3-真题专练-沈阳历史中考中国古代史-材料解析题

历史上对陶渊明的评价

热门文章

山西汉代政治,文化名人及作品

唐装的起源和历史演变

中国古代史阶段特征

中国历史上的汉朝文化发展

[汉代历史简介]汉代历史故事

历史汉代全部知识点总结

汉代经济发展对中国经济史的影响

汉代的文学体裁

汉源名字来历

简述汉代艺术的基本特征和美学风格

汉代文学的风格和特征

汉代陶瓷知识点归纳总结

汉代经济发展与中外贸易

中国古代史完整版

汉代的科学技术与数学发展

汉代的录囚名词解释

汉代对中国文化的影响-概述说明以及解释

汉代的思想大一统知识点

汉学与宋学的名词解释

汉唐文化交融研究

最新文章

3-真题专练-沈阳历史中考中国古代史-材料解析题

历史上对陶渊明的评价

互动训练B—《汉武帝巩固大一统王朝》

汉代耧车的历史价值

红星照耀中国汉代青铜读书笔记

湖南马王堆汉墓的发掘与研究

标签列表