栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

hive substring

hive substring

前几天遇到这么一个需求,有一个字符串,表示用户在网站的访问路径,例如“home>itemdetail>cart>order”格式,当用户访问路径不足8步的时候,返回这个字符串,当访问路径大于8步的时候返回前8步路径。
实现的时候,我首先就想到了substring()函数,但转念一想,我需要截取第8个“>”字符前面的数据,那么我必须要知道这个>在字符串中的位置,中间考虑过几个函数都搞不定,比如instr()只能知道第一个“>”的位置;find_in_set()也不行,跟这个不搭边;regexp_extract()因为正则表达式没写明白放弃了。根据需求百度了一下,还是没找到,找了pdf版HiveSql开发指南,居然也没有符合条件的函数,不过冥冥之中,我感觉到,一定有一个hive内置字符串函数,可以搞定这个问题,于是去翻hive官方文档,地址:https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF

没错!就是这个substring_index()函数,正好符合这个需求。下面是试验sql结果截图:

后记:写这篇博客主要因为百度的时候没找到substring_index()这个函数,在技术文档中也是没找到,所以在这里记录一下,希望有所帮助。

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/724610.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号