hive sql 正则 字段长度大于1小于5
时间: 2024-02-05 22:11:16 浏览: 163
可以使用正则表达式来匹配字段长度大于1小于5的字符串,例如:
```
SELECT *
FROM table_name
WHERE col_name RLIKE '^.{2,4}$';
```
其中,`col_name`是要匹配的字段名,`^.{2,4}$`是正则表达式,表示字符串长度在2到4之间。`RLIKE`是Hive中用于匹配正则表达式的函数。
相关问题
用hive SQL写个字段去除空格后用正则匹配手机号的代码
### 回答1:
```
SELECT
regexp_replace(trim(column_name),'^(1[3|4|5|7|8][0-9]{9})|(\\+861[3|4|5|7|8][0-9]{9})$') as phone_number
FROM table_name;
```
说明:
- `trim(column_name)` 用来去除前后空格。
- `regexp_replace(trim(column_name),'^(1[3|4|5|7|8][0-9]{9})|(\\+861[3|4|5|7|8][0-9]{9})$')` 用来替换匹配到的手机号。正则表达式`^(1[3|4|5|7|8][0-9]{9})|(\\+861[3|4|5|7|8][0-9]{9})$` 匹配11位手机号码或者国内手机号前加+86的手机号码。
- `as phone_number` 用来给查询结果起别名。
- `FROM table_name` 指定查询的表。
注意:
- 确保hive 版本支持正则函数
- 更改表名和字段名
- 更改正则表达式根据你的需要。
### 回答2:
在Hive SQL中,我们可以使用正则表达式函数和字符串函数来实现字段去除空格后匹配手机号的代码。
首先,使用正则表达式函数`regexp_replace`去除字段中的空格,然后使用字符串函数`regexp_extract`提取匹配的手机号。
以下是代码示例:
```sql
SELECT col_name
FROM table_name
WHERE regexp_extract(regexp_replace(col_name, '\\s', ''), '(13[0-9]|14[579]|15[0-35-9]|16[6]|17[0135678]|18[0-9]|19[89])\\d{8}', 0) != '';
```
其中,`col_name`代表要匹配的字段名,`table_name`代表表名。
代码中使用了`regexp_replace(col_name, '\\s', '')`去除字段中的所有空格。反斜杠需要使用两个,因为在字符串中需要转义。
然后,将去除空格的结果作为第一个参数传递给`regexp_extract`函数,使用`'(13[0-9]|14[579]|15[0-35-9]|16[6]|17[0135678]|18[0-9]|19[89])\d{8}'`作为正则表达式匹配手机号的模式。
最后,通过判断提取结果是否为空字符串,来筛选出匹配的手机号。
这样,我们就可以通过以上代码在Hive SQL中实现字段去除空格后匹配手机号的操作。
hivesql 判断string字段包含数字
你可以使用Hive的正则表达式函数`regexp_extract`来判断一个字符串字段是否包含数字。具体操作如下:
```sql
SELECT
CASE WHEN regexp_extract(your_string_field, '\\d+', 0) != '' THEN '包含数字' ELSE '不包含数字' END
FROM your_table;
```
其中,`\\d+`表示匹配一个或多个数字,`0`表示选取第一个匹配的结果。如果结果不为空,则说明该字符串包含数字,反之则不包含数字。
阅读全文