用hive SQL写个字段去除空格后用正则匹配手机号的代码
时间: 2023-08-31 13:40:56 浏览: 144
各种情况手机号清洗udf函数(hive impala)
### 回答1:
```
SELECT
regexp_replace(trim(column_name),'^(1[3|4|5|7|8][0-9]{9})|(\\+861[3|4|5|7|8][0-9]{9})$') as phone_number
FROM table_name;
```
说明:
- `trim(column_name)` 用来去除前后空格。
- `regexp_replace(trim(column_name),'^(1[3|4|5|7|8][0-9]{9})|(\\+861[3|4|5|7|8][0-9]{9})$')` 用来替换匹配到的手机号。正则表达式`^(1[3|4|5|7|8][0-9]{9})|(\\+861[3|4|5|7|8][0-9]{9})$` 匹配11位手机号码或者国内手机号前加+86的手机号码。
- `as phone_number` 用来给查询结果起别名。
- `FROM table_name` 指定查询的表。
注意:
- 确保hive 版本支持正则函数
- 更改表名和字段名
- 更改正则表达式根据你的需要。
### 回答2:
在Hive SQL中,我们可以使用正则表达式函数和字符串函数来实现字段去除空格后匹配手机号的代码。
首先,使用正则表达式函数`regexp_replace`去除字段中的空格,然后使用字符串函数`regexp_extract`提取匹配的手机号。
以下是代码示例:
```sql
SELECT col_name
FROM table_name
WHERE regexp_extract(regexp_replace(col_name, '\\s', ''), '(13[0-9]|14[579]|15[0-35-9]|16[6]|17[0135678]|18[0-9]|19[89])\\d{8}', 0) != '';
```
其中,`col_name`代表要匹配的字段名,`table_name`代表表名。
代码中使用了`regexp_replace(col_name, '\\s', '')`去除字段中的所有空格。反斜杠需要使用两个,因为在字符串中需要转义。
然后,将去除空格的结果作为第一个参数传递给`regexp_extract`函数,使用`'(13[0-9]|14[579]|15[0-35-9]|16[6]|17[0135678]|18[0-9]|19[89])\d{8}'`作为正则表达式匹配手机号的模式。
最后,通过判断提取结果是否为空字符串,来筛选出匹配的手机号。
这样,我们就可以通过以上代码在Hive SQL中实现字段去除空格后匹配手机号的操作。
阅读全文