pandas提取某一列具有相同规律的数字

时间: 2023-11-04 22:14:19 浏览: 31
可以使用正则表达式来提取具有相同规律的数字列。假设数据框为df,列名为col,数字规律为3个数字-3个数字-4个数字,可以使用以下代码: ``` import re pattern = r'\d{3}-\d{3}-\d{4}' # 正则表达式 df['new_col'] = df['col'].apply(lambda x: re.findall(pattern, str(x))[0] if re.findall(pattern, str(x)) else None) ``` 解释一下代码: 1. `import re`:导入正则表达式模块。 2. `pattern = r'\d{3}-\d{3}-\d{4}'`:定义正则表达式,\d表示数字,{3}表示匹配三个数字,-表示匹配“-”符号。 3. `df['new_col'] = df['col'].apply(lambda x: re.findall(pattern, str(x))[0] if re.findall(pattern, str(x)) else None)`:使用apply函数对col列的每个元素应用lambda函数,lambda函数使用re.findall函数提取符合正则表达式的数字,如果提取到数字则返回第一个数字,否则返回None。最后将提取到的数字存入新的列new_col中。 需要注意的是,如果某些元素中没有符合正则表达式的数字,则会返回None。如果需要保留原始数据,可以将lambda函数中的else部分改为返回原始数据。
相关问题

pandas提取某一列有规律的数字

假设有一个DataFrame df,其中有一列数据如下: ``` col 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 10 11 11 12 ``` 如果要提取这一列中的偶数,可以使用如下代码: ```python df[df['col'] % 2 == 0]['col'] ``` 输出结果为: ``` 1 2 3 4 5 6 7 8 9 10 11 12 Name: col, dtype: int64 ``` 同理,如果要提取这一列中的奇数,可以使用如下代码: ```python df[df['col'] % 2 == 1]['col'] ``` 输出结果为: ``` 0 1 2 3 4 5 6 7 8 9 10 11 Name: col, dtype: int64 ```

pandas提取某一列的有规律的字符串

如果要提取某一列的有规律的字符串,可以使用正则表达式和pandas中的str方法结合。 例如,假设有如下的DataFrame: ``` import pandas as pd df = pd.DataFrame({ 'name': ['John Doe', 'Jane Smith', 'Bob Johnson'], 'age': [30, 25, 40], 'email': ['john.doe@example.com', 'jane.smith@example.com', 'bob.johnson@example.com'] }) ``` 现在想要从email列中提取出所有的邮箱域名,可以使用正则表达式和str.extract方法: ``` df['email_domain'] = df['email'].str.extract(r'@([^.]+)\.') ``` 这里的正则表达式@([^.]+)\.表示匹配@符号后面的一段非点号字符,直到遇到一个点号为止,也就是邮箱域名。extract方法会返回所有匹配的结果,因此需要使用[0]来取出第一个匹配结果。 运行上述代码后,DataFrame会变成这样: ``` name age email email_domain 0 John Doe 30 john.doe@example.com example 1 Jane Smith 25 jane.smith@example.com example 2 Bob Johnson 40 bob.johnson@example.com example ``` 可以看到,email_domain列中提取出了所有的邮箱域名。

相关推荐

最新推荐

recommend-type

pandas对指定列进行填充的方法

下面小编就为大家分享一篇pandas对指定列进行填充的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
recommend-type

如何使用pandas读取txt文件中指定的列(有无标题)

主要介绍了如何使用pandas读取txt文件中指定的列(有无标题),具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
recommend-type

pandas.DataFrame删除/选取含有特定数值的行或列实例

今天小编就为大家分享一篇pandas.DataFrame删除/选取含有特定数值的行或列实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
recommend-type

新建文本文档.txt

新建文本文档
recommend-type

开源Git gui工具Fork

开源Git gui工具Fork,CSDN能找到教程,但是资料不多,推荐用Tortoise
recommend-type

zigbee-cluster-library-specification

最新的zigbee-cluster-library-specification说明文档。
recommend-type

管理建模和仿真的文件

管理Boualem Benatallah引用此版本:布阿利姆·贝纳塔拉。管理建模和仿真。约瑟夫-傅立叶大学-格勒诺布尔第一大学,1996年。法语。NNT:电话:00345357HAL ID:电话:00345357https://theses.hal.science/tel-003453572008年12月9日提交HAL是一个多学科的开放存取档案馆,用于存放和传播科学研究论文,无论它们是否被公开。论文可以来自法国或国外的教学和研究机构,也可以来自公共或私人研究中心。L’archive ouverte pluridisciplinaire
recommend-type

MATLAB柱状图在信号处理中的应用:可视化信号特征和频谱分析

![matlab画柱状图](https://img-blog.csdnimg.cn/3f32348f1c9c4481a6f5931993732f97.png) # 1. MATLAB柱状图概述** MATLAB柱状图是一种图形化工具,用于可视化数据中不同类别或组的分布情况。它通过绘制垂直条形来表示每个类别或组中的数据值。柱状图在信号处理中广泛用于可视化信号特征和进行频谱分析。 柱状图的优点在于其简单易懂,能够直观地展示数据分布。在信号处理中,柱状图可以帮助工程师识别信号中的模式、趋势和异常情况,从而为信号分析和处理提供有价值的见解。 # 2. 柱状图在信号处理中的应用 柱状图在信号处理
recommend-type

HSV转为RGB的计算公式

HSV (Hue, Saturation, Value) 和 RGB (Red, Green, Blue) 是两种表示颜色的方式。下面是将 HSV 转换为 RGB 的计算公式: 1. 将 HSV 中的 S 和 V 值除以 100,得到范围在 0~1 之间的值。 2. 计算色相 H 在 RGB 中的值。如果 H 的范围在 0~60 或者 300~360 之间,则 R = V,G = (H/60)×V,B = 0。如果 H 的范围在 60~120 之间,则 R = ((120-H)/60)×V,G = V,B = 0。如果 H 的范围在 120~180 之间,则 R = 0,G = V,B =
recommend-type

JSBSim Reference Manual

JSBSim参考手册,其中包含JSBSim简介,JSBSim配置文件xml的编写语法,编程手册以及一些应用实例等。其中有部分内容还没有写完,估计有生之年很难看到完整版了,但是内容还是很有参考价值的。