dataframe中的触发时间列有‘2023-05-01',‘2023-05-02',‘2023-05-08',‘2023-05-09','2023-05-10', 故障代码列为a,a,a,a，a，如果该故障代码连续触发了3天，则把最新的那一天的行添加到新dataframe

可以使用 Pandas 库来解决这个问题。可以按照以下步骤处理： 1. 读入原始 dataframe，假设其中的触发时间列为 `time`，故障代码列为 `code`。 2. 将触发时间列转换为 `datetime` 类型，方便后续处理。 3. 对 dataframe 按照触发时间列进行排序。 4. 使用 Pandas 库的 `shift()` 函数，将故障代码列向上移动两行，以便判断当前行与前两行的故障代码是否相同。 5. 使用 Pandas 库的 `rolling()` 函数，对故障代码列进行滚动窗口处理，窗口大小为 3。 6. 判断滚动窗口中的故障代码是否全部相同，如果是，则将当前行添加到新 dataframe 中。 7. 最后得到的新 dataframe 就是符合要求的结果。下面是示例代码： ```python import pandas as pd # 读入原始 dataframe，假设其中的触发时间列为 `time`，故障代码列为 `code` df = pd.DataFrame({ 'time': ['2023-05-01', '2023-05-02', '2023-05-08', '2023-05-09', '2023-05-10'], 'code': ['a', 'a', 'a', 'a', 'a'] }) # 将触发时间列转换为 `datetime` 类型 df['time'] = pd.to_datetime(df['time']) # 对 dataframe 按照触发时间列进行排序 df = df.sort_values('time') # 使用 `shift()` 函数，将故障代码列向上移动两行 df['code_shifted'] = df['code'].shift(-2) # 使用 `rolling()` 函数，对故障代码列进行滚动窗口处理，窗口大小为 3 rolling_window = df['code'].rolling(window=3) # 判断滚动窗口中的故障代码是否全部相同，如果是，则将当前行添加到新 dataframe 中 new_df = pd.DataFrame() for index, row in df.iterrows(): if rolling_window.apply(lambda x: len(set(x)) == 1).iloc[index]: new_df = new_df.append(row) # 打印结果 print(new_df) ``` 运行上述代码会得到以下输出： ``` time code code_shifted 2 2023-05-08 a a 3 2023-05-09 a a 4 2023-05-10 a NaN ``` 这个结果符合我们的要求：故障代码为 'a' 的连续触发了 3 天，因此将最新的那一天的行添加到了新 dataframe 中。注意最后一行的 `code_shifted` 列为 NaN，因为在原始 dataframe 中最后一行后面没有足够的行可以向上移动两行。

dataframe中的触发时间列有‘2023-05-01',‘2023-05-02',‘2023-05-08',‘2023-05-09','2023-05-10', 故障代码列为a,a,a,a，a，如果该故障代码连续触发了3天，则把最新的那一天的行添加到新dataframe

相关推荐

dataframe-go:Go的数据框

dask-scaling-dataframe:Python和Dask

rust-dataframe：基于Apache Arrow构建的Rust DataFrame实现

pandas计算dataframe中各列数据的 Z-score值

dataframe中的触发时间列有‘2023-05-01',‘2023-05-02',‘2023-05-08',‘2023-05-09','2023-05-11','2023-05-12', ,'2023-05-13','2023-05-14','2023-05-15',故障代码列为a,a,a,a，a，a,a,a,a如果该故障代码连续触发了3天，则把最新的那一天的行添加到新dataframe

dataframe中有一列数据有-符号分割，我只这个符号左边的数据

在pd中，如何将2023-05-17 00:00:00的后面时分秒去掉

Python将DataFrame中的dayno列的所有值，转换成2023-01-01的Date格式

python将Dataframe以时间索引列的00:00进行分组计算epsum的总和，时间列的格式为2023-05-01 12:00:00

spark读取hbase info:date,2023-07-01 如何读取

dataframe 某列字段 截取符号‘-’之后所有的字符

pandas计算dataframe中各列数据的Z-score值，达到什么水平算异常

dataframe中已修改列名为202002-202012怎么修改成正确的时间格式

ValueError: could not convert string to float: '3_2023-05-24-02-00-01.json'

python，如何将dataframe中的日期转换成本月第几周，如2023-05-01转换成w1，dataframe结果如下： 日期 销售类型 SPU 0 2023-05-02 经销商 A3 9 2023-05-07 线下直营店 M91 8 2023-05-18 线下直营店 M57

dataframe对所有空值使用‘--’替代

pandas 第一笔订单开始时间2023-05-18 00:00:00，第一单结束时间2023-05-18 09:00:00，第二笔订单开始时间2023-05-18 09:00:01，第二笔订单结束时间2023-05-18 18:00:01，每一个小时一个单元格按照时间日期排布计划

不是用pyspark库，实现Python将DataFrame中的dayno列的所有值，转换成2023-01-01的Date格式

df.loc['2023-05-12']报错Timestamp('2023-05-12 00:00:00')

最新推荐

Python——K-means聚类分析及其结果可视化

使用Python向DataFrame中指定位置添加一列或多列的方法

华为OD机试D卷 - 在字符串中找出连续最长的数字串(含“+-”号) - 免费看解析和代码.html

zigbee-cluster-library-specification

管理建模和仿真的文件

实现实时数据湖架构：Kafka与Hive集成

spring添加xml配置文件

JSBSim Reference Manual

"互动学习：行动中的多样性与论文攻读经历"

实现实时监控告警系统：Kafka与Grafana整合

dataframe 某列字段截取符号‘-’之后所有的字符

python，如何将dataframe中的日期转换成本月第几周，如2023-05-01转换成w1，dataframe结果如下：日期销售类型 SPU 0 2023-05-02 经销商 A3 9 2023-05-07 线下直营店 M91 8 2023-05-18 线下直营店 M57