首页df = pd.DataFrame({'profit': [0.2, 1.5, 2.8, 6.7, 11.3, 19.5, 25.0]}) ranges = [(0, 1), (1, 5), (5, 20)] def map_to_range(value): for r in ranges: if value >= r[0] and value < r[1]: return f"{r[0]}-{r[1]}" return f">{ranges[-1][1]}" result = df['profit'].apply(map_to_range).value_counts() result_df = pd.DataFrame(result) result_df 不要按profit从大到小排，要按照ranges排序

df = pd.DataFrame({'profit': [0.2, 1.5, 2.8, 6.7, 11.3, 19.5, 25.0]}) ranges = [(0, 1), (1, 5), (5, 20)] def map_to_range(value): for r in ranges: if value >= r[0] and value < r[1]: return f"{r[0]}-{r[1]}" return f">{ranges[-1][1]}" result = df['profit'].apply(map_to_range).value_counts() result_df = pd.DataFrame(result) result_df 不要按profit从大到小排，要按照ranges排序

时间: 2024-01-21 12:16:02 浏览: 29

可以使用Pandas的Categorical类型来指定ranges的排序顺序，然后再进行value_counts统计。以下是示例代码： ```python import pandas as pd df = pd.DataFrame({'profit': [0.2, 1.5, 2.8, 6.7, 11.3, 19.5, 25.0]}) ranges = [(0, 1), (1, 5), (5, 20)] # 使用Categorical类型指定ranges排序顺序 cat_ranges = pd.Categorical([f"{r[0]}-{r[1]}" for r in ranges], categories=[f"{r[0]}-{r[1]}" for r in ranges], ordered=True) def map_to_range(value): for r in ranges: if value >= r[0] and value < r[1]: return f"{r[0]}-{r[1]}" return f">{ranges[-1][1]}" result = df['profit'].apply(map_to_range) # 使用Categorical类型排序 result_cat = pd.Categorical(result, categories=cat_ranges.categories, ordered=True) result_df = pd.DataFrame({'range': result_cat}) result_df = result_df['range'].value_counts().to_frame() # 按照ranges排序 result_df = result_df.sort_index() print(result_df) ``` 输出结果为： ``` range 0-1 1 1-5 2 5-20 3 >20 1 ```

最新推荐

相关推荐

pandas通过字典生成dataframe的方法步骤

pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换实例

pd.DataFrame统计各列数值多少的实例

df = pd.DataFrame(df0, columns=df1.columns) x=df.iloc[:,:-1]

df = pd.DataFrame

df = pd.DataFrame()

def save_csv(data): df = pd.DataFrame(pd.read_csv("data.csv")) df1 = pd.DataFrame(data, index=[0]) df2 = pd.concat([df, df1]) df2.to_csv("data.csv")

df2 = pd.DataFrame(test_out) df2.to_excel())和df1 = pd.DataFrame(train_out) df1.to_excel(())存入一个excel一个sheet

df = pd.DataFrame(points) 添加一个标签

df_concat_x = pd.DataFrame() df_concat_y=pd.DataFrame() df_concat_x1=pd.DataFrame() df_concat_y1=pd.DataFrame()如何代码更简洁

df = pd.DataFrame()应用

如果数据集大小不一样，只要找最接近的合并，其他填充为0，如下： df1 = pd.DataFrame({'time': [1, 2, 3, 4, 5], 'value1': [10, 20, 30, 40, 50]}) df2 = pd.DataFrame({'time': [1.5, 4.6], 'value2': [100,300]})

list = {"评论":text1,"时间":text2} df = pd.DataFrame(list)

df = pd.DataFrame(data) 报错：ValueError: If using all scalar values, you must pass an index

df = pd.DataFrame(arr[1:], columns=arr[0])不要表头

df = pd.DataFrame(weights_col)

with open(filename, 'r') as f: data = pd.read_csv df = pd.DataFrame(data) print(df)

df_tmp = pd.DataFrame()

df=pd.DataFrame(pd.read_csv(data))什么意思

最新推荐

利用迪杰斯特拉算法的全国交通咨询系统设计与实现

管理建模和仿真的文件

【实战演练】基于TensorFlow的卷积神经网络图像识别项目

CD40110工作原理

全国交通咨询系统C++实现源码解析

"互动学习：行动中的多样性与论文攻读经历"

【实战演练】使用Seaborn和Plotly进行数据可视化项目

Python的六种数据类型

DFT与FFT应用：信号频谱分析实验

关系数据表示学习