首页df = pd.DataFrame({'profit': [0.2, 1.5, 2.8, 6.7, 11.3, 19.5, 25.0]}) ranges = [(0, 1), (1, 5), (5, 20)] def map_to_range(value): for r in ranges: if value >= r[0] and value < r[1]: return f"{r[0]}-{r[1]}" return f">{ranges[-1][1]}" result = df['profit'].apply(map_to_range).value_counts() result_df = pd.DataFrame(result) result_df 不要按profit从大到小排，要按照index排序

df = pd.DataFrame({'profit': [0.2, 1.5, 2.8, 6.7, 11.3, 19.5, 25.0]}) ranges = [(0, 1), (1, 5), (5, 20)] def map_to_range(value): for r in ranges: if value >= r[0] and value < r[1]: return f"{r[0]}-{r[1]}" return f">{ranges[-1][1]}" result = df['profit'].apply(map_to_range).value_counts() result_df = pd.DataFrame(result) result_df 不要按profit从大到小排，要按照index排序

时间: 2023-12-18 15:02:33 浏览: 58

pandas通过字典生成dataframe的方法步骤

1、将一个字典输入：该字典必须满足：value是一个list类型的元素，且每一个key对应的value长度都相同：（以该字典的key为columns） >>> import pandas as pd >>> a = [1,2,3,4,5] >>> b = ["a","b","c"] >>> c = 1 >>> df = pd.DataFrame({"A":a,"B":b,"C":c}) Traceback (most recent call last): ValueError: arrays must all be same length >>> df = pd.DataFrame([a

可以使用 `sort_index()` 方法来按照 index 排序，修改代码如下： ``` python import pandas as pd df = pd.DataFrame({'profit': [0.2, 1.5, 2.8, 6.7, 11.3, 19.5, 25.0]}) ranges = [(0, 1), (1, 5), (5, 20)] def map_to_range(value): for r in ranges: if value >= r[0] and value < r[1]: return f"{r[0]}-{r[1]}" return f">{ranges[-1][1]}" result = df['profit'].apply(map_to_range).value_counts() result_df = pd.DataFrame(result) result_df = result_df.sort_index() # 按照 index 排序 print(result_df) ``` 输出结果如下： ``` profit >20 1 0-1 1 1-5 1 5-20 4 ```

阅读全文

最新推荐

相关推荐

从DataFrame中提取出Series或DataFrame对象的方法

pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换实例

df = pd.DataFrame(df0, columns=df1.columns) x=df.iloc[:,:-1]

df = pd.DataFrame

解释df = pd.DataFrame(data)

df = pd.DataFrame()

def save_csv(data): df = pd.DataFrame(pd.read_csv("data.csv")) df1 = pd.DataFrame(data, index=[0]) df2 = pd.concat([df, df1]) df2.to_csv("data.csv")

df2 = pd.DataFrame(test_out) df2.to_excel())和df1 = pd.DataFrame(train_out) df1.to_excel(())存入一个excel一个sheet

df = pd.DataFrame(points) 添加一个标签

df_concat_x = pd.DataFrame() df_concat_y=pd.DataFrame() df_concat_x1=pd.DataFrame() df_concat_y1=pd.DataFrame()如何代码更简洁

df = pd.DataFrame.from_dict(data, orient='index')

df = pd.DataFrame()应用

如果数据集大小不一样，只要找最接近的合并，其他填充为0，如下： df1 = pd.DataFrame({'time': [1, 2, 3, 4, 5], 'value1': [10, 20, 30, 40, 50]}) df2 = pd.DataFrame({'time': [1.5, 4.6], 'value2': [100,300]})

list = {"评论":text1,"时间":text2} df = pd.DataFrame(list)

df = pd.DataFrame(data) 报错：ValueError: If using all scalar values, you must pass an index

df = pd.DataFrame(arr[1:], columns=arr[0])不要表头

df = pd.DataFrame(weights_col)

with open(filename, 'r') as f: data = pd.read_csv df = pd.DataFrame(data) print(df)

df_tmp = pd.DataFrame()

最新推荐

StarModAPI: StarMade 模组开发的Java API工具包

管理建模和仿真的文件

R语言数据清洗术：Poisson分布下的异常值检测法

设计一个简易的Python问答程序

PHP疫情上报管理系统开发与数据库实现详解

"互动学习：行动中的多样性与论文攻读经历"

R语言统计推断：掌握Poisson分布假设检验

NX C++二次开发高亮颜色设置的方法

中秋节特献：明月祝福Flash动画素材

关系数据表示学习