d1=raw_taxis['trip_distance'] pd.cut(d1,[0，3，19，29，36],labels=['短程','近程','中程','远程'])。这段代码有什么问题

这段代码有两个问题：

在 pd.cut 函数中，分割点应该是一个列表，而不是多个参数，因此应该将 [0, 3, 19, 29, 36] 改为 (0, 3, 19, 29, 36)。
标签中的第一个标签应该是 '0-3' 或者 '0-3km' 这样更能表达区间的意义，而不是 '短程'。同样地，其他标签也应该更加准确地表达区间的意义。

因此，正确的代码应该是：

d1 = raw_taxis['trip_distance']
pd.cut(d1, (0, 3, 19, 29, 36), labels=['0-3km', '3-19km', '19-29km', '29-36km'])

d1=raw_taxis['trip_distance'] pd.cut(d1, ['0', '5', '15', '26','37'], labels=['短程', '近程', '中程', '远程'])这段代码为什么会出现NAN值

这段代码会出现 NaN 值的原因是因为 pd.cut() 函数中的切分区间 ['0', '5', '15', '26','37'] 中没有包含原始数据 d1 中的某些数值，这些数值就会被标记为 NaN。例如，如果 d1 中存在一个值为 40，那么它就会被标记为 NaN，因为在 ['0', '5', '15', '26','37'] 中没有包含大于 37 的数值。为避免出现 NaN 值，可以将切分区间设置得更大一些，例如 ['0', '10', '20', '30', '40']，或者将 pd.cut() 函数中的参数设置为 include_lowest=True，以确保最小值也被包含在切分区间中，例如 pd.cut(d1, bins=[0, 5, 15, 26, 37], include_lowest=True, labels=['短程', '近程', '中程', '远程'])。

删除“raw_taxis.csv”数据集中total_amount>150的异常值

可以使用 Pandas 库来读取和处理 CSV 文件。你可以使用以下代码来读取“raw_taxis.csv”文件：

import pandas as pd

df = pd.read_csv('raw_taxis.csv')

然后，你可以使用以下代码来删除 total_amount 大于 150 的异常值：

df = df[df['total_amount'] <= 150]

这将创建一个新的 DataFrame，其中只包含 total_amount 小于或等于 150 的行。如果你想在原始 DataFrame 中进行更改，可以使用 inplace 参数：

df.drop(df[df['total_amount'] > 150].index, inplace=True)

这将在原始 DataFrame 中删除所有 total_amount 大于 150 的行。

阅读全文

向AI提问

d1=raw_taxis['trip_distance'] pd.cut(d1,[0，3，19，29，36],labels=['短程','近程','中程','远程'])。这段代码有什么问题

d1=raw_taxis['trip_distance'] pd.cut(d1, ['0', '5', '15', '26','37'], labels=['短程', '近程', '中程', '远程'])这段代码为什么会出现NAN值

删除“raw_taxis.csv”数据集中total_amount>150的异常值

相关推荐

Aythereta_TAXIS_Greece_

new_york_taxis

Final_Project_Taxis_Database_CallCenter_java_database_call_Cente

taxis2_1(p,:)=gen_taxi() 这一行代码对其进行了赋值

taxis2_1变量一直没有内容

那这时taxi2_1会出现问题吗

sudo vi /boot/extlinux/extlinux.conf如何编辑

用python和spark编写出租车数据分析

c语言某市不同车型的出租车3公里的起步价和计费分别是:夏利7元,3公里以外是2.1元/公里;富康8元,3公里以外是2.4元/公里;桑塔纳9元,3公里以外是2.7元/公里,编程:从键盘输入乘车的车型及行车公里数,输出应付车费

蒙特卡洛充电需求

matlab实现出租车分布动态变化

写一个vhdl的出租车计数器

elasticsearch和kibana安装 密码

如何在Delphi TChart控件中设置Y轴的最小值和最大值？

大家在看

富士施乐Fuji Xerox DocuPrint CM215 f 驱动.rar

Python tkinter模块弹出窗口及传值回到主窗口操作详解

ktxToPng.rar

免费下载道客巴巴文档工具

Word文档合并工具，在一段英语后面加一段中文，形成双语对照文本

最新推荐

风光氢储+VSG并网系统仿真【附带参考文献】 仿真控制结构：风光储单独通过逆变器VSG控制并网，然后母线经过整流器+Buck变器连接PEM电解水制氢系统 1、PEM电解水制氢：采用功率外环加电流内环

基于PLC的智能家居环境控制系统设计 ,基于PLC的智能家居; 环境控制; 系统设计,基于PLC的智能家居环境控制系统的设计与实现

微机原理与接口技术复习重点很有用哦.ppt

全面介绍酒店设施的培训纲要

Qt零基础到精通系列：全面提升轮播图开发技能的15堂必修课

创建的conda环境无法配置到pycharm

Java与JS结合实现动态下拉框搜索提示功能

【LVGL快速入门与精通】：10个实用技巧，让你从新手到专家

c++塔防游戏完整源代码

深入探讨Struts2插件的使用方法及工具应用

elasticsearch和kibana安装密码

风光氢储+VSG并网系统仿真【附带参考文献】仿真控制结构：风光储单独通过逆变器VSG控制并网，然后母线经过整流器+Buck变器连接PEM电解水制氢系统 1、PEM电解水制氢：采用功率外环加电流内环