d1=raw_taxis['trip_distance'] pd.cut(d1, ['0', '5', '15', '26','37'], labels=['短程', '近程', '中程', '远程'])这段代码为什么会出现NAN值
时间: 2023-09-30 14:09:14 浏览: 100
Aythereta_TAXIS_Greece_
这段代码会出现 NaN 值的原因是因为 pd.cut() 函数中的切分区间 ['0', '5', '15', '26','37'] 中没有包含原始数据 d1 中的某些数值,这些数值就会被标记为 NaN。例如,如果 d1 中存在一个值为 40,那么它就会被标记为 NaN,因为在 ['0', '5', '15', '26','37'] 中没有包含大于 37 的数值。为避免出现 NaN 值,可以将切分区间设置得更大一些,例如 ['0', '10', '20', '30', '40'],或者将 pd.cut() 函数中的参数设置为 include_lowest=True,以确保最小值也被包含在切分区间中,例如 pd.cut(d1, bins=[0, 5, 15, 26, 37], include_lowest=True, labels=['短程', '近程', '中程', '远程'])。
阅读全文