6．从原始数据集中生成一个新数据表df_loc并显示前5行。该表有以下属性：station id（它的数据来自start station id和end station id）、station name（它的数据来自start station name和end station name）、station latitude（它的数据来自start station latitude和end station latitude）、station longitude（它的数据来自start station longitude和end station longitude）（提示：转换后会出现重复记录，可用dataframe.drop_duplicates(subset=‘列1’) 表示删除dataframe中列1中有重复的值所在的行并保留重复值中第一行）

时间: 2023-06-09 22:05:05 浏览: 78

好的，以下是回答：首先要将原始数据集中的start station id、end station id、start station name、end station name、start station latitude、end station latitude、start station longitude、end station longitude这几个属性获取出来。然后，将start station id和end station id合并成一个新的station id属性，将start station name和end station name合并成一个新的station name属性，将start station latitude和end station latitude合并成一个新的station latitude属性，将start station longitude和end station longitude合并成一个新的station longitude属性。接着，按照station id排序去除重复记录并保留第一行，得到新的数据表df_loc。具体的实现方法如下： ``` # 读取原始数据集 import pandas as pd df = pd.read_csv("citibike_tripdata.csv") # 获取需要的属性 start_id = df["start station id"] end_id = df["end station id"] start_name = df["start station name"] end_name = df["end station name"] start_lat = df["start station latitude"] end_lat = df["end station latitude"] start_lon = df["start station longitude"] end_lon = df["end station longitude"] # 合并属性 station_id = pd.concat([start_id, end_id], ignore_index=True) station_name = pd.concat([start_name, end_name], ignore_index=True) station_lat = pd.concat([start_lat, end_lat], ignore_index=True) station_lon = pd.concat([start_lon, end_lon], ignore_index=True) # 将属性合并成一个新的数据表 df_loc = pd.DataFrame({"station id": station_id, "station name": station_name, "station latitude": station_lat, "station longitude": station_lon}) # 按照station id排序并去重 df_loc = df_loc.sort_values(by=["station id"]) df_loc = df_loc.drop_duplicates(subset=["station id"], keep="first") # 显示前5行 print(df_loc.head(5)) ```

相关推荐

pandas数据选取：df[] df.loc[] df.iloc[] df.ix[] df.at[] df.iat[]

Oracle数据表中的死锁情况解决方法

Python数据结构之顺序表的实现代码示例

7． 通过对站点经纬的分析，发现站点3036是一个异常数据。在原始数据表和df_loc中删除站点为3036的错误数据，显示各数据集的行列数。

本关任务:获取鸢尾花数据集前30行并转换成dataframe,然后让每一行都减去第一行的

创建一个不带参数的存储过程 pro_dept_insert,实现向dept表添加一条记录，并显示：输出 添加记录成功！

python输入一个id，检查是否存在在reader.xlsx文件，并修改相应数据

pandas找到表中名字为Id的下一行数据

怎么用python求一个文件夹中所有excel表中指定列和指定行的数据的方差和平均值

请帮我写一段 将从df表中筛选出来的行中B列的值全设为5 的python代码

定位数据框df的行和列的显式索引分别为“0”和“sepal_length”，修改其内容为7.0，并显示数据框df的前5行

利用Python，请完成两个数据表展示，其中有一个是自选csv 文件

df_taobao['province'] = df_taobao.item_loc.apply(lambda x: x.split()[0])

帮我写一段Python 代码，有一个数据表，有姓名和时间，帮我删除时间在2023年3月31日以后的行

df_view = df[df['opCode'] == '203']怎么添加一列新数据不出现SettingWithCopyWarning

python怎么求excel表格某一行的从某一列到某一列的数据的平均值，并将结果输出为新的excek表格

生成把表格里的20行5列的参数表按行写到20个.dat文件中，dat格式参数名空格数值

python如何从一个dataframe提取相应的行组成一个新的dataframe_从Excel到Python：最常用的36个Pandas函数！最完整的Pandas教程！...

added = df_used.loc[df_used['pre_score'].isna(), :]什么意思

df_stock.loc[index+1:, 'buy_price'] = 0，其中index是时间，如果想表示，下面一个index设置值为0，这种表示有错么

最新推荐

pandas数据选取：df[] df.loc[] df.iloc[] df.ix[] df.at[] df.iat[]

yolov5-face-landmarks-opencv

zigbee-cluster-library-specification

管理建模和仿真的文件

实现实时数据湖架构：Kafka与Hive集成

2． 通过python绘制y=e-xsin(2πx)图像

JSBSim Reference Manual

"互动学习：行动中的多样性与论文攻读经历"

实现实时监控告警系统：Kafka与Grafana整合

导入numpy库，创建两个包含9个随机数的3*3的矩阵，将两个矩阵分别打印出来，计算两个数组的点积并打印出来。（random.randn()、dot（）函数）

7．通过对站点经纬的分析，发现站点3036是一个异常数据。在原始数据表和df_loc中删除站点为3036的错误数据，显示各数据集的行列数。

创建一个不带参数的存储过程 pro_dept_insert,实现向dept表添加一条记录，并显示：输出添加记录成功！

请帮我写一段将从df表中筛选出来的行中B列的值全设为5 的python代码

2．通过python绘制y=e-xsin(2πx)图像