data_spilt(data, fr=None, num_2_generate=20, fs=None)数据集划分

`data_split`是一个用于将数据集划分为训练集和测试集的函数。它的参数如下： - `data`：输入的数据集，可以是一个列表、数组或其他形式的数据结构。 - `fr`：训练集的比例，默认为`None`，表示使用默认的训练集比例（0.8）。 - `num_2_generate`：如果`fr`为`None`，则使用`num_2_generate`参数生成训练集大小，测试集大小为`data`的长度减去训练集大小。默认值为`20`。 - `fs`：随机数生成器的种子，默认为`None`，表示使用系统时间作为种子。函数的输出是一个长度为2的元组，分别为训练集和测试集。例如： ``` data = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] train, test = data_split(data, fr=0.7) print(train) # [1, 2, 3, 4, 5, 6, 7] print(test) # [8, 9, 10] ``` 在这个例子中，数据集被划分为训练集（70%）和测试集（30%）。

分析代码： def _read_spilt_up_track_file(self): tiles_features = read_inputh_tiles_feature(self.input_path, "trajectory", "Lane") ordinary_track = [] for tiles, features in tiles_features.items(): for feature in features: f_line = MyLine(coordinates=feature['geometry']["coordinates"], properties=feature["properties"]) f_line.line_string.max_speed = feature["properties"]["max_speed"] f_line.line_string.min_speed = feature["properties"]["min_speed"] # 不同tile中轨迹id可能重复，所以加上tileid tile_id_and_lane_id = tiles + "_" + str(f_line.properties["id"]) f_line.line_string.id = tile_id_and_lane_id ordinary_track.append(f_line.line_string) self.tracks[tile_id_and_lane_id] = f_line self.ordinary_tracks_map = STRtree(ordinary_track)

这是一个 Python 类中的一个方法，方法名为 `_read_spilt_up_track_file`，属于私有方法。代码的作用是从指定路径 `input_path` 中读取类型为 "trajectory" 和 "Lane" 的输入瓦片特征，并将其转化为轨迹线段对象，并存储到类的实例变量 `tracks` 中，同时将所有的轨迹线段对象构建成空间索引对象，以便进行位置查询。具体实现的步骤为： 1. 调用 `read_inputh_tiles_feature` 函数读取输入瓦片特征，将返回的字典类型的数据存储到 `tiles_features` 变量中，其中字典的键为瓦片 ID，字典的值为该瓦片中的特征列表。 2. 创建一个空列表 `ordinary_track`，用于存储构建好的轨迹线段对象。 3. 遍历 `tiles_features` 字典，对于每一个瓦片 ID 和特征列表，都进行以下操作： a. 遍历特征列表，对于每一个特征，将其几何坐标、属性信息等构建成一个轨迹线段对象 `f_line`。 b. 设置轨迹线段对象的最大速度和最小速度属性。 c. 将轨迹线段对象的 ID 设置为瓦片 ID 和轨迹 ID 的组合。 d. 将轨迹线段对象的线段存储到 `ordinary_track` 列表中，将轨迹线段对象存储到 `tracks` 字典中。 4. 将 `ordinary_track` 列表构建成 STRtree 空间索引对象，并存储到实例变量 `ordinary_tracks_map` 中。需要注意的是，该方法依赖于 `MyLine` 类和 `read_inputh_tiles_feature` 函数，需要保证它们的正确性并且能够读取到正确的特征数据。另外，该方法没有返回值，因为它直接修改了类的实例变量。

分析以下代码： def _read_spilt_up_track_file(self): tiles_features = read_inputh_tiles_feature(self.input_path, "trajectory", "Lane") ordinary_track = [] for tiles, features in tiles_features.items(): for feature in features: f_line = MyLine(coordinates=feature['geometry']["coordinates"], properties=feature["properties"]) f_line.line_string.max_speed = feature["properties"]["max_speed"] f_line.line_string.min_speed = feature["properties"]["min_speed"] # 不同tile中轨迹id可能重复，所以加上tileid tile_id_and_lane_id = tiles + "_" + str(f_line.properties["id"]) f_line.line_string.id = tile_id_and_lane_id ordinary_track.append(f_line.line_string) self.tracks[tile_id_and_lane_id] = f_line self.ordinary_tracks_map = STRtree(ordinary_track)

这段代码是一个类中的一个方法，方法名为"_read_spilt_up_track_file"。这个方法会读取一个输入路径中的特征文件，并将每个特征转换成一个MyLine对象，然后将其添加到一个名为"ordinary_track"的列表中。同时，这个MyLine对象的id属性被设置为tile_id_and_lane_id，而tile_id_and_lane_id是由tile_id和特征的id组成的字符串。这个id属性可以用于后续的轨迹查询。在这个方法中，还创建了一个名为"tracks"的字典，用于存储每个MyLine对象。这个字典的键是tile_id_and_lane_id，值是对应的MyLine对象。最后，这个方法将ordinary_track中的所有MyLine对象添加到一个名为"ordinary_tracks_map"的STRtree对象中。STRtree是一种空间索引数据结构，用于快速地查询空间范围内的对象。这个"ordinary_tracks_map"对象可以用于后续的轨迹查询。

阅读全文

data_spilt(data, fr=None, num_2_generate=20, fs=None)数据集划分

相关推荐

数据集的划分代码.......................................

划分数据集(1).py

02数据集的划分程序讲义

keras model.fit 解决validation_spilt=num 的问题

f_spilt函数.txt

def spiltDataSet(dataSet, n_folds): fold_size = int(len(dataSet) / n_folds) dataSet_copy = list(dataSet) dataSet_spilt = []

hexonic_pdf_spilt_erge

train_test_spilt

from sklearn.model_selection import train_test_spilt

与ShuffleSplit与tran_test_spilt有什么区别

load_dataset spilt

'NoneType' object has no attribute 'spilt'

Exited with error status 1 Traceback (most recent call last): File "/data/d174f1f3e2e7ddfcbb7446d14585aa33", line 2, in <module> text=s.spilt(" ") AttributeError: 'str' object has no attribute 'spilt'

python spilt

java spilt

数据集

大家在看

读写通达信股票软件二进制dat文件

CMOS反相器的掩膜版图-集成电路版图设计

调制解调文档

Windows系统kb2577795-kb2553549 补丁

ISO/IEC 27005:2022 英文原版

最新推荐

oracle_split_函数_返回数组

Python计算指定日期是今年的第几天(三种方法)

智慧园区3D可视化解决方案PPT(24页).pptx

labelme标注的json转mask掩码图，用于分割数据集 批量转化，生成cityscapes格式的数据集

虚拟串口软件：实现IP信号到虚拟串口的转换

【Python进阶篇】：掌握这些高级特性，让你的编程能力飞跃提升

后端调用ragflow api

IE6下实现PNG图片背景透明的技术解决方案

【欧姆龙触摸屏故障诊断全攻略】

Educoder综合练习—C&C++选择结构

labelme标注的json转mask掩码图，用于分割数据集批量转化，生成cityscapes格式的数据集