data[data.Year.isnull()|data.Publisher.isnull()].shape[0]/data.shape[0]
时间: 2023-08-03 17:05:35 浏览: 46
我明白了你的问题。要计算数据集中缺失年份或出版商的记录所占的比例,你可以使用以下代码:
```python
missing_records = data[data.Year.isnull() | data.Publisher.isnull()].shape[0]
total_records = data.shape[0]
missing_ratio = missing_records / total_records
```
其中,`data` 是你的数据集,`Year` 和 `Publisher` 是数据集中的两个列。`shape[0]` 用于获取数据集的行数。
你可以运行这段代码来计算缺失记录所占的比例。请注意,这仅适用于具有名为 `Year` 和 `Publisher` 的列的数据集。
相关问题
input_data.data.shape[0]怎么理解
`input_data.data.shape[0]` 是指 `input_data.data` 这个 NumPy 数组的第一维大小。
在 NumPy 中,数组的形状(shape)是由各个维度的大小构成的元组,例如 `(a, b, c)` 表示一个三维数组,它的第一维大小为 `a`,第二维大小为 `b`,第三维大小为 `c`。因此,`input_data.data.shape` 就是 `input_data.data` 数组的形状元组。
由于 NumPy 中的数组可以有多个维度,因此可以使用多个索引来访问数组中的元素。例如,`input_data.data[i, j]` 表示 `input_data.data` 数组中第 `i` 行、第 `j` 列的元素。因此,`input_data.data.shape[0]` 就是数组的第一维大小,可以理解为数组的行数。
data_X.shape[0]
data_X.shape[0] 表示 data_X 的第一维度大小,通常用于获取数据集的样本数。其中,data_X 是一个 Numpy 数组,它的 shape 属性是一个元组,包含了数组每个维度的大小。例如,对于一个 100 行、10 列的数据集 data_X,data_X.shape[0] 的值为 100。
相关推荐
![exe](https://img-home.csdnimg.cn/images/20210720083343.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)