pandas split
时间: 2023-10-17 12:05:51 浏览: 146
在Python的pandas库中,split函数可以通过分隔符将一个字符串拆分为多个部分。具体的用法是DataFrame.str.split(pat, n, expand),其中pat是字符串分隔符,默认为空格;n是指定需要分割的次数,默认为-1,表示返回所有分割的字符串;expand是一个布尔值,用于指定是否将拆分的字符串展开为单独的列,默认为False。通过使用split函数,我们可以将包含命中数和投篮数的字符串拆分成两列,分别命名为"命中数"和"投篮数"。
在这个问题的背景中,我们可以使用split函数来计算勒布朗詹姆斯整个常规赛的命中率。首先,我们需要读取包含数据的csv文件,并将其存储在一个DataFrame对象中。然后,使用split函数将投篮数据字符串拆分成命中数和投篮数两列,并将拆分后的结果赋值给新的DataFrame对象df0。接下来,我们将df0的列转化为整型,这样就可以计算出詹姆斯整个常规赛的命中率。最后,通过将命中数列的总和除以投篮数列的总和,即可得到詹姆斯的命中率。
具体的代码如下所示:
```python
import numpy as np
import pandas as pd
# 读取包含数据的csv文件
df = pd.read_csv("lbj-2020-2021-regular.csv", encoding="gbk")
# 使用split函数将投篮数据字符串拆分成命中数和投篮数两列
df0 = df['投篮'].str.split("-", expand=True)
df0.columns = ['命中数', '投篮数']
# 将列转化为整型
df0['命中数'] = df0['命中数'].astype('int')
df0['投篮数'] = df0['投篮数'].astype('int')
# 计算詹姆斯整个常规赛的命中率
ShootRate = df0['命中数'].sum() / df0['投篮数'].sum()
```
通过以上的代码,我们可以得到勒布朗詹姆斯在2020-2021赛季常规赛的整体命中率。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* *2* *3* [pandas字符串分割str.split()函数](https://blog.csdn.net/hanyunkaka/article/details/120586261)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 100%"]
[ .reference_list ]
阅读全文