python数据操作
时间: 2023-08-20 18:14:44 浏览: 56
在Python中,有很多常见的数据操作方法。以下是一些常见的数据操作方法:
1. 读取Excel文件中的数据:可以使用pandas库的read_excel函数来读取Excel文件中的数据。可以指定要读取的sheet和列,并将数据存储在DataFrame中。例如,使用以下代码可以读取名为"Sheet1"的Excel文件中的"year"、"code1"、"code2"等列的内容:
```python
import pandas as pd
data = pd.read_excel("data.xlsx", sheet_name="Sheet1", usecols=["year", "code1", "code2"])
```
2. 字符串相似度比较:可以使用循环遍历数据,并使用条件语句比较两列数据的相似度。根据相似度的不同,可以将相应的值赋给新的列。例如,以下代码可以比较"code1"和"code2"列的相似度,并将结果存储在"inter"列中:
```python
for i in range(len(data)):
if data.loc[i]['code2'] != 0:
if data.loc[i]['code1'][:5] == data.loc[i]['code2'][:5]:
data.loc[i, 'inter'] = 0
elif data.loc[i]['code1'][:3] == data.loc[i]['code2'][:3]:
data.loc[i, 'inter'] = 1
elif data.loc[i]['code1'][:1] == data.loc[i]['code2'][:1]:
data.loc[i, 'inter'] = 2
else:
data.loc[i, 'inter'] = 3
```
3. 统计分类变量的数量:可以使用value_counts函数统计每个分类变量的数量。可以使用循环遍历列表中的每个变量,并打印出其值的计数。例如,以下代码可以统计列表中每个变量的数量:
```python
variables = ['fund', 'year', 'inter', 'age', 'degree', 'title', 'institute', 'economy', 'gender', 'type']
for variable in variables:
print(data[variable].value_counts())
```
4. 删除特定值的数据:可以使用drop函数删除某列中特定值的数据。可以使用条件语句选择要删除的行,并使用drop函数删除这些行。例如,以下代码可以删除"discipline"列中值为"H"的行:
```python
df_clear = data.drop(data[data['discipline'] == "H"].index)
```
5. 字符串的处理:可以使用正则表达式来处理字符串。可以使用lstrip和rstrip函数删除字符串左边或右边的内容。例如,以下代码可以删除字符串左边的"DF"和右边的"205'":
```python
import re
template = "DF','17340','http://www.zgglkx.com','2021','205')"
delete_left = template.lstrip('"DF')
print(delete_left)
delete_right = template.rstrip('205\')')
print(delete_right)
```
这些是Python中常见的数据操作方法的一些示例。希望对你有所帮助!
相关推荐
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)