python 对ts_code列的数据去重
时间: 2024-02-21 09:58:32 浏览: 96
在Python中,可以使用Pandas库对DataFrame进行去重操作。假设DataFrame的名称为`df`,要对其中的`ts_code`列进行去重,可以使用以下代码:
```
df.drop_duplicates(subset=['ts_code'], keep='first', inplace=True)
```
其中,`drop_duplicates()`函数用于去重,其中`subset=['ts_code']`表示按照`ts_code`列进行去重;`keep='first'`表示保留第一次出现的数据,可以根据需要设置为`'last'`表示保留最后一次出现的数据;`inplace=True`表示在原DataFrame上进行修改,如果不需要修改原DataFrame,可以将其设置为`False`。执行上述代码后,`df`中的`ts_code`列中的重复数据就会被去除。
相关问题
python df中ts_code列值开头为864的不保存
如果您想要实现这个功能,您可以使用 Pandas 库来读取和处理表格数据。
首先,您可以使用 Pandas 的 read_excel 函数读取 Excel 文件,例如:
```python
import pandas as pd
df = pd.read_excel('file.xlsx')
```
然后,您可以使用 Pandas 的 loc 函数和字符串方法 str.startswith 来选取 ts_code 列开头不为 864 的行,例如:
```python
filtered_df = df.loc[~df['ts_code'].str.startswith('864')]
```
其中,~ 表示取反,即排除 ts_code 列开头为 864 的行。
最后,您可以使用 Pandas 的 to_excel 函数将过滤后的数据保存到新的 Excel 文件中,例如:
```python
filtered_df.to_excel('filtered_file.xlsx', index=False)
```
其中,index 参数为 False 表示不保存行索引。
希望这些代码可以帮助您实现您的要求!
python df表格ts_code列去掉值的后三个字符替换成 逗号
可以使用 Pandas 库来处理这个问题,具体代码如下:
```python
import pandas as pd
# 读取原始数据
df = pd.read_csv('data.csv')
# 将 ts_code 列转换为字符串类型,并去掉后三个字符
df['ts_code'] = df['ts_code'].astype(str).str[:-3]
# 将最后三个字符替换为逗号
df['ts_code'] = df['ts_code'].str.replace(r'$', ',')
# 输出处理后的结果
print(df)
```
其中,`data.csv` 是包含原始数据的 CSV 文件,`ts_code` 是需要进行处理的列名。首先使用 `read_csv` 函数读取原始数据,然后将 `ts_code` 列转换为字符串类型并去掉后三个字符,接着使用 `str.replace` 函数将最后三个字符替换为逗号,最后输出处理后的结果。