请写一段提取文件夹中的csv文件后,对csv文件中的特定列数据去除单位只提取数值
时间: 2024-12-24 12:34:07 浏览: 9
当你想要从CSV文件中提取数值,特别是需要去除单位后,可以使用pandas库来读取文件并对数据进行操作。这里有一个简单的例子,假设我们想从名为"quantity"的列中移除单位并提取纯数字:
```python
import pandas as pd
# 假设文件名为 "file.csv"
file_path = 'your_file.csv'
# 读取CSV文件
df = pd.read_csv(file_path)
# 确保“quantity”列存在
if 'quantity' in df.columns:
# 使用str.replace()方法移除单位,假设单位是以某种特定字符结尾的
df['quantity'] = df['quantity'].str.replace(r'\D+$', '', regex=True) # '\D'匹配非数字字符,$表示字符串结束位置
# 将结果转换为数值类型,如果原本就是数值类型则会保持不变,如果不是则变成NaN
df['quantity'] = pd.to_numeric(df['quantity'], errors='coerce')
# 查看处理后的数据
print(df[['quantity']].head()) # 显示处理后的quantity列
阅读全文