python中取某个表中指定几列成为一个新表怎么写代码
时间: 2023-06-06 12:01:33 浏览: 143
在Python中取某个表中指定几列成为一个新表,可以使用pandas库中的Dataframe数据结构和一些其它函数来完成。假设现有一个数据表格data,其中包含多列数据,我们需要从中选择指定的几列来生成一个新的表,代码如下:
```python
import pandas as pd
# 读取原始数据表格
data = pd.read_csv('data.csv')
# 取出指定列
select_columns = ['column1', 'column2', 'column3']
new_data = data[select_columns]
# 输出新数据表格
print(new_data.head())
```
在这里我们先使用pandas库的read_csv函数来读取原始数据表格,然后定义一个列表select_columns,其中包含需要选择的列名。接下来通过向原始数据表格data中传入选择的列名信息,即data[select_columns],就可以生成一个新的数据表格new_data。最后使用print函数输出新数据表格即可。
相关问题
python取某几列
在Python中,我们可以使用pandas库来选取某几列。具体方法如下:
1. 选取指定列:使用DataFrame的loc方法,指定要选取的列名即可。例如,选取名为column1和column2的两列数据的代码如下:
```
import pandas as pd
data = pd.DataFrame({'column1': [1, 2, 3], 'column2': [4, 5, 6], 'column3': [7, 8, 9]})
selected_data = data.loc[:, ['column1', 'column2']]
```
2. 选取符合条件的列:使用DataFrame的filter方法,指定要筛选的列名的条件即可。例如,选取以column1开头的所有列的代码如下:
```
import pandas as pd
data = pd.DataFrame({'column1_a': [1, 2, 3], 'column1_b': [4, 5, 6], 'column2': [7, 8, 9]})
selected_data = data.filter(regex='^column1')
```
3. 选取某个范围内的列:使用DataFrame的iloc方法,指定要选取的列的范围即可。例如,选取第1列至第3列数据的代码如下:
```
import pandas as pd
data = pd.DataFrame({'column1': [1, 2, 3], 'column2': [4, 5, 6], 'column3': [7, 8, 9]})
selected_data = data.iloc[:, 0:2]
```
python读取某表格所有sheet,固定某几列数据不删,再按删除指定的某几列
以下是一个示例代码,可以读取某个Excel文件的所有sheet,保留指定的列并删除其他列:
```python
import openpyxl
# 打开Excel文件
wb = openpyxl.load_workbook('example.xlsx')
# 遍历所有sheet
for sheetname in wb.sheetnames:
sheet = wb[sheetname]
# 保留的列
keep_columns = ['A', 'B', 'C']
# 获取最大列数
max_column = sheet.max_column
# 遍历所有列
for column in range(1, max_column + 1):
column_letter = openpyxl.utils.get_column_letter(column)
# 如果这一列不在保留的列中,则删除
if column_letter not in keep_columns:
sheet.delete_cols(column)
# 保存修改后的Excel文件
wb.save('example_modified.xlsx')
```
在上面的示例代码中,我们使用了openpyxl库来读取Excel文件。首先,我们打开Excel文件,并遍历其中的所有sheet。对于每个sheet,我们保留了'A'、'B'、'C'三列,而其他的列则被删除了。最后,我们将修改后的Excel文件保存到了'example_modified.xlsx'中。
阅读全文