(1)利用read_excel函数读取healthcare-dataset-stroke.xlsx表。 (2)利用read_excel函数读取healthcare-dataset-age_abs.xlsx表。 (3)查看两表的数据量。 (4)以编号作为主键进行外连接。 提示:health_and_age=health.join(health_age,on='编号',rsuffix='1',how='outer') (5)查看数据是否合并成功。
时间: 2023-06-07 11:08:25 浏览: 626
CB-Insights_Healthcare-Report-Q1-2021.pdf
好的,我会尽力回答您的问题。以下是我的回答:
1. 使用read_excel函数读取healthcare-dataset-stroke.xlsx表的代码如下:
```python
import pandas as pd
stroke_data = pd.read_excel("healthcare-dataset-stroke.xlsx")
```
2. 使用read_excel函数读取healthcare-dataset-age_abs.xlsx表的代码如下:
```python
import pandas as pd
age_abs_data = pd.read_excel("healthcare-dataset-age_abs.xlsx")
```
3. 查看两表的数据量的代码如下:
```python
print("stroke_data数据量:", stroke_data.shape)
print("age_abs_data数据量:", age_abs_data.shape)
```
4. 以编号作为主键进行外连接的代码如下:
```python
health_and_age = stroke_data.join(age_abs_data.set_index('编号'), on='编号', rsuffix='_age', how='outer')
```
5. 查看数据是否合并成功的代码如下:
```python
print(health_and_age.head())
```
如果数据成功合并,输出的前几行数据应该包含两张表的所有列。
阅读全文