20-Python入门基础必备-机器学习入门与Scikit-learn库
发布时间: 2024-02-27 03:35:01 阅读量: 21 订阅数: 17 ![](https://csdnimg.cn/release/wenkucmsfe/public/img/col_vip.0fdee7e1.png)
![](https://csdnimg.cn/release/wenkucmsfe/public/img/col_vip.0fdee7e1.png)
# 1. Python基础入门
## 1.1 Python的基本语法
Python是一种高级编程语言,具有简单易学、功能强大的特点,广泛应用于数据分析、人工智能、网络编程等领域。本节将介绍Python的基本语法,让您快速入门。
### 注释
在Python中,使用`#`符号进行单行注释,注释的内容不会被解释器执行。
```python
# 这是单行注释
print("Hello, World!") # 这也是注释
```
### 缩进
Python使用缩进来表示代码块,通常是4个空格或者一个Tab。缩进的代码被视为一个代码块,因此需要保持一致性。
```python
if 5 > 2:
print("5 大于 2")
```
### 代码块
Python使用冒号(`:`)来标志代码块的开始,注意要在代码块后面进行正确的缩进。
```python
if 5 > 2:
print("5 大于 2")
print("代码块内的第二行")
```
### Python解释器
您可以在命令行中输入`python`来打开Python交互式解释器,进行代码的实时执行和测试。
```python
$ python
Python 3.9.0 (default, Oct 6 2020, 21:29:52)
>>> print("Hello, World!")
Hello, World!
>>>
```
Python的基本语法就是这样简单直观,让我们开始学习更多有关Python语言的知识吧!
# 2. Numpy和Pandas库的基础
#### 2.1 Numpy库的基本操作
Numpy(Numerical Python)是Python语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。
```python
import numpy as np
# 创建一个一维数组
arr1 = np.array([1, 2, 3, 4, 5])
print(arr1)
# 创建一个二维数组
arr2 = np.array([[1, 2, 3], [4, 5, 6]])
print(arr2)
# 数组的形状和维度
print(arr1.shape)
print(arr2.shape)
print(arr2.ndim)
# 数组的运算
arr3 = np.array([6, 7, 8, 9, 10])
print(arr1 + arr3)
print(arr1 * arr3)
```
**代码解释:**
- 首先导入numpy库,创建一维和二维数组,然后演示获取数组形状和维度,最后进行数组的加法和乘法运算。
**代码总结:**
Numpy库提供了强大的数据操作功能,可以轻松创建数组,并进行各种数学运算。
#### 2.2 Pandas库的基本操作
Pandas是建立在Numpy库之上的一种快速,强大,柔性和易于使用的数据结构和数据分析工具。
```python
import pandas as pd
# 创建Series
s = pd.Series([1, 3, 5, np.nan, 6, 8])
print(s)
# 创建DataFrame
dates = pd.date_range('20210101', periods=6)
df = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=list('ABCD'))
print(df)
# 数据选择和操作
print(df['A']) # 选择列
print(df[0:3]) # 切片选择行
print(df.loc['20210102':'20210104', ['A', 'B']]) # 标签选择
print(df.iloc[3]) # 通过整数位置选择
```
**代码解释:**
- 导入pandas库,演示了如何创建Series和DataFrame,以及对数据进行选择和操作,包括标签选择和整数位置选择。
**代码总结:**
Pandas库提供了丰富的数据结构和数据操作功能,能够轻松处理各种数据分析任务。
#### 2.3 数据清洗和预处理
在数据分析中,数据清洗和预处理是非常重要的步骤,Pandas库提供了丰富的方法来帮助我们进行数据清洗和预处理。
```python
# 缺失值处理
df1 = pd.DataFrame({'A': [1, 2, np.nan, 4], 'B': [5, np.nan, 7, 8]})
print(df1)
print(df1.dropna()) # 删除含有缺失值的行
print(df1.fillna(value=0)) # 填充缺失值
# 重复值处理
df2 = pd.DataFrame({'A': [1, 1, 2, 3, 3], 'B': [2, 2, 3, 4, 4]})
print(df2)
print(df2.drop_duplicates()) # 删除重复值
```
**代码解释:**
- 演示了
0
0
相关推荐
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)