Python数据库操作与SQL查询

发布时间: 2024-02-14 18:14:09 阅读量: 31 订阅数: 30
# 1. Python数据库连接 在本章节中,我们将介绍Python如何连接数据库。首先需要安装并配置适合所使用数据库的驱动程序,然后通过Python代码建立数据库连接,并设置连接参数。 ## 1.1 安装并配置数据库驱动 要连接不同类型的数据库,需要安装相应的数据库驱动程序。比如,要连接MySQL数据库,可以使用`pymysql`库;要连接SQLite数据库,可以直接使用内置的`sqlite3`库。 ```python # 示例:安装MySQL数据库驱动pymysql !pip install pymysql ``` ## 1.2 连接数据库 使用安装好的数据库驱动,我们可以通过Python代码连接数据库。下面是一个连接MySQL数据库的简单示例: ```python import pymysql # 建立数据库连接 conn = pymysql.connect( host='localhost', user='root', password='password', database='testDB' ) ``` ## 1.3 数据库连接参数设置 在建立数据库连接时,还可以设置一些参数,比如设置字符集、自动提交等。下面是一个设置字符集和自动提交参数的示例: ```python import pymysql # 建立数据库连接并设置参数 conn = pymysql.connect( host='localhost', user='root', password='password', database='testDB', charset='utf8mb4', autocommit=True ) ``` 通过以上几个步骤,我们可以成功连接数据库,在接下来的章节中,将会介绍如何操作数据库以及进行SQL查询等内容。 # 2. Python数据库操作基础 数据库操作是使用Python进行数据存储和查询的基础知识,本章将介绍Python中数据库的基本操作,包括创建数据库及数据表、插入数据、更新数据和删除数据。 ### 2.1 创建数据库及数据表 在Python中,我们可以使用SQL命令来创建数据库及数据表。下面是一个创建名为`mydatabase`的数据库和名为`customers`的数据表的示例代码: ```python import mysql.connector # 连接数据库 mydb = mysql.connector.connect( host="localhost", user="yourusername", password="yourpassword" ) # 创建数据库 mycursor = mydb.cursor() mycursor.execute("CREATE DATABASE mydatabase") # 创建数据表 mycursor.execute("USE mydatabase") mycursor.execute("CREATE TABLE customers (id INT AUTO_INCREMENT PRIMARY KEY, name VARCHAR(255), address VARCHAR(255))") ``` ### 2.2 插入数据 向数据库中插入数据是常见的操作之一。可以使用INSERT INTO语句将数据插入到数据表中。以下示例展示了如何插入一条名为John的客户记录: ```python import mysql.connector # 连接数据库 mydb = mysql.connector.connect( host="localhost", user="yourusername", password="yourpassword", database="mydatabase" ) # 插入数据 mycursor = mydb.cursor() sql = "INSERT INTO customers (name, address) VALUES (%s, %s)" val = ("John", "Highway 21") mycursor.execute(sql, val) mydb.commit() print(mycursor.rowcount, "记录插入成功。") ``` ### 2.3 更新数据 当需要修改已有数据时,可以使用UPDATE语句更新数据。以下示例演示了如何更新名为John的客户的地址: ```python import mysql.connector # 连接数据库 mydb = mysql.connector.connect( host="localhost", user="yourusername", password="yourpassword", database="mydatabase" ) # 更新数据 mycursor = mydb.cursor() sql = "UPDATE customers SET address = 'Canyon 123' WHERE name = 'John'" mycursor.execute(sql) mydb.commit() print(mycursor.rowcount, "记录被修改。") ``` ### 2.4 删除数据 使用DELETE语句可以从数据表中删除记录。以下示例演示了如何删除名为John的客户记录: ```python import mysql.connector # 连接数据库 mydb = mysql.connector.connect( host="localhost", user="yourusername", password="yourpassword", database="mydatabase" ) # 删除数据 mycursor = mydb.cursor() sql = "DELETE FROM customers WHERE name = 'John'" mycursor.execute(sql) mydb.commit() print(mycursor.rowcount, "记录被删除。") ``` 以上是Python数据库操作基础的内容,包括了创建数据库及数据表、插入数据、更新数据和删除数据的示例代码。通过这些操作,我们可以灵活地对数据库进行增删改查的操作。 # 3. Python与SQL查询 在Python中操作数据库最常见的场景之一就是执行SQL查询语句来检索需要的数据。本章将介绍Python中如何与SQL进行交互,包括SQL查询基础语法、查询数据及结果集处理以及使用参数化查询。 #### 3.1 SQL查询基础语法 在执行SQL查询之前,首先需要对SQL查询语法有一定的了解。SQL(Structured Query Language)是一种用于与关系型数据库进行交互的标准语言。Python中可以使用字符串来表示SQL语句,并通过数据库驱动执行。 以下是SQL查询基础语法的一些常见例子: - 查询所有数据: ```sql SELECT * FROM table_name; ``` - 查询指定列的数据: ```sql SELECT column1, column2 FROM table_name; ``` - 添加查询条件: ```sql SELECT * FROM table_name WHERE condition; ``` - 对查询结果进行排序: ```sql SELECT * FROM table_name ORDER BY column_name DESC; ``` - 对查询结果进行分页: ```sql SELECT * FROM table_name LIMIT 10 OFFSET 20; ``` #### 3.2 查询数据及结果集处理 Python提供了多种方法来执行SQL查询,并获取查询结果。常用的方法有: - 使用`fetchone()`方法获取一条查询结果: ```python cursor.execute("SELECT * FROM table_name;") result = cursor.fetchone() ``` - 使用`fetchall()`方法获取所有查询结果: ```python cursor.execute("SELECT * FROM table_name;") results = cursor.fetchall() ``` - 使用`fetchmany()`方法获取指定数量的查询结果: ```python cursor.execute("SELECT * FROM table_name;") results = cursor.fetchmany(size=10) ``` 获取查询结果后,可以对结果进行遍历和处理: ```python for result in results: print(result) ``` #### 3.3 使用参数化查询 在执行SQL查询时,为了提高安全性和性能,推荐使用参数化查询。参数化查询可以通过将查询条件作为参数传递给SQL语句,来防止SQL注入攻击,并且可以使用数据库缓存执行计划来提高查询性能。 以下是使用参数化查询的示例: ```python query = "SELECT * FROM table_name WHERE column_name = %s;" value = ("example",) cursor.execute(query, value) ``` 这里的`%s`表示查询条件的占位符,`value`是传递给占位符的参数值。使用参数化查询时,注意参数值的类型和占位符的使用方式。 ##### 代码总结: 本章主要介绍了Python中与SQL查询的基础知识,包括SQL查询语法、查询数据及结果集处理以及使用参数化查询。熟悉这些基础知识可以帮助我们更好地进行数据检索和处理。同时,使用参数化查询可以提高安全性和性能,是日常开发中的一种推荐做法。 ##### 结果说明: 通过本章的学习,读者应该对Python如何与SQL进行查询有了一定的了解,可以进行基本的查询操作,并对结果集进行处理。另外,参数化查询的使用也是一种良好的开发习惯,能够提高查询的安全性和性能。 # 4. Python中的SQL高级操作 在本章节中,我们将介绍Python中的SQL高级操作,包括聚合函数及分组、连接查询、子查询和窗口函数。 #### 4.1 聚合函数及分组 SQL中的聚合函数可以对一组数值进行计算,常见的聚合函数包括SUM、AVG、MAX、MIN和COUNT等。结合分组操作,可以实现对数据的分组聚合计算。在Python中,可以通过执行SQL语句实现聚合函数及分组操作。 **示例代码:** ```python import pymysql # 连接数据库 conn = pymysql.connect(host='localhost', user='root', password='123456', database='mydb') cursor = conn.cursor() # 使用聚合函数和GROUP BY进行分组统计 sql = "SELECT department, AVG(salary) as avg_salary FROM employee GROUP BY department" cursor.execute(sql) # 遍历结果集 for row in cursor.fetchall(): print(row) # 关闭连接 cursor.close() conn.close() ``` **代码说明:** - 通过`AVG(salary)`实现对salary字段的平均值计算,并通过`GROUP BY department`实现按部门分组。 - 最终打印出每个部门的平均工资。 #### 4.2 连接查询 连接查询用于联合两个或多个表,根据它们之间的关联列来检索数据。在Python中,可以通过执行SQL语句实现连接查询,包括INNER JOIN、LEFT JOIN、RIGHT JOIN和FULL JOIN等。 **示例代码:** ```python import pymysql # 连接数据库 conn = pymysql.connect(host='localhost', user='root', password='123456', database='mydb') cursor = conn.cursor() # 执行连接查询 sql = "SELECT employee.name, department.department_name FROM employee INNER JOIN department ON employee.department_id = department.id" cursor.execute(sql) # 遍历结果集 for row in cursor.fetchall(): print(row) # 关闭连接 cursor.close() conn.close() ``` **代码说明:** - 通过`INNER JOIN`将employee和department表连接在一起,根据它们之间的关联列`department_id = id`来检索数据。 - 最终打印出员工姓名和所属部门名称。 #### 4.3 子查询 子查询是指嵌套在其他查询中的查询,可以将子查询的结果作为外部查询的一部分来使用。在Python中,可以通过执行SQL语句实现子查询。 **示例代码:** ```python import pymysql # 连接数据库 conn = pymysql.connect(host='localhost', user='root', password='123456', database='mydb') cursor = conn.cursor() # 执行子查询 sql = "SELECT name, salary FROM employee WHERE department_id = (SELECT id FROM department WHERE department_name='IT')" cursor.execute(sql) # 遍历结果集 for row in cursor.fetchall(): print(row) # 关闭连接 cursor.close() conn.close() ``` **代码说明:** - 在外部查询中使用了子查询,内部查询先根据部门名称查询其对应的id,然后外部查询根据这个id来检索员工姓名和薪水信息。 #### 4.4 窗口函数 窗口函数是一种高级的SQL查询技术,可以在结果集中的窗口范围内进行计算,例如求排名、累计和、移动平均等。在Python中,可以通过执行SQL语句实现窗口函数。 **示例代码:** ```python import pymysql # 连接数据库 conn = pymysql.connect(host='localhost', user='root', password='123456', database='mydb') cursor = conn.cursor() # 使用窗口函数计算员工工资排名 sql = "SELECT name, salary, RANK() OVER (ORDER BY salary DESC) as salary_rank FROM employee" cursor.execute(sql) # 遍历结果集 for row in cursor.fetchall(): print(row) # 关闭连接 cursor.close() conn.close() ``` **代码说明:** - 使用窗口函数`RANK() OVER (ORDER BY salary DESC)`对员工工资进行排名,按照工资降序排列。 - 最终打印出员工姓名、工资和工资排名。 通过本章节的学习,我们掌握了Python中的SQL高级操作,包括聚合函数及分组、连接查询、子查询和窗口函数,这些技巧可以帮助我们更灵活地对数据库进行操作和数据处理。 # 5. Python中的事务管理及数据操作优化 在数据库操作中,事务管理是非常重要的一部分。它可以确保数据库操作的一致性、完整性和可靠性。此外,我们还需要关注数据库操作的性能优化,以提高数据处理效率。 ### 5.1 事务基础 事务是由一系列数据库操作组成的逻辑工作单元,这些操作要么全部成功,要么全部失败。在事务中,可以对数据库表进行插入、更新、删除等操作。 事务具有以下四个基本特征(常称为ACID特性): - **原子性(Atomicity)**:事务中的所有操作要么全部成功,要么全部回滚,不会出现部分操作成功或失败的情况。 - **一致性(Consistency)**:事务在开始和结束时,数据库的状态必须是一致的。如果事务在执行过程中发生错误导致数据库状态不一致,则必须回滚事务,保证数据的一致性。 - **隔离性(Isolation)**:数据库允许多个事务同时进行,但每个事务应该对其他事务是隔离的,彼此不可见的。事务之间不能互相干扰。 - **持久性(Durability)**:一旦事务提交成功,其对数据库的修改是永久性的,即使在数据库发生故障的情况下仍然存在。 ### 5.2 事务操作 Python中的数据库操作通常通过事务来进行,我们可以使用以下步骤来执行事务操作: 1. 连接到数据库。 2. 开始事务。 3. 执行数据库操作。 4. 如果所有操作成功,则提交事务;如果出现错误,则回滚事务。 5. 关闭数据库连接。 下面是一个Python使用MySQL数据库的事务操作示例: ```python import mysql.connector # 连接到数据库 conn = mysql.connector.connect(user='username', password='password', host='localhost', database='mydb') try: # 开始事务 conn.start_transaction() # 执行数据库操作 cursor = conn.cursor() cursor.execute("INSERT INTO students (name, age) VALUES (%s, %s)", ("Alice", 20)) cursor.execute("UPDATE students SET age = 21 WHERE name = %s", ("Bob",)) # 提交事务 conn.commit() print("Transaction committed successfully.") except mysql.connector.Error as error: # 回滚事务 conn.rollback() print("Transaction rolled back due to error:", error) finally: # 关闭数据库连接 conn.close() ``` 在上面的示例中,我们使用了`mysql.connector`库来连接MySQL数据库。首先,我们开始了一个事务,然后执行了一系列数据库操作,包括插入和更新数据。最后,我们提交了事务,如果出现错误,则回滚事务。无论事务是成功提交还是回滚,都需要关闭数据库连接。 ### 5.3 数据库操作性能优化 为了提高数据库操作的性能,我们可以采取以下几种优化策略: - **使用索引**:创建适当的索引可以加快查询操作的速度。 - **合理设计表结构**:避免冗余数据和无效的关系,提高查询效率。 - **批量操作**:将多个数据库操作合并成一个批量操作,减少与数据库服务器的通信次数。 - **使用连接池**:通过连接池管理数据库连接,避免频繁地创建和关闭连接,提高效率。 - **异步执行**:对于一些耗时较长的数据库操作,可以使用异步执行的方式,提高并发处理能力。 以上是一些基本的数据库操作性能优化策略,具体的优化方法可以根据实际情况进行调整和优化。 总结: 本章介绍了Python中的事务管理和数据操作优化。了解了事务的基本特征和操作步骤,并提供了一个MySQL数据库事务操作的示例。此外,还介绍了一些常用的数据库操作性能优化策略,以提高数据处理效率。在实际应用中,我们需要根据具体情况选择适当的优化方法,以达到更好的性能和用户体验。 # 6. Python数据库操作和安全性 在进行Python数据库操作时,安全性是一个非常重要的问题。如果不注意安全性,可能会导致数据泄露、数据被篡改甚至服务器被攻击等问题。因此,我们需要在进行数据库操作时,注重安全性的考虑。 ### 6.1 数据库安全性考虑 在进行Python的数据库操作时,我们需要注意以下几点来保障数据库的安全性: - **数据库访问权限管理**:合理设置数据库的访问权限,只为需要访问数据库的用户开放相应的权限。确保敏感数据只能被授权的用户访问。 - **谨慎处理连接信息**:在连接数据库时,分离敏感的连接信息,比如数据库用户名和密码。可以使用配置文件、环境变量等方式来存储和读取这些敏感信息。 - **及时更新数据库**:定期更新数据库的版本,及时应用安全补丁和修复程序的更新。 ### 6.2 防止SQL注入 SQL注入是一种常见的数据库安全漏洞,攻击者通过注入恶意SQL语句来获取或修改数据库中的数据。为了防止SQL注入,我们可以采取以下措施: - **使用参数化查询**:尽量使用参数化查询,通过将参数与SQL语句分开传递,避免用户输入直接拼接到SQL语句中,从而防止恶意SQL注入。 - **输入验证和过滤**:在接收用户的输入时,对输入的数据进行验证和过滤,确保输入的数据符合预期。可以使用正则表达式、白名单等方式进行验证和过滤。 - **使用ORM框架**:ORM(Object-Relational Mapping)框架能够帮助开发人员将数据库操作转化为面向对象的操作,减少直接操作SQL语句的机会,从而降低注入的风险。 ### 6.3 数据库访问权限管理 数据库访问权限管理是确保数据库安全的关键。在进行Python数据库操作时,我们应该注意以下几点: - **合理分配权限**:为每个用户设置适当的数据库权限,按照最小权限原则分配权限,确保用户只能访问其需要的数据和功能,减少潜在的安全风险。 - **定期审计权限**:定期审计数据库用户的权限,及时发现和修正存在的安全问题。 - **使用安全连接**:在数据库连接时,使用加密的连接方式,比如SSL/TLS等,确保数据在传输过程中的安全性。 ## 总结 本章我们介绍了Python数据库操作中的安全性问题,并提供了一些防范SQL注入的建议。同时,我们也强调了数据库访问权限管理的重要性,希望读者在进行Python数据库操作时,能够注重安全性的考虑,保障数据库的安全。
corwn 最低0.47元/天 解锁专栏
买1年送3月
点击查看下一篇
profit 百万级 高质量VIP文章无限畅学
profit 千万级 优质资源任意下载
profit C知道 免费提问 ( 生成式Al产品 )

相关推荐

李_涛

知名公司架构师
拥有多年在大型科技公司的工作经验,曾在多个大厂担任技术主管和架构师一职。擅长设计和开发高效稳定的后端系统,熟练掌握多种后端开发语言和框架,包括Java、Python、Spring、Django等。精通关系型数据库和NoSQL数据库的设计和优化,能够有效地处理海量数据和复杂查询。
专栏简介
《Python面试100讲(基于Python3.x)与技巧分享》是一本致力于帮助读者在Python面试中脱颖而出的专栏。本专栏由多个篇章组成,涵盖了Python的基础语法与数据类型、函数与模块的使用技巧、文件操作与异常处理、正则表达式与字符串处理、网络编程与Socket通信、并发编程与多线程技术、GUI编程与图形界面设计、数据库操作与SQL查询、爬虫实战与数据抓取、数据分析与常用库介绍、虚拟环境与项目管理、科学计算与NumPy库使用、高级语法与特殊技巧等方面的知识点。 通过本专栏的学习,读者将掌握Python的核心知识,并深入了解到Python编程中的各种技巧与实践经验。无论是准备面试还是提升自己的开发技能,本专栏都能为读者提供全面而实用的指导。每篇文章都以清晰的讲解和实例演示为主线,帮助读者理解和掌握知识点的同时,还提供了大量的实际应用场景和解决方法,让读者能够更好地应对各种编程挑战。 无论您是初学者还是有一定经验的开发者,这本专栏都能满足您的需求。让我们一起深入学习Python,并在面试和实际项目中展现自己的才华!
最低0.47元/天 解锁专栏
买1年送3月
百万级 高质量VIP文章无限畅学
千万级 优质资源任意下载
C知道 免费提问 ( 生成式Al产品 )

最新推荐

Pandas数据转换:重塑、融合与数据转换技巧秘籍

![Pandas数据转换:重塑、融合与数据转换技巧秘籍](https://c8j9w8r3.rocketcdn.me/wp-content/uploads/2016/03/pandas_aggregation-1024x409.png) # 1. Pandas数据转换基础 在这一章节中,我们将介绍Pandas库中数据转换的基础知识,为读者搭建理解后续章节内容的基础。首先,我们将快速回顾Pandas库的重要性以及它在数据分析中的核心地位。接下来,我们将探讨数据转换的基本概念,包括数据的筛选、清洗、聚合等操作。然后,逐步深入到不同数据转换场景,对每种操作的实际意义进行详细解读,以及它们如何影响数

正态分布与信号处理:噪声模型的正态分布应用解析

![正态分布](https://img-blog.csdnimg.cn/38b0b6e4230643f0bf3544e0608992ac.png) # 1. 正态分布的基础理论 正态分布,又称为高斯分布,是一种在自然界和社会科学中广泛存在的统计分布。其因数学表达形式简洁且具有重要的统计意义而广受关注。本章节我们将从以下几个方面对正态分布的基础理论进行探讨。 ## 正态分布的数学定义 正态分布可以用参数均值(μ)和标准差(σ)完全描述,其概率密度函数(PDF)表达式为: ```math f(x|\mu,\sigma^2) = \frac{1}{\sqrt{2\pi\sigma^2}} e

数据清洗的概率分布理解:数据背后的分布特性

![数据清洗的概率分布理解:数据背后的分布特性](https://media.springernature.com/lw1200/springer-static/image/art%3A10.1007%2Fs11222-022-10145-8/MediaObjects/11222_2022_10145_Figa_HTML.png) # 1. 数据清洗的概述和重要性 数据清洗是数据预处理的一个关键环节,它直接关系到数据分析和挖掘的准确性和有效性。在大数据时代,数据清洗的地位尤为重要,因为数据量巨大且复杂性高,清洗过程的优劣可以显著影响最终结果的质量。 ## 1.1 数据清洗的目的 数据清洗

【线性回归优化指南】:特征选择与正则化技术深度剖析

![【线性回归优化指南】:特征选择与正则化技术深度剖析](https://www.blog.trainindata.com/wp-content/uploads/2022/08/rfesklearn.png) # 1. 线性回归基础与应用场景 线性回归是统计学中用来预测数值型变量间关系的一种常用方法,其模型简洁、易于解释,是数据科学入门必学的模型之一。本章将首先介绍线性回归的基本概念和数学表达,然后探讨其在实际工作中的应用场景。 ## 线性回归的数学模型 线性回归模型试图在一组自变量 \(X\) 和因变量 \(Y\) 之间建立一个线性关系,即 \(Y = \beta_0 + \beta_

NumPy在金融数据分析中的应用:风险模型与预测技术的6大秘籍

![NumPy在金融数据分析中的应用:风险模型与预测技术的6大秘籍](https://d31yv7tlobjzhn.cloudfront.net/imagenes/990/large_planilla-de-excel-de-calculo-de-valor-en-riesgo-simulacion-montecarlo.png) # 1. NumPy基础与金融数据处理 金融数据处理是金融分析的核心,而NumPy作为一个强大的科学计算库,在金融数据处理中扮演着不可或缺的角色。本章首先介绍NumPy的基础知识,然后探讨其在金融数据处理中的应用。 ## 1.1 NumPy基础 NumPy(N

从Python脚本到交互式图表:Matplotlib的应用案例,让数据生动起来

![从Python脚本到交互式图表:Matplotlib的应用案例,让数据生动起来](https://opengraph.githubassets.com/3df780276abd0723b8ce60509bdbf04eeaccffc16c072eb13b88329371362633/matplotlib/matplotlib) # 1. Matplotlib的安装与基础配置 在这一章中,我们将首先讨论如何安装Matplotlib,这是一个广泛使用的Python绘图库,它是数据可视化项目中的一个核心工具。我们将介绍适用于各种操作系统的安装方法,并确保读者可以无痛地开始使用Matplotlib

【品牌化的可视化效果】:Seaborn样式管理的艺术

![【品牌化的可视化效果】:Seaborn样式管理的艺术](https://aitools.io.vn/wp-content/uploads/2024/01/banner_seaborn.jpg) # 1. Seaborn概述与数据可视化基础 ## 1.1 Seaborn的诞生与重要性 Seaborn是一个基于Python的统计绘图库,它提供了一个高级接口来绘制吸引人的和信息丰富的统计图形。与Matplotlib等绘图库相比,Seaborn在很多方面提供了更为简洁的API,尤其是在绘制具有多个变量的图表时,通过引入额外的主题和调色板功能,大大简化了绘图的过程。Seaborn在数据科学领域得

【数据集加载与分析】:Scikit-learn内置数据集探索指南

![Scikit-learn基础概念与常用方法](https://analyticsdrift.com/wp-content/uploads/2021/04/Scikit-learn-free-course-1024x576.jpg) # 1. Scikit-learn数据集简介 数据科学的核心是数据,而高效地处理和分析数据离不开合适的工具和数据集。Scikit-learn,一个广泛应用于Python语言的开源机器学习库,不仅提供了一整套机器学习算法,还内置了多种数据集,为数据科学家进行数据探索和模型验证提供了极大的便利。本章将首先介绍Scikit-learn数据集的基础知识,包括它的起源、

Keras注意力机制:构建理解复杂数据的强大模型

![Keras注意力机制:构建理解复杂数据的强大模型](https://img-blog.csdnimg.cn/direct/ed553376b28447efa2be88bafafdd2e4.png) # 1. 注意力机制在深度学习中的作用 ## 1.1 理解深度学习中的注意力 深度学习通过模仿人脑的信息处理机制,已经取得了巨大的成功。然而,传统深度学习模型在处理长序列数据时常常遇到挑战,如长距离依赖问题和计算资源消耗。注意力机制的提出为解决这些问题提供了一种创新的方法。通过模仿人类的注意力集中过程,这种机制允许模型在处理信息时,更加聚焦于相关数据,从而提高学习效率和准确性。 ## 1.2

PyTorch超参数调优:专家的5步调优指南

![PyTorch超参数调优:专家的5步调优指南](https://img-blog.csdnimg.cn/20210709115730245.png) # 1. PyTorch超参数调优基础概念 ## 1.1 什么是超参数? 在深度学习中,超参数是模型训练前需要设定的参数,它们控制学习过程并影响模型的性能。与模型参数(如权重和偏置)不同,超参数不会在训练过程中自动更新,而是需要我们根据经验或者通过调优来确定它们的最优值。 ## 1.2 为什么要进行超参数调优? 超参数的选择直接影响模型的学习效率和最终的性能。在没有经过优化的默认值下训练模型可能会导致以下问题: - **过拟合**:模型在