首页 > 文章 > python教程

Python连接MySQL教程，PyMySQL实战详解

时间：2025-08-06 19:34:44 490浏览收藏

想要用Python连接MySQL数据库？PyMySQL是你的得力助手！本文为你提供一份详尽的PyMySQL实战教程，从安装配置到增删改查，手把手教你轻松玩转MySQL。首先，通过`pip install PyMySQL`安装库，然后配置连接参数（host、port、user等），使用`pymysql.connect()`建立连接，并通过游标执行SQL操作。文章还深入剖析了编码问题、连接参数错误、事务提交等常见问题，并提供解决方案。除了PyMySQL，还介绍了官方驱动mysql-connector-python以及ORM框架SQLAlchemy和Peewee，帮你选择最适合的方案。更进一步，本文还分享了在生产环境中如何安全高效地管理数据库连接，包括使用环境变量管理凭证、利用DBUtils实现连接池、结合with语句自动管理连接和游标、正确使用事务以及记录错误日志等实用技巧。无论你是新手还是有一定经验的开发者，都能从中获益，提升Python连接MySQL的技能。

Python连接MySQL数据库最常用的是PyMySQL库，主要步骤为：1. 安装库（pip install PyMySQL）；2. 导入库并配置连接参数（host、port、user、password、db、charset等）；3. 使用pymysql.connect()建立连接；4. 通过connection.cursor()获取游标；5. 执行SQL操作（增删改查）；6. 修改操作需调用connection.commit()提交事务；7. 操作完成后在finally块中关闭游标和连接。常见问题包括编码不一致导致中文乱码，应统一使用charset='utf8mb4'；连接参数错误需仔细核对；未调用commit()导致数据未保存；直接拼接SQL存在注入风险，应使用参数化查询；未关闭连接可能导致资源泄露，应使用try...finally或with语句确保释放资源。除PyMySQL外，还可选择官方驱动mysql-connector-python（性能更优），或使用ORM框架如SQLAlchemy（功能强大、开发高效但有性能开销）和Peewee（轻量简洁），前者适合复杂项目，后者适合快速开发。生产环境中应通过环境变量或配置文件管理数据库凭证，避免硬编码；使用DBUtils等第三方库实现连接池（如PooledDB）提升高并发下的性能；结合with语句自动管理连接和游标的获取与释放；正确使用事务保证数据一致性；并记录错误日志以便监控和排查问题。

Python如何连接MySQL数据库？PyMySQL实战教程

Python要连接MySQL数据库，PyMySQL无疑是目前最直接、最常用的选择之一。它是一个纯Python实现的MySQL客户端库，用起来非常方便，能让你轻松地执行SQL查询、管理数据，几乎是Python操作MySQL的标配。

连接MySQL数据库，使用PyMySQL主要分几步：先安装库，然后导入，接着建立连接，获取游标，执行SQL命令，最后别忘了提交更改并关闭连接。

解决方案

要开始，首先得确保你的Python环境里安装了PyMySQL。这很简单，打开终端或者命令行工具，输入：

pip install PyMySQL

安装好之后，就可以开始写代码了。一个基本的连接、查询和插入流程大致是这样：

import pymysql

# 数据库连接参数
db_config = {
    'host': '127.0.0.1', # 或者你的MySQL服务器IP地址
    'port': 3306,
    'user': 'your_username',
    'password': 'your_password',
    'db': 'your_database_name',
    'charset': 'utf8mb4', # 推荐使用utf8mb4，避免字符编码问题
    'cursorclass': pymysql.cursors.DictCursor # 这样查询结果会以字典形式返回，方便处理
}

connection = None
cursor = None

try:
    # 建立数据库连接
    connection = pymysql.connect(**db_config)
    print("数据库连接成功！")

    # 获取游标对象，用于执行SQL查询
    # cursorclass=pymysql.cursors.DictCursor 会让查询结果以字典形式返回
    cursor = connection.cursor()

    # --- 示例1: 创建表 (如果不存在) ---
    create_table_sql = """
    CREATE TABLE IF NOT EXISTS users (
        id INT AUTO_INCREMENT PRIMARY KEY,
        name VARCHAR(255) NOT NULL,
        email VARCHAR(255) UNIQUE NOT NULL,
        created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP
    ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;
    """
    cursor.execute(create_table_sql)
    print("表 'users' 检查或创建完成。")

    # --- 示例2: 插入数据 ---
    insert_sql = "INSERT INTO users (name, email) VALUES (%s, %s)"
    user_data = [
        ('张三', 'zhangsan@example.com'),
        ('李四', 'lisi@example.com')
    ]
    cursor.executemany(insert_sql, user_data) # 批量插入
    connection.commit() # 提交事务，保存更改
    print(f"成功插入 {cursor.rowcount} 条数据。")

    # --- 示例3: 查询数据 ---
    select_sql = "SELECT id, name, email FROM users WHERE name = %s"
    cursor.execute(select_sql, ('张三',))
    result = cursor.fetchone() # 获取一条结果
    if result:
        print("\n查询到张三的信息:")
        print(f"ID: {result['id']}, 姓名: {result['name']}, 邮箱: {result['email']}")

    # 查询所有数据
    cursor.execute("SELECT id, name, email FROM users")
    all_users = cursor.fetchall() # 获取所有结果
    print("\n所有用户信息:")
    for user in all_users:
        print(f"ID: {user['id']}, 姓名: {user['name']}, 邮箱: {user['email']}")

    # --- 示例4: 更新数据 ---
    update_sql = "UPDATE users SET email = %s WHERE name = %s"
    cursor.execute(update_sql, ('zhangsan_new@example.com', '张三'))
    connection.commit()
    print(f"\n成功更新 {cursor.rowcount} 条数据。")

    # --- 示例5: 删除数据 ---
    delete_sql = "DELETE FROM users WHERE name = %s"
    cursor.execute(delete_sql, ('李四',))
    connection.commit()
    print(f"成功删除 {cursor.rowcount} 条数据。")

except pymysql.Error as e:
    print(f"数据库操作失败: {e}")
    if connection:
        connection.rollback() # 发生错误时回滚事务
except Exception as e:
    print(f"发生未知错误: {e}")
finally:
    # 无论成功失败，确保关闭游标和连接
    if cursor:
        cursor.close()
    if connection:
        connection.close()
    print("数据库连接已关闭。")

这段代码涵盖了从连接到执行增删改查的基本操作。try...except...finally 结构是处理数据库操作时非常重要的模式，它能确保即使发生错误，连接也能被妥善关闭，避免资源泄露。connection.commit() 是关键，没有它，你的更改是不会真正保存到数据库的。

PyMySQL连接MySQL时常见的坑有哪些？如何避免？

在用PyMySQL连接MySQL时，确实会遇到一些小麻烦，有些是配置问题，有些是操作习惯。

最常见的，恐怕就是编码问题了。如果你的数据库、表、字段以及Python连接时使用的编码不一致，比如数据库是utf8，但Python连接时用了默认的latin1，那么中文数据插入进去可能就是乱码，或者读取出来也是一堆问号。解决办法是在连接参数里明确指定charset='utf8mb4'。utf8mb4是utf8的超集，能更好地支持Emoji等特殊字符，推荐使用。

接着是连接参数配置错误。主机地址（host）、端口（port）、用户名（user）、密码（password）和数据库名（db）这几个参数，任何一个写错了，都会导致连接失败。特别是host，如果你是在本地连接本地MySQL，用127.0.0.1或localhost通常没问题，但如果MySQL在远程服务器上，就得确保IP地址正确，并且服务器的防火墙允许3306端口（或者你自定义的端口）的入站连接。

一个经常被新手忽略的问题是没有提交事务。你执行了INSERT、UPDATE、DELETE这样的修改操作，如果不在后面调用connection.commit()，这些修改是不会真正写入数据库的，它们只存在于当前会话的内存中。下次你重新连接或者其他客户端查询时，会发现数据根本没变。所以，记住，只要是修改了数据，就得commit()。

还有就是SQL注入的风险。如果你直接用字符串拼接的方式来构建SQL查询，比如sql = "SELECT * FROM users WHERE name = '" + user_input + "'"，那么恶意用户就可以通过输入特定的字符串来篡改你的查询，甚至执行危险的命令。PyMySQL提供了参数化查询（cursor.execute(sql, (value1, value2))）的方式来避免这个问题，它会自动帮你处理特殊字符转义，非常安全。务必使用参数化查询！

最后，资源泄露也是个问题。如果你的代码没有在操作完成后关闭游标（cursor.close()）和连接（connection.close()），尤其是在循环或者高并发的场景下，可能会导致数据库连接池耗尽，或者程序内存占用过高。虽然Python的垃圾回收机制会在一定程度上清理，但主动关闭是更好的实践。推荐使用try...finally结构来确保关闭操作的执行，或者利用Python的with语句（对于支持上下文管理协议的对象，如pymysql.connect返回的连接对象，但通常游标需要手动关闭或通过上下文管理器封装）。

除了PyMySQL，Python还有哪些连接MySQL的方式？它们有什么区别？

PyMySQL虽然好用，但它不是唯一的选择。Python社区提供了多种方式来连接MySQL，每种都有其特点和适用场景。

一个非常官方的选择是mysql-connector-python。这是Oracle官方提供的Python驱动程序，通常被认为是更“权威”的。它的特点是性能可能比纯Python实现的PyMySQL略好，因为它底层可能会用到C语言扩展来优化性能。如果你对性能有极高的要求，或者更偏好官方支持，mysql-connector-python值得考虑。它的API设计和PyMySQL很相似，迁移成本不高。

再往上一个层次，就是ORM（Object-Relational Mapping）框架了，比如SQLAlchemy和Peewee。它们不是直接的数据库连接库，而是提供了一种更高级、更面向对象的方式来操作数据库。你不需要写原始的SQL语句，而是通过操作Python对象来完成数据库的增删改查。

SQLAlchemy：这是一个非常强大且灵活的ORM，被称为“Python SQL工具包和ORM”。它支持多种数据库，包括MySQL。SQLAlchemy可以让你在Python代码中定义数据库表结构，然后通过操作这些Python类实例来完成数据库操作。它抽象掉了底层的SQL细节，让代码更易读、易维护，并且提供了强大的查询构建器和事务管理。它的学习曲线相对陡峭，但功能非常全面，适合大型复杂项目。
Peewee：这是一个轻量级的ORM，比SQLAlchemy更简单易用，学习成本低。如果你不需要SQLAlchemy那么强大的功能，只是想快速地用Python对象来操作数据库，Peewee是一个很好的选择。它也支持MySQL，提供了简洁的API来定义模型和执行查询。

它们的主要区别在于抽象层次和功能丰富度：

PyMySQL / mysql-connector-python：它们是底层的数据库驱动，直接与MySQL协议通信，你需要自己编写SQL语句。它们的优点是直接、灵活、性能高（特别是mysql-connector-python），适合对SQL有完全控制需求，或者性能敏感的场景。
ORM（SQLAlchemy / Peewee）：它们在数据库驱动之上构建，提供了一个对象模型来映射数据库表。你操作的是Python对象而不是SQL语句。优点是开发效率高、代码可读性好、更容易维护、减少SQL注入风险，并且提供了数据库无关性（理论上可以在不改动代码的情况下切换数据库）。缺点是可能会引入一些性能开销（因为ORM需要将对象操作转换为SQL），并且在处理复杂查询时，有时需要学习ORM特定的查询语法，可能不如直接写SQL那么直观。

选择哪种方式，取决于你的项目需求、团队熟悉度以及对开发效率和性能的权衡。对于大多数中小型项目，PyMySQL或mysql-connector-python配合简单的SQL操作已经足够。而对于需要更强抽象、更注重开发效率和代码维护性的大型项目，ORM框架会是更好的选择。

在实际项目中，如何更安全、高效地管理PyMySQL数据库连接？

在实际的生产环境中，数据库连接的管理远不止简单的连接和关闭。安全性和效率是两个核心考量点。

首先，数据库凭证的妥善管理是安全性的基石。绝不能把数据库的用户名和密码硬编码在代码里，尤其是在版本控制系统（如Git）中。这样做极易导致敏感信息泄露。正确的做法是：

使用环境变量：将数据库连接信息存储在操作系统的环境变量中，程序启动时读取。这是最常见且推荐的方式。
使用配置文件：将配置信息放在独立的配置文件（如config.ini, settings.py, .env）中，并通过configparser、dotenv等库来读取。这些配置文件通常会被添加到.gitignore，避免提交到代码仓库。
使用密钥管理服务：对于更复杂的企业级应用，可以考虑使用云服务商提供的密钥管理服务（如AWS Secrets Manager, Azure Key Vault）来动态获取凭证。

其次，连接池（Connection Pooling）是提升效率的关键。每次建立数据库连接都需要时间和资源开销。在高并发的应用中，频繁地创建和关闭连接会导致性能瓶颈。连接池就是为了解决这个问题而生：它预先创建好一定数量的数据库连接，并将它们保存在一个池子里。当应用程序需要连接时，直接从池中获取一个可用的连接；使用完毕后，连接不会被关闭，而是返回到池中，供下次复用。

PyMySQL本身不提供内置的连接池，但你可以使用第三方库，比如DBUtils中的PooledDB或PersistentDB。

from DBUtils.PooledDB import PooledDB
import pymysql

# 数据库连接池配置
POOL_CONFIG = {
    'creator': pymysql,  # 指定连接的创建者
    'host': '127.0.0.1',
    'port': 3306,
    'user': 'your_username',
    'password': 'your_password',
    'database': 'your_database_name',
    'charset': 'utf8mb4',
    'maxconnections': 10, # 最大连接数
    'mincached': 2,       # 启动时创建的最小连接数
    'blocking': True,     # 当连接池满时，是否阻塞等待
    'ping': 0,            # 每次获取连接时是否检查连接的有效性，0表示不检查
    'cursorclass': pymysql.cursors.DictCursor
}

# 初始化连接池
pool = PooledDB(**POOL_CONFIG)

def get_db_connection():
    """从连接池获取一个连接"""
    return pool.connection()

# 示例用法
try:
    with get_db_connection() as conn: # with语句会自动关闭连接（返回到池中）
        with conn.cursor() as cursor:
            cursor.execute("SELECT VERSION()")
            version = cursor.fetchone()
            print(f"MySQL 版本: {version['VERSION()']}")

            cursor.execute("SELECT COUNT(*) FROM users")
            count = cursor.fetchone()
            print(f"用户总数: {count['COUNT(*)']}")

except Exception as e:
    print(f"数据库操作失败: {e}")

使用with语句管理从连接池获取的连接，可以确保连接在代码块执行完毕后自动返回到连接池，避免手动管理带来的遗漏。

此外，事务的正确使用也至关重要。对于涉及多个数据库操作的逻辑单元，应该将它们封装在一个事务中。这意味着要么所有操作都成功并提交（commit()），要么任何一个操作失败，所有操作都回滚（rollback()），保持数据的一致性。PyMySQL的连接对象默认支持事务，通过connection.commit()和connection.rollback()来控制。

错误日志和监控也是不可或缺的。在生产环境中，任何数据库连接失败、查询超时或SQL错误都应该被记录下来，并通过监控系统进行告警。这有助于你及时发现并解决潜在的数据库问题，保证服务的稳定性。

最后，参数化查询不仅是为了安全，也是一种良好的编码习惯。它能让你的SQL语句更清晰，避免手动拼接字符串的复杂性，并且能让数据库更好地缓存查询计划，提升效率。始终坚持使用参数化查询。

以上就是本文的全部内容了，是否有顺利帮助你解决问题？若是能给你带来学习上的帮助，请大家多多支持golang学习网！更多关于文章的相关知识，也可关注golang学习网公众号。

mysql 数据库连接连接池参数化查询 pymysql