登录
首页 >  文章 >  python教程

Python数据库操作教程:CRUD实战详解

时间:2025-09-02 20:36:59 451浏览 收藏

掌握Python数据库操作是提升开发效率的关键。本文详细讲解了如何使用Python进行数据库的CRUD操作,并着重介绍了使用`sqlite3`模块连接数据库、创建游标、执行SQL语句以及提交事务的完整流程。同时,强调了**参数化查询**在防止SQL注入攻击中的重要作用,并提供了实际代码示例。此外,还深入探讨了事务管理,确保数据的一致性和完整性,避免数据丢失或损坏。学习本文,你将能够安全高效地使用Python操作数据库,为你的项目保驾护航。

Python操作数据库需通过驱动建立连接并执行SQL,遵循连接、创建游标、执行SQL、提交事务、关闭连接的流程,使用参数化查询防SQL注入,结合try-except-finally管理事务确保数据一致性。

Python怎样操作数据库_Python数据库CRUD步骤解析

Python操作数据库的核心在于通过特定的数据库驱动(如sqlite3psycopg2mysql-connector-python等)建立连接,然后利用这个连接来执行SQL语句,完成数据的增、删、改、查(CRUD)操作。这过程通常涉及连接数据库、创建游标、执行SQL、提交事务(对数据进行修改时)以及关闭连接几个基本步骤。

解决方案

要使用Python操作数据库,我们通常会遵循一套相对标准的流程,这套流程基于Python的DB-API 2.0规范,虽然具体实现会因数据库类型和所选驱动而异,但核心逻辑是相通的。这里以Python内置的sqlite3模块为例,演示如何进行CRUD操作。

首先,你需要一个数据库文件。如果文件不存在,sqlite3会自动创建一个。

import sqlite3

# 1. 连接数据库
# 如果数据库文件不存在,会自动创建
try:
    conn = sqlite3.connect('my_database.db')
    print("数据库连接成功。")

    # 2. 创建游标对象
    # 游标用于执行SQL命令
    cursor = conn.cursor()

    # 3. 创建表(如果不存在)- Create Schema
    cursor.execute('''
        CREATE TABLE IF NOT EXISTS users (
            id INTEGER PRIMARY KEY AUTOINCREMENT,
            name TEXT NOT NULL,
            email TEXT UNIQUE NOT NULL,
            age INTEGER
        )
    ''')
    conn.commit() # 提交事务,保存表结构更改
    print("表 'users' 创建或已存在。")

    # --- CRUD 操作示例 ---

    # C - Create (插入数据)
    # 使用参数化查询防止SQL注入
    user_data = [
        ('Alice', 'alice@example.com', 30),
        ('Bob', 'bob@example.com', 24),
        ('Charlie', 'charlie@example.com', 35)
    ]
    for name, email, age in user_data:
        try:
            cursor.execute("INSERT INTO users (name, email, age) VALUES (?, ?, ?)", (name, email, age))
            print(f"插入用户: {name}")
        except sqlite3.IntegrityError:
            print(f"用户 {name} ({email}) 已存在,跳过插入。")
    conn.commit() # 提交事务,保存数据更改

    # R - Read (查询数据)
    print("\n--- 查询所有用户 ---")
    cursor.execute("SELECT id, name, email, age FROM users")
    users = cursor.fetchall() # 获取所有结果
    for user in users:
        print(f"ID: {user[0]}, 姓名: {user[1]}, 邮箱: {user[2]}, 年龄: {user[3]}")

    print("\n--- 查询特定用户(年龄大于25)---")
    cursor.execute("SELECT name, email FROM users WHERE age > ?", (25,))
    older_users = cursor.fetchall()
    for user in older_users:
        print(f"姓名: {user[0]}, 邮箱: {user[1]}")

    # U - Update (更新数据)
    print("\n--- 更新用户数据 ---")
    new_email = 'alice_new@example.com'
    old_email = 'alice@example.com'
    cursor.execute("UPDATE users SET email = ? WHERE email = ?", (new_email, old_email))
    if cursor.rowcount > 0:
        print(f"用户 {old_email} 的邮箱已更新为 {new_email}。")
    else:
        print(f"未找到邮箱为 {old_email} 的用户进行更新。")
    conn.commit() # 提交事务

    # 再次查询确认更新
    print("\n--- 确认更新后的用户数据 ---")
    cursor.execute("SELECT name, email FROM users WHERE email = ?", (new_email,))
    updated_alice = cursor.fetchone()
    if updated_alice:
        print(f"更新后的Alice: 姓名: {updated_alice[0]}, 邮箱: {updated_alice[1]}")

    # D - Delete (删除数据)
    print("\n--- 删除用户数据 ---")
    user_to_delete = 'Bob'
    cursor.execute("DELETE FROM users WHERE name = ?", (user_to_delete,))
    if cursor.rowcount > 0:
        print(f"用户 {user_to_delete} 已被删除。")
    else:
        print(f"未找到用户 {user_to_delete} 进行删除。")
    conn.commit() # 提交事务

    # 再次查询确认删除
    print("\n--- 确认删除后的所有用户 ---")
    cursor.execute("SELECT name FROM users")
    remaining_users = cursor.fetchall()
    if remaining_users:
        print("当前剩余用户:", [user[0] for user in remaining_users])
    else:
        print("数据库中已无用户。")

except sqlite3.Error as e:
    print(f"数据库操作发生错误: {e}")
finally:
    # 4. 关闭连接
    if conn:
        conn.close()
        print("\n数据库连接已关闭。")

这段代码展示了一个完整的CRUD流程。需要注意的是,每次对数据库进行修改(INSERT, UPDATE, DELETE)后,都需要调用conn.commit()来保存更改。如果发生错误或需要撤销操作,可以使用conn.rollback()

Python连接主流数据库有哪些常用库?如何选择合适的数据库驱动?

在Python的世界里,连接各种数据库的库非常丰富,这得益于Python DB-API 2.0规范的存在,它为数据库驱动提供了一套统一的接口。这使得我们在切换不同数据库时,核心的CRUD逻辑可以保持相对一致。

常用数据库连接库(驱动):

  • SQLite: Python标准库内置了sqlite3模块。这是最方便的选项,无需额外安装,适用于小型应用、本地数据存储或开发测试。
  • PostgreSQL: psycopg2是PostgreSQL最流行、功能最强大的驱动。它支持大多数PostgreSQL特性,性能也很好。另一个选择是asyncpg,专为异步操作设计,性能极高。
  • MySQL: mysql-connector-python是Oracle官方提供的Python驱动。PyMySQL是另一个纯Python实现的MySQL客户端库,兼容DB-API 2.0,且在某些场景下可能更易于安装和使用。
  • SQL Server: pyodbc是一个通用的ODBC驱动,可以连接到任何支持ODBC的数据库,包括SQL Server。微软也提供了mssql-tools和相关的Python驱动。
  • Oracle: cx_Oracle(现在改名为python-oracledb)是Oracle官方的Python接口,提供了对Oracle数据库的全面支持。

如何选择合适的数据库驱动?

选择合适的数据库驱动,不仅仅是看它能连上数据库,更要考虑项目的实际需求和未来的发展。

  1. 目标数据库类型: 这是最直接的决定因素。如果你用的是PostgreSQL,那自然要看psycopg2;MySQL则可能在mysql-connector-pythonPyMySQL之间选择。
  2. 性能要求: 对于高并发、大数据量的应用,驱动的性能至关重要。例如,异步驱动(如asyncpg)在某些场景下能提供显著的性能优势。
  3. 特性支持: 某些数据库有其独特的高级特性(如JSONB类型、地理空间数据、存储过程等),你需要确保所选驱动能够良好地支持这些特性。
  4. 社区活跃度和维护状态: 一个活跃的社区意味着遇到问题时更容易找到解决方案,库也会持续得到更新和维护,修复bug,增加新功能。
  5. ORM框架的兼容性: 如果你打算使用ORM(如SQLAlchemy、Django ORM),那么你需要选择一个与ORM兼容且推荐的驱动。通常,ORM会指定或推荐其最佳配合的驱动。
  6. 易用性和文档: 良好的文档和清晰的API设计能大大降低开发难度和学习成本。
  7. 许可协议: 检查驱动的许可协议是否与你的项目兼容。大多数开源驱动都是MIT、BSD或Apache等宽松许可。

我个人在选择时,倾向于优先选择官方或社区广泛推荐的驱动,因为它们通常更稳定、功能更全面、社区支持更好。如果项目对性能有极致要求,我才会深入研究异步驱动或更底层的实现。

在Python中执行SQL查询时,如何有效防止SQL注入攻击?

SQL注入是数据库安全领域一个老生常谈但又极其重要的议题。它发生在应用程序将用户输入直接拼接进SQL查询字符串,导致恶意用户可以通过输入特定的SQL片段来改变查询的意图,从而窃取、篡改数据甚至完全控制数据库。防止SQL注入,在Python中,核心且最有效的方法是使用参数化查询(Parameterized Queries),也称为预处理语句(Prepared Statements)

参数化查询的原理:

参数化查询的原理是SQL代码和查询参数是分开传递给数据库的。数据库会先解析SQL语句的结构,确定要执行的操作,然后将参数值绑定到相应的位置。这样,即使参数中包含恶意的SQL片段,数据库也只会将其视为普通的数据值,而不是可执行的SQL代码。

Python中的实现:

几乎所有的Python数据库驱动都支持参数化查询。它们通常使用占位符(placeholder)来表示参数。占位符的样式会因驱动而异:

  • sqlite3psycopg2 (PostgreSQL): 使用问号 ? 作为位置占位符。

    import sqlite3
    
    conn = sqlite3.connect('my_database.db')
    cursor = conn.cursor()
    
    user_input_name = "Robert'); DROP TABLE users;--" # 恶意输入
    user_input_email = "robert@example.com"
    
    # 错误示例:直接拼接字符串,易受SQL注入攻击
    # cursor.execute(f"INSERT INTO users (name, email) VALUES ('{user_input_name}', '{user_input_email}')")
    
    # 正确示例:使用参数化查询
    cursor.execute("INSERT INTO users (name, email) VALUES (?, ?)", (user_input_name, user_input_email))
    conn.commit()
    print("使用参数化查询,恶意输入被当作普通数据处理。")
    conn.close()

    在这个例子中,即使user_input_name包含DROP TABLE users,数据库也只会把它当成一个长字符串,而不是执行删除表的命令。

  • mysql-connector-pythonPyMySQL (MySQL): 通常使用%s作为位置占位符,或者%(name)s作为命名占位符。

    # 假设你已经连接了MySQL数据库
    # import mysql.connector
    # conn = mysql.connector.connect(...)
    # cursor = conn.cursor()
    
    # user_input_name = "Robert'); DROP TABLE users;--"
    # user_input_email = "robert@example.com"
    
    # 使用位置占位符
    # cursor.execute("INSERT INTO users (name, email) VALUES (%s, %s)", (user_input_name, user_input_email))
    
    # 使用命名占位符(更具可读性)
    # cursor.execute("INSERT INTO users (name, email) VALUES (%(name)s, %(email)s)",
    #                {'name': user_input_name, 'email': user_input_email})
    # conn.commit()

注意事项:

  • 永远不要直接用f-string或字符串格式化来构建SQL查询。 这是导致SQL注入的罪魁祸首。
  • 不仅仅是INSERT语句,SELECTUPDATEDELETE等所有涉及用户输入的查询都必须使用参数化。
  • LIKE子句的参数化: 如果在LIKE子句中使用%_通配符,你需要将这些通配符添加到参数值中,而不是添加到SQL字符串中。
    search_term = "%Alice%" # 通配符是参数值的一部分
    cursor.execute("SELECT name FROM users WHERE name LIKE ?", (search_term,))
  • 表名或列名的动态化: 如果需要动态指定表名或列名,参数化查询是无能为力的,因为它只对值进行参数化。在这种情况下,你需要对表名/列名进行严格的白名单校验,确保它们只包含预期的、安全的字符串,或者使用ORM的API来处理。

通过始终坚持使用参数化查询,可以极大地提高应用程序的数据库安全性,有效抵御SQL注入攻击。

使用Python操作数据库时,如何管理事务以确保数据一致性?

事务(Transaction)是数据库管理系统(DBMS)执行过程中的一个逻辑工作单元,它包含一系列操作,这些操作要么全部成功提交,要么全部失败回滚。事务的核心目的是确保数据的一致性(Consistency)原子性(Atomicity)隔离性(Isolation)持久性(Durability),通常称为ACID特性。在Python中操作数据库时,正确管理事务对于维护数据的完整性和可靠性至关重要。

Python中的事务管理:

大多数Python数据库驱动都遵循DB-API 2.0规范,提供了明确的事务管理机制:

  1. conn.commit():提交事务 当一系列数据库操作(如多个INSERTUPDATEDELETE)都成功执行,并且你希望将这些更改永久保存到数据库时,需要调用conn.commit()。这会结束当前的事务,并使所有更改可见。

  2. conn.rollback():回滚事务 如果在事务执行过程中发生了错误,或者某个操作失败了,你可能不希望之前的所有更改生效。这时可以调用conn.rollback(),它会将数据库恢复到事务开始前的状态,撤销所有未提交的更改。

  3. 默认行为:

    • 许多数据库(如PostgreSQL、MySQL)在执行单个INSERT/UPDATE/DELETE语句后,如果没有明确的BEGIN TRANSACTION,可能会默认开启一个隐式事务。
    • sqlite3模块默认是自动提交(autocommit)模式,这意味着每个execute()调用都会立即提交。为了进行显式事务管理,你需要禁用自动提交或确保在连接时就进入事务模式。不过,更常见和推荐的做法是,在进行修改操作后,统一调用conn.commit()来提交事务。如果你没有调用conn.commit(),那么对数据库的修改将不会被保存。

事务管理的典型场景和实践:

假设我们有一个转账操作,需要从一个账户扣钱,同时给另一个账户加钱。这两个操作必须作为一个整体成功或失败。

import sqlite3

conn = sqlite3.connect('bank.db')
cursor = conn.cursor()

# 创建账户表
cursor.execute('''
    CREATE TABLE IF NOT EXISTS accounts (
        id INTEGER PRIMARY KEY AUTOINCREMENT,
        name TEXT NOT NULL,
        balance REAL NOT NULL DEFAULT 0.0
    )
''')
conn.commit()

# 初始化账户(如果不存在)
def ensure_account(name, initial_balance):
    cursor.execute("SELECT id FROM accounts WHERE name = ?", (name,))
    if not cursor.fetchone():
        cursor.execute("INSERT INTO accounts (name, balance) VALUES (?, ?)", (name, initial_balance))
        conn.commit()
        print(f"创建账户: {name}, 余额: {initial_balance}")

ensure_account('Alice', 1000.0)
ensure_account('Bob', 500.0)

def transfer_money(sender_name, receiver_name, amount):
    if amount <= 0:
        print("转账金额必须大于零。")
        return False

    try:
        # 开始事务
        # 在sqlite3中,只要不调用commit,所有的修改都会累积在一个事务中
        # 显式地,你也可以用 BEGIN TRANSACTION

        # 1. 检查发送方余额
        cursor.execute("SELECT balance FROM accounts WHERE name = ?", (sender_name,))
        sender_balance = cursor.fetchone()[0]

        if sender_balance < amount:
            print(f"账户 {sender_name} 余额不足。")
            conn.rollback() # 余额不足,回滚事务
            return False

        # 2. 从发送方账户扣款
        cursor.execute("UPDATE accounts SET balance = balance - ? WHERE name = ?", (amount, sender_name))

        # 模拟一个可能发生的错误,例如网络中断、数据库死锁等
        # if sender_name == 'Alice' and amount == 200:
        #    raise ValueError("模拟转账失败!")

        # 3. 给接收方账户加款
        cursor.execute("UPDATE accounts SET balance = balance + ? WHERE name = ?", (amount, receiver_name))

        # 所有操作成功,提交事务
        conn.commit()
        print(f"成功从 {sender_name} 转账 {amount} 到 {receiver_name}。")
        return True

    except Exception as e:
        print(f"转账过程中发生错误: {e}")
        conn.rollback() # 发生任何错误,回滚事务
        return False

# 尝试转账
print("\n--- 首次转账 ---")
transfer_money('Alice', 'Bob', 100.0)

# 查看账户余额
print("\n--- 账户余额 ---")
cursor.execute("SELECT name, balance FROM accounts")
for account in cursor.fetchall():
    print(f"账户: {account[0]}, 余额: {account[1]}")

# 尝试一个会失败的转账(余额不足)
print("\n--- 尝试失败转账(余额不足) ---")
transfer_money('Bob', 'Alice', 1000.0)

# 再次查看账户余额,确认未发生更改
print("\n--- 账户余额(失败转账后) ---")
cursor.execute("SELECT name, balance FROM accounts")
for account in cursor.fetchall():
    print(f"账户: {account[0]}, 余额: {account[1]}")

conn.close()

关键点:

  • try...except...finally 结构: 这是处理事务的黄金法则。在try块中执行所有数据库操作,如果一切顺利,在try块的末尾调用conn.commit()。如果try块中发生任何异常,在except块中捕获并调用conn.rollback()来撤销所有更改。finally块通常用于确保连接被关闭,无论事务成功与否。

  • 上下文管理器(with语句): 对于资源管理,Python的with语句是一个非常优雅的解决方案。它能确保在代码块执行完毕后,资源(如文件、数据库连接)被正确关闭。虽然DB-API 2.0本身没有强制要求连接对象支持with语句,但许多高级库和ORM框架(如SQLAlchemy)都提供了这样的功能,或者你可以自己实现一个上下文管理器。

    # 示例:使用with语句管理连接(如果conn对象支持)
    # 在sqlite3中,连接对象本身不支持with,但我们可以通过自定义上下文管理器或使用ORM来实现
    # 对于sqlite3,更常见的模式是:
    # with sqlite3.connect('my_database.db') as conn:
    #     cursor = conn.cursor()
    #     # ... 执行操作 ...
    #     # conn.commit() 在with块结束时会自动提交,如果没发生

理论要掌握,实操不能落!以上关于《Python数据库操作教程:CRUD实战详解》的详细介绍,大家都掌握了吧!如果想要继续提升自己的能力,那么就来关注golang学习网公众号吧!

相关阅读
更多>
最新阅读
更多>
课程推荐
更多>