MySQL数据库之pymysql模块

1 概述

 pymysql是Python中的一个类库, 主要是通过python代码来操作SQL语句的。

1.1 pymysql模块的作用

问题: 我们如何将10万行数据插入到数据库?

回答: 我们发现如果用之前客户端几乎是不可能完全这个任务的, 因为我们不可能去构造出那个插入10万行数据的SQL. 可是,如果我们有一个功能能够插入一行数据,借助程序强大的特点:重复,就可以轻而易举的就将10w行数据收入麾下. 我们可以使用pymysql模块完成在Python中实现这样的操作。

 1.2 Python中操作MySQL步骤

操作步骤:

  1. 导入模块             # import pymysql
  2. 创建连接对象      # connect,即python连接mysql数据库的对象
  3. 创建游标             # curdor,可以执行SQL语句的对象
  4. 执行sql语句,获取结果集
  5. 操作结果集
  6. 释放资源

 2 pymysql查询数据

# 1.导包 
import pymysql # 若没有安装这个库,安装此库的命令:pip install pymysql
 
# 2.创建连接对象
conn = pymysql.connect(
    host='数据库所在机器的IP地址',    # 本机就写:localhost
    port=3306,                 # 要连接到的数据库端口号,MySQL是3306
    user='账号',                # 数据库的用户名
    password='密码',            # 数据库的密码
    database='数据库名称',      # 要操作的数据库
    charset='utf8'             # 码表
)
 
# 3.创建游标--可执行SQL语句的对象
cursor = conn.cursor()
 
# 4.执行SQL语句,获取结果集---假如需求是:查询order表中所有的订单信息
sql = 'select * from order;'  #order是要操作的数据库中的表名
row_count = cursor.execute(sql)   # 执行SQL语句,返回 受影响的行数
print(f'首影响的行数为:{row_count}')
 
# 5.操作结果集
data1 = cursor.fetchone()   # 获取一条数据,元组封装
data2 = cursor.fetchmany(6)   # 获取6条数据,元组嵌套的方式  ((第一条),(第二条)...)
data3 = cursor.fetchall()    # 获取所有数据,元组嵌套的方式  ((第一条),(第二条)...)
#查看data3
for line in data3:
    print(line)
 
# 6.释放资源
cursor.close()
conn.close()

3. 数据提交和数据回滚

 3.1 数据提交:commit()

 数据库中的基本操作: 增删改查. 上一个章节中我们知道如何完成对数据库中数据的获取其实也就是, 比如获取一条数据或者获取所有数据等. 接下来我们学习下如何增删改。

查数据, 并不会对原有数据库中的数据造成影响. 而增删改这三个操作都会对原有数据库中的数据造成影响,也就说查数据不会修改原有数据空中的数据, 而增删改会修改原有数据库中的数据。

当对原有数据库中数据有修改时需要使用commit()提交数据到数据库:conn.commit()
这里可以理解为:数据库询问是否确定修改数据,然后commit()就是确定修改的意思。

3.2  数据回滚:rollback() 

 当我们在使用pymysql对数据进行相应的操作时, 会有可能会有一些错误操作, 这时如果想要数据返回到最原始的状态可以使用数据回滚操作。

数据回滚是需要在 commit() 之前才有效, 也就是说数据还没有确定修改这时候使用数据回滚才是有效的。

回滚数据到什么都没做的原始状态 即撤销刚刚所有的修改操作:conn.rollback()
 

4 pymysql的增删改查操作

 案例: 演示pymysql的curd操作, 增删改操作(更新语句), 记得要提交事务, 否则结果不会被写到数据表中。

首先在要操作的数据库中创建一个数据表

# 新建poets表  包括:诗人-出生年份-代表作品
create table poets(
    id int primary key auto_increment,
    name varchar(10),   # 姓名
    birthyear int,   # 出生年份
    masterpiece varchar(10)  # 代表作
);
 
 
# 查看数据表
select * from poets;

4.1增加数据的操作

import pymysql
 
# 增
def add_data():
    # 1 获取连接对象
    conn = pymysql.connect(host='IP地址',port=3306,
        user='用户名',password='密码',
        database='数据库名称',charset='utf8')
    
    # 2 获取游标对象
    cursor = conn.cursor()
    
    # 3 执行SQL语句,获取结果集---在poets表中添加:王维,693年出生,代表作品《山居秋暝》
    sql = 'insert into poets values(null,"李白",701,"将进酒"),(null,"王维",693,"山居秋暝"),(null,"白居易",772,"钱塘湖春行");'
    row_count = cursor.execute(sql)
    ptint(f'受影响的行数:{row_count}')
 
    # 4 操作结果集---提交事务
    conn.commit()
 
    # 5 释放资源
    cursor.close()
    conn.close()
 
 
 
# main函数, 作为程序的主入口.
if __name__ == '__main__':
    # 测试: 添加数据.
    add_data()

安全方式插入

插入操作中参数可以以元组、列表和字典形式传入,需要使用到占位符 “%s”,注意这只是个占位符,不同于Python 中字符串格式化中的转换说明符。
# 元组、列表形式传参
sql = 'insert into player_info_test(PERSON_ID,PERSON_NAME,AGE) VALUES(%s, %s, %s)'
try:
    cursor.execute(sql, ("999999", "kenny", 28))
    conn.commit()
except Exception as e:
    conn.rollback()
    print(e)
finally:
    cursor.close()
    conn.close()


# 字典形式传参
sql = 'insert into player_info_test(PERSON_ID,PERSON_NAME,AGE) VALUES(%(person_id)s, %(person_name)s, %(age)s)'
try:
    cursor.execute(sql, {"person_id": "999998", "person_name": "kenny", "age": 28})
    conn.commit()
except Exception as e:
    conn.rollback()
    print(e)
finally:
    cursor.close()
    conn.close()

批量插入操作

sql = 'insert into player_info_test(PERSON_ID,PERSON_NAME,AGE) VALUES(%s, %s, %s)'
param = [("999999", "kenny", 28), (["999998", "liu", 28)]   # 元组列表作为传入参数
try:
    cursor.executemany(sql, param)
    conn.commit()
except Exception as e:
    conn.rollback()
    print(e)
finally:
    cursor.close()
    conn.close()

4.2 修改数据的操作

# 改
def update_data():
    # 1 获取连接对象.
    conn = pymysql.connect(host='IP地址',port=3306,
        user='用户名',password='密码',
        database='数据库名称',charset='utf8')
    
    # 2 获取游标对象
    cursor = conn.cursor()
 
    # 3 执行SQL语句,获取结果集
    sql = 'update poets set name="杜甫",birthyear=712,masterpiece="望岳" where id = 2;'
    row_count=cursor.execute(sql)
    ptint(f'受影响的行数:{row_count}')
 
    # 4 操作结果集---提交事务
    conn.commit()
 
    # 5 释放资源
    cursor.close()
    conn.close()
 
 
 
# main函数, 作为程序的主入口.
if __name__ == '__main__':
    # 测试: 修改数据.
    update_data()

占位符方式操作

sql = 'update  player_info_test set PERSON_NAME=%s where PERSON_ID = %s'
try:
    cursor.execute(sql, ['liu', '999998'])
    conn.commit()
except Exception as e:
    conn.rollback()
    print(e)
finally:
    cursor.close()
    conn.close()

4.3 删除数据的操作

# 删
def delete_data():
    # 1. 获取连接对象.
    conn = pymysql.connect(host='IP地址',port=3306,
        user='用户名',password='密码',
        database='数据库名称',charset='utf8')
    
    # 2 获取游标对象
    cursor = conn.cursor()
 
    # 3 执行SQL语句,获取结果集
    sql = 'delete from poets where id = 3;'
    row_count = cursor.execute(sql)
    print(f'受影响的行数为: {row_count}')
 
    # 4 操作结果集.
    conn.commit()
 
    # 5 释放资源.
    cursor.close()
    conn.close()
 
 
 
# main函数, 作为程序的主入口.
if __name__ == '__main__':
    # 测试: 删除数据.
    delete_data()

占位符方式操作

sql = 'delete from  player_info_test where PERSON_ID = %s'
try:
    cursor.execute(sql, ['999999'])
    conn.commit()
except Exception as e:
    conn.rollback()
    print(e)
finally:
    cursor.close()
    conn.close()

4.4 查询数据的操作 

# 查
def query_data():
    # 1 获取连接对象.
    conn = pymysql.connect(host='IP地址',port=3306,
        user='用户名',password='密码',
        database='数据库名称',charset='utf8')
    
    # 2 获取游标对象
    cursor = conn.cursor()
 
    # 3 执行SQL语句,获取结果集
    sql = 'select * from poets;'
    row_count = cursor.execute(sql)
    print(f'受影响的行数为: {row_count}')
 
    # 4 操作结果集.
    datas = cursor.fetchall()
    for line in datas:
        print(line)
 
    # 5 释放资源.
    cursor.close()
    conn.close()
 
 
 
 
# main函数, 作为程序的主入口.
if __name__ == '__main__':
    # 测试: 查询数据.
    query_data()

例子2:

import pymysql
conn = pymysql.connect(
    host='127.0.0.1',
    user='python_link',
    password='python_link',
    port=3306,
    database='nba_data'
)
# 创建游标,查询数据以元组形式返回
# cursor = conn.cursor()

# 创建游标,查询数据以字典形式返回
cursor = conn.cursor(pymysql.cursors.DictCursor)

sql = 'select * from player_info_test limit 10'
try:
    cursor.execute(sql)
    # result = cursor.fetchall()  # 返回所有数据
    # result = cursor.fetchone()  # 返回一行数据
    result = cursor.fetchmany(2)  # fetchmany(size) 获取查询结果集中指定数量的记录,size默认为1
    print(result)
except Exception as e:
    conn.rollback()
    print(e)
finally:
    cursor.close()
    conn.close()

5 pymysql演示注入攻击及解决方法 

5.1 注入攻击

import pymysql
 
# 0. 提示用户录入他/她的账号 或 密码.
uname = input('请录入您的账号: ')
pwd = input('请录入您的密码: ')
 
# 1. 获取连接对象.
conn = pymysql.connect(host='IP地址',port=3306,
        user='用户名',password='密码',
        database='数据库名称',charset='utf8')
    
# 2 获取游标对象
cursor = conn.cursor()
 
# 3 执行SQL语句,获取结果集
 
# SQL写法1: 插值表达式.
# sql = f"select * from users where username='{uname}' and password='{pwd}';"
 
# SQL写法2:占位符
sql = "select * from user where username='%s' and password='%s';" %(uname, pwd)
row_count = cursor.execute(sql)
 
# 4. 操作结果集.
print("登陆成功" if row_count > 0 else "登陆失败")
 
# 5. 释放资源.
cursor.close()
conn.close()

5.2 解决注入攻击

 解决SQL注入攻击问题的思路: 预编译 + 占位符思想,  提前先对SQL语句进行预编译, 这一步已经确定SQL语句的格式了, 之后无论传入什么内容, 都只会当做普通字符来处理。

import pymysql
 
# 0. 提示用户录入他/她的账号 或 密码.
uname = input('请录入您的账号: ')
pwd = input('请录入您的密码: ')
 
# 1. 获取连接对象.
conn = pymysql.connect(host='IP地址',port=3306,
        user='用户名',password='密码',
        database='数据库名称',charset='utf8')
    
# 2 获取游标对象
cursor = conn.cursor()
 
# 3 执行SQL语句,获取结果集
# 细节1: %s代表要添加的内容, 在这一步已经确定好SQL语句的格式了, 之后无论传入什么内容, 都只会当做普通的字符来处理.
sql = "select * from users where username=%s and password=%s;"    
 
# 细节2: 给占位符填充值, 即: 定义1个列表, 记录: 一会儿要填充到SQL语句中的值.
params = [uname, pwd]
 
# 细节3: 执行SQL语句时, 传入参数(列表)即可.
row_count = cursor.execute(sql, params)
 
# 4. 操作结果集.
print("登陆成功" if row_count > 0 else "登陆失败")
 
# 5. 释放资源.
cursor.close()
conn.close()

6 pymysql操作事务

MySQL默认开启了事务的自动提交功能, 每个语句都是1个单独的事务, 执行之后, 就会提交. 

import pymysql
 
# 1. 获取连接对象.
conn = pymysql.connect(host='IP地址',port=3306,
        user='用户名',password='密码',
        database='数据库名称',charset='utf8')
    
# 2 获取游标对象
cursor = conn.cursor()
 
try:
    # 这里写的是, 可能出问题的代码, 即: 具体的转账逻辑.
    # 开启事务, 标记着: 转账从这里开始.
    conn.begin()
 
    # 3. 执行SQL语句, 获取结果集.
    # 3.1 张三 - 1000元
    sql1 = 'update account set money = money - 1000 where name="张三";'
    row_count1 = cursor.execute(sql1)
 
    # 模拟程序出问题了.
    # print(1 / 0)
 
    # 3.2 李四 + 1000元
    sql2 = 'update account set money = money + 1000 where name="李四";'
    row_count2 = cursor.execute(sql2)
except Exception as e:
    # 走这里, 说明程序出问题了, 提示, 然后回滚即可.
    conn.rollback()     # 事务回滚
    print('程序出问题了, 请稍后再试!')
else:
    # 走到这里, 说明try没有问题, 提交事务即可.
    conn.commit()       # 提交事务
    print('转账成功' if row_count1 == 1 and row_count2 == 1 else '转账失败')
 
finally:
    # 释放资源, 无论try内容成功与否, 都会走这里.
    cursor.close()
    conn.close()
    print('释放资源完毕!')

SQL防注入

SQL注入是一种常见的网络攻击手法,它利用sql的语法特性和程序员编写程序时产生的漏洞,用一些特殊符号的组合产生特殊的含义,使得正常的sql语句失效,从而逃脱正常的业务逻辑,完成一些如跳过密码验证等的非法操作。

产生原因:SQL语句使用了动态拼接的方式。

比如,登录时,使用以下SQL查询验证用户信息

'SELECT username FROM user WHERE username = %s AND password = %s' % (username ,password)

并且,没有对用户的输入做任何处理,直接放到了SQL语句中。那么,当黑客输入了’jjyang’ OR 1=1 – jjyang 作为用户名时,原来的SQL语句就会变成下面的样子:

SELECT username FROM user WHERE username = 'jjyang' OR 1=1 -- jjyang AND password=''

WHERE username = ‘jjyang’ OR 1=1 是一个恒成立的条件,所以无论输入什么用户名都会返回True;而–后面的语句被当作注释忽略掉了,密码验证也被跳过。最终,绕过验证,成功登录。

针对参数不要采用拼接处理,交给pymysql中的方法(execute)自动处理,并对输入数据进行检查校验

# 元组,列表形式
param = ('jjyangs','123445')
sql = 'SELECT username FROM user WHERE username = %s AND password = %s'
cursor.execute(sql, param)

# 字典形式
param = {'name':'jjyangs','pwd':'123445'}
sql = 'SELECT username FROM user WHERE username = %(name)s AND password = %(pwd)s'
cursor.execute(sql, param)

需要注意的是,不要因为参数是其他类型而换掉 %s,pymysql 的占位符并不是 python 的通用格式化转换说明符。同时,也不要因为参数是 string 就在 %s 两边加引号,mysql 会自动去处理。

connect() 函数常用参数:

参数说明
dsn数据源名称,给出该参数表示数据库依赖
host=None数据库连接地址
user=None数据库用户名
password=‘’数据库用户密码
database=None要连接的数据库名称
port=3306端口号,默认为3306
charset=‘’要连接的数据库的字符编码(可以在终端登陆mysql后使用 \s 查看,如下图)
connect_timeout=10连接数据库的超时时间,默认为10
port=3306端口号,默认为3306

 connect() 函数返回的连接对象的方法总结:

方法名说明
close()关闭数据库的连接
commit()提交事务
rollback()回滚事务
cursor()获取游标对象,操作数据库,如执行DML操作,调用存储过程等

 游标对象的方法:

方法名说明
callproc(procname,[,parameters])调用存储过程,需要数据库支持
close()关闭当前游标
execute(operation,[,parameters])执行数据库操作,sql语句或者数据库命令
executemany(operation, seq_of_params)用于批量操作
fetchone()获取查询结果集合中的下一条记录
fetchmany(size)获取指定数量的记录
fetchall()获取查询结果集合所有记录
nextset()跳至下一个可用的数据集
arraysize指定使用fetchmany()获取的行数,默认为1
setinputsizes(size)设置调用execute*()方法时分配的内存区域大小
setoutputsizes(size)设置列缓冲区大小,对大数据列尤其有用