介绍
手动将数据导入数据库,尤其是当数据库中有很多表时,不仅很烦人,而且还很耗时。通过使用 python 库可以使这变得更容易。
从kaggle下载绘画数据集。绘画数据集由 8 个 csv 文件组成,我们将使用简单的 python 脚本将其导入到数据库中,而不是手动将数据导入到数据库表中。
导入数据的步骤
- 在pg-admin中创建数据库并命名为painting
create database painting
- 打开jupyter笔记本并安装python库
pip install sqlalchemy pip install pandas
- 导入python库
import pandas as pd from sqlalchemy import create_engine
- 创建与您的 pg-admin 数据库的连接
conn_string = 'postgresql://postgres:1344@localhost/painting' db = create_engine(conn_string) conn = db.connect()
在 conn_string 中存储我们数据库的 url,其中 postgresql 是我们的数据库,因为我们在 pg-admin 中创建了数据库,postgres 是我们数据库名称 pg-admin 的默认名称,1344 是我们 pg-admin 的密码,@localhost 是主机名和绘画是我们的数据库名称
- 将文件加载到您的数据库
files = ['artist', 'canvas_size', 'image_link', 'museum', 'museum_hours', 'product_size', 'subject', 'work'] for file in files: df = pd.read_csv(fr"C:UsersAdminDesktopfamous painti{file}.csv") df.to_sql(file, con = conn, if_exists='replace', index = False)
files 是我们希望命名绘画数据库中的表的名称。使用 for 循环以便我们可以迭代我们的文件。 pd.read csv中的fr代表f字符串和原始数据。 index 必须设置为 false 才能不导入默认的 pandas 索引。
立即学习“Python免费学习笔记(深入)”;
结论
我们已经学习了如何使用python和mysql connector在mysql服务器中创建一个全新的数据库,在该数据库中创建表而不是手动执行。