博客
关于我
利用 SQLAlchemy 实现轻量级数据库迁移
阅读量:686 次
发布时间:2019-03-17

本文共 1548 字,大约阅读时间需要 5 分钟。

本文介绍结合 python 的几个工具,实现轻量级的数据库迁移。

在日常工作中,可能需要将数据迁移到不同的数据库,可以考虑下面一些简单的办法:

  • kettle 的多表复制向导,之前写过一篇博文:
  • 使用 CSV 作为中介,需要花时间处理字段的数据类型
  • 利用 sqlalchemy,之前写过一篇博文:。博文的操作过程还是比较繁琐,需要手工维护字段的数据类型

假设我们现在需要把 sql server 中 emp_master 表的数据迁移到 sqlite 数据库的同名表中。迁移的过程分为两步:

  • 基于源数据库的表结构,在目标数据库中创建表
  • 利用 pandas 的 dataframe 将数据传输到目标数据库

创建数据库表schema

首先利用 sqlacodegen 工具,生成 sqlalchemy ORM 模型:

sqlacodegen mssql+pymssql://user:pwd@localhost:1433/testdb > models.py -- tables emp_master

生成如下的代码,起始代码可能有些差异,手工修改一下:

# models.pyfrom sqlalchemy import Column, Integer, Stringfrom sqlalchemy.ext.declarative import declarative_baseBase = declarative_base()class EmpMaster(Base):    __tablename__ = 'emp_master'    EMP_ID = Column(Integer, primary_key=True)    GENDER = Column(String(10))    AGE = Column(Integer)    EMAIL = Column(String(50))    PHONE_NR = Column(String(20))    EDUCATION = Column(String(20))    MARITAL_STAT = Column(String(20))    NR_OF_CHILDREN = Column(Integer)

使用 sqlalchemy 在目标数据库中创建数据库和表:

# create_shcema.pyfrom sqlalchemy import create_enginefrom models import Baseengine = create_engine('sqlite:///employees.db')Base.metadata.create_all(engine)

利用 pandas dataframe 迁移数据

需要用到 read_sql() 方法读取数据到 dataframe,用到 dataframe 的 to_sql() 方法将数据发送的目标数据库:

# data_migrate.pyfrom sqlalchemy import create_engineimport pandas as pdsource_engine = create_engine('mssql+pymssql://user:pwd@localhost:1433/testdb')target_engine = create_engine('sqlite:///employees.db')df = pd.read_sql('emp_master', source_engine)df.to_sql('emp_master', target_engine, index=False, if_exists='replace')

转载地址:http://zjthz.baihongyu.com/

你可能感兴趣的文章
NIFI大数据进阶_内嵌ZK模式集群1_搭建过程说明---大数据之Nifi工作笔记0015
查看>>
NIFI大数据进阶_外部ZK模式集群1_实际操作搭建NIFI外部ZK模式集群---大数据之Nifi工作笔记0017
查看>>
NIFI大数据进阶_实时同步MySql的数据到Hive中去_可增量同步_实时监控MySql数据库变化_操作方法说明_01---大数据之Nifi工作笔记0033
查看>>
NIFI大数据进阶_离线同步MySql数据到HDFS_01_实际操作---大数据之Nifi工作笔记0029
查看>>
NIFI大数据进阶_离线同步MySql数据到HDFS_02_实际操作_splitjson处理器_puthdfs处理器_querydatabasetable处理器---大数据之Nifi工作笔记0030
查看>>
NIFI大数据进阶_离线同步MySql数据到HDFS_说明操作步骤---大数据之Nifi工作笔记0028
查看>>
NIFI大数据进阶_连接与关系_设置数据流负载均衡_设置背压_设置展现弯曲_介绍以及实际操作---大数据之Nifi工作笔记0027
查看>>
NIFI数据库同步_多表_特定表同时同步_实际操作_MySqlToMysql_可推广到其他数据库_Postgresql_Hbase_SqlServer等----大数据之Nifi工作笔记0053
查看>>
NIFI汉化_替换logo_二次开发_Idea编译NIFI最新源码_详细过程记录_全解析_Maven编译NIFI避坑指南001---大数据之Nifi工作笔记0068
查看>>
NIFI汉化_替换logo_二次开发_Idea编译NIFI最新源码_详细过程记录_全解析_Maven编译NIFI避坑指南002---大数据之Nifi工作笔记0069
查看>>
NIFI集群_内存溢出_CPU占用100%修复_GC overhead limit exceeded_NIFI: out of memory error ---大数据之Nifi工作笔记0017
查看>>
NIFI集群_队列Queue中数据无法清空_清除队列数据报错_无法删除queue_解决_集群中机器交替重启删除---大数据之Nifi工作笔记0061
查看>>
NIH发布包含10600张CT图像数据库 为AI算法测试铺路
查看>>
Nim教程【十二】
查看>>
Nim游戏
查看>>
NIO ByteBuffer实现原理
查看>>
Nio ByteBuffer组件读写指针切换原理与常用方法
查看>>
NIO Selector实现原理
查看>>
nio 中channel和buffer的基本使用
查看>>
NIO三大组件基础知识
查看>>