📋 整体上云流程(按执行顺序)
阶段一:准备
评估与规划
在开始迁移前,必须完成充分的评估和准备工作,这是整个迁移成功的基础。
执行任务
- 业务场景评估:读多写少?事务要求?数据量级?
- 容量规划:预估存储空间、内存、CPU需求
- 选型决策:单机/主从/集群 vs 云数据库规格
- 云服务商对比:阿里云/腾讯云/AWS/华为云
- 制定迁移方案:选择迁移工具(DTS/备份恢复/双写)
- 确定迁移窗口:业务低峰期,预留足够时间
阶段二:搭建
云端环境准备
在云上创建目标数据库实例,配置网络和安全策略。
执行任务
- 创建云数据库实例(MySQL/Redis)
- 配置 VPC 网络 / 安全组 / 白名单
- 设置参数组(字符集、连接数、内存策略)
- 开启备份策略和日志
- 创建应用访问账号(权限最小化原则)
- 验证网络连通性(telnet/ping 测试)
阶段三:同步
数据同步
这是最核心的阶段,需要将源库数据完整、同步地迁移到云端。
执行任务
- 方式A - DTS迁移:配置全量+增量同步任务
- 方式B - 备份恢复:导出备份文件 → 上传云存储 → 导入
- 方式C - 双写方案:应用层同时写入新旧库
- 监控同步进度和延迟
- 定期校验数据一致性
- 记录 Binlog 位点 / RDB 快照位置
阶段四:割接
业务割接
在低峰期停止写入,进行最终数据校验后切换流量。
执行任务
- 通知业务方准备进入割接窗口
- 等待增量同步追平(数据一致)
- 停止应用写入(或开启只读)
- 断开所有数据库连接
- 执行最终数据校验(记录数、内容抽样)
- 修改连接串:老库地址 → 新库地址
- 启动应用,验证功能正常
阶段五:观察
观察与验证
割接后持续观察,确保云端运行稳定。
执行任务
- 监控核心指标:QPS、延迟、连接数、CPU、内存
- 验证业务功能:增删改查是否正常
- 检查日志:确认无异常错误
- 对比性能:是否比预期更好/更差
- 保留源库:建议保留 7-30 天
- 准备回滚方案:随时可切回
阶段六:收尾
完成与归档
确认一切正常后,完成迁移并归档文档。
执行任务
- 连续稳定运行 48-72 小时后,确认迁移成功
- 下线源库(或按需保留一段时间)
- 更新监控告警配置
- 更新文档:连接方式、账号密码、备份策略
- 复盘总结:记录问题、耗时、经验