1.
方案概述与目标
(1)目標:以「台湾原生VPS + 公有云主机」混合部署,達到低延遲、快速故障切換與抗DDoS能力。
(2)业务场景:面向台湾本地用户的电商/媒体/API 服务,要求 99.95% 可用性與秒级域名切換。
(3)核心组件:本地 VPS 节点、云端备用主机、Anycast CDN、DNS 健康检查、LVS/HAProxy/nginx 负载均衡。
(4)关键指标:目标 RTO ≤ 60s,RPO ≤ 5min,最大可承受突发流量 5Gbps(需 CDN 协助)。
(5)运维原则:自动化(Ansible/Terraform)、观测(Prometheus/Grafana)、日志集中(ELK/Tempo)。
2.
网络与域名策略
(1)DNS:使用支持健康检查与低TTL(60s)的 DNS 供应商(例如 Cloudflare / DNSMadeEasy),主记录设置台湾 VPS 优先、备用指向云主机。
(2)TTL 策略:生产 TTL=60s,缓存记录 300s 以下用于快速切换;MX/SPF 等邮件记录维持较长 TTL。
(3)Anycast 与 CDN:部署 Cloudflare/ArvanCloud 等 Anycast CDN,台湾 POP 覆盖台北/高雄,將靜態資源完全上鏈到 CDN。
(4)BGP 多链路:在可能情況下,與不同上游 ISP(ISP-A、ISP-B)建立物理多链路,透過 BGP 避免單點故障。
(5)健康检查:DNS 与负载均衡层启用 HTTP/TCP 健康检查,异常检测阈值低于 3 次失败即可自动下线。
3.
计算与存储架构
(1)前端:在台湾部署 2 台以上原生 VPS(主/备),使用 HAProxy + Keepalived 做四层负载均衡与 VIP 切换。
(2)应用层:云主机(AWS/GCP/Tencent)作为热备或扩展节点,数据库读写拆分或主从切换。
(3)数据库:采用 MySQL 主从 + 半同步或 Galera Cluster;對 RPO 要求低於 5 分鐘可使用异地备份與 binlog 复制。
(4)文件同步:用户上传资料使用对象存储(S3/MinIO)做主存,或利用 rsync + inotify 实现跨节点近实时同步。
(5)缓存:Redis 使用 Sentinel 或 Cluster 模式,主节点位于台湾,云端做只读缓存以分担读取压力。
4.
防护、CDN 与 DDoS 策略(含数据表)
(1)边缘防护:将所有对外 HTTP/HTTPS 流量先导入 CDN,启用 WAF、速率限制与 Bot 管控。
(2)网络防护:在本地 VPS 层使用 iptables + fail2ban 限速,云端启用内建 DDoS 防护(例如 AWS Shield/Azure DDoS)。
(3)流量分散:对静态资源强制走 CDN,API 与动态请求通过负载均衡按健康状态分发至台湾/云端节点。
(4)切换策略:当本地节点网络异常或遭遇 DDoS(>1Gbps 本地链路极限)时,DNS 通过健康检查将流量导向云端。
(5)以下为一组示例配置数据(表格展示服务器规格与带宽能力):
| 节点 |
类型 |
vCPU |
内存 |
存储 |
峰值带宽 |
| Taipei-VPS-A |
原生VPS |
4 |
8 GB |
200 GB NVMe |
1 Gbps(突发) |
| Kaohsiung-VPS-B |
原生VPS |
4 |
8 GB |
200 GB NVMe |
1 Gbps(突发) |
| Cloud-Tokyo |
公有云热备 |
8 |
32 GB |
500 GB SSD |
5 Gbps(弹性) |
5.
监控、报警与自动化恢复
(1)监控项:主机健康(CPU/内存/磁盘)、网络丢包、响应时间、错误率、数据库延迟、队列积压。
(2)工具链:Prometheus(采集)+ Alertmanager(告警)+ Grafana(展示),并通过 PagerDuty 或 Slack 推送告警。
(3)自动化响应:基于 Alertmanager 触发脚本,完成 VIP 切换、HAProxy 下线、DNS 切换等步骤。
(4)恢复演练:每月执行故障演练(主节点下线),测得平均 DNS 切换时间 40~90 秒(取決於 DNS 提供商)。
(5)备份策略:数据库每天冷备+每小时增量,重要日志与对象存储异地多副本,保留期根据法规设定。
6.
真实案例与实施要点
(1)真实案例:某台湾中型电商在 2023 年将主站由单一台湾 VPS 改為台湾双节点 + AWS 热备的混合架构。
(2)攻击与应对:在一次 3.8 Gbps 的 DDoS 事件中,借助 CDN 清洗并将后端切换到 AWS,业务影响控制在 2 分钟内。
(3)性能提升:改造后台湾用户平均首字节时间由 180ms 降至 60ms(静态资源走 CDN)。
(4)成本权衡:台湾原生 VPS 成本低、延迟优;云主机成本高但弹性好;建议将云主机作为热备或突发扩容池。
(5)实施要点:从小规模开始(2 台 VPS + 1 云主机),先完成健康检查与自动化切换,再逐步把静态资源迁移到 CDN,最后优化数据库复制拓扑。
来源:台湾原生vps与云主机混合架构实现高可用性的方案