从零搭建Spring Cloud微服务:一个团队负责人的实战经历
引言:为什么选择做这件事?

记得去年年初,我所在的公司业务规模快速扩张,原先的单体应用架构已经扛不住了。订单模块和用户中心经常因为某个功能的上线而导致整个系统不稳定,线上故障频发,部署速度也变得非常慢。
作为后端技术负责人,我意识到必须做出改变了——于是我们决定用 Spring Cloud 来重构系统,转向微服务架构。
刚开始我也担心:“这玩意儿是不是太复杂?”“会不会把问题变得更难解决?”但真正动手之后发现,虽然初期学习曲线陡峭些,但一旦搭起来,带来的灵活性和可维护性是非常可观的。
这篇文章就结合我们项目的真实经历,详细记录从0到1搭建Spring Cloud微服务架构的过程,包括踩过的坑、学到的经验和关键代码示例,希望能给刚接触微服务的朋友一些实际帮助。
项目背景与挑战描述

我们的项目是一个电商后台系统,主要包括:
- 用户中心(User Center)
- 商品中心(Product Service)
- 订单中心(Order Service)
- 支付中心(Payment Service)
- 消息推送模块等
最初采用的是传统的Spring Boot单体架构,所有模块在一个项目里通过不同包来划分。随着功能越来越复杂,团队协作效率下降,发布一次要花2小时以上时间验证测试环境,并且容易牵一发动全身。
主要痛点有以下几点:
- 部署耦合严重:修改一个小功能,全站都要重新部署
- 性能瓶颈明显:热点接口压力高,无法横向扩展
- 维护成本高:日志混在一起查,依赖混乱,排查问题困难
- 开发冲突多:多人同时改同一块代码,版本合并出错频繁
这些都成了我们必须转型微服务的根本动因。
解决方案:Spring Cloud微服务整体架构设计

我们最终采用了 Spring Cloud Alibaba + Nacos 的组合,主要原因是因为我们已经在使用阿里云相关服务,Nacos在注册发现和服务配置方面表现得非常稳定。
技术栈选型如下:
| 模块 | 工具/框架 |
|---|---|
| 注册中心 | Nacos |
| 网关 | Gateway |
| 负载均衡 | LoadBalancer + OpenFeign |
| 配置中心 | Nacos Config |
| 分布式事务 | Seata(后来引入) |
| 链路追踪 | SkyWalking |
这个组合在生产环境中跑了一年多,稳定性表现良好。
实践过程与关键代码片段

第一步:搭建基础工程结构
我们采用Maven聚合项目的方式管理多个微服务,顶层项目为 parent pom,各个服务是其子模块,便于统一版本管理和依赖控制。
spring-cloud-demo/
├── user-center
├── product-service
├── order-service
├── gateway
├── common-lib
└── pom.xml
pom.xml 示例中添加 Spring Cloud starter 和 Nacos 相关依赖:
<dependencyManagement>
<dependencies>
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-dependencies</artifactId>
<version>2022.0.4</version>
<type>pom</type>
<scope>import</scope>
</dependency>
<dependency>
<groupId>com.alibaba.cloud</groupId>
<artifactId>spring-cloud-alibaba-dependencies</artifactId>
<version>2022.0.0.0</version>
<type>pom</type>
<scope>import</scope>
</dependency>
</dependencies>
</dependencyManagement>
<!-- 各个服务中添加 -->
<dependency>
<groupId>com.alibaba.cloud</groupId>
<artifactId>spring-cloud-starter-alibaba-nacos-discovery</artifactId>
</dependency>
第二步:启用Nacos注册中心
每个微服务配置如下,在 application.yml 中配置注册信息:
server:
port: 8081
spring:
application:
name: user-center
cloud:
nacos:
discovery:
server-addr: 192.168.0.100:8848
主类加上注解启用服务发现:
@SpringBootApplication
@EnableDiscoveryClient
public class UserCenterApplication {
public static void main(String[] args) {
SpringApplication.run(UserCenterApplication.class, args);
}
}
启动后访问Nacos Web界面即可看到服务列表。
第三步:网关服务接入Gateway
我们在网关层集成了权限校验、请求路由等功能。
spring:
cloud:
gateway:
routes:
- id: user-center
uri: lb://user-center
predicates:
- Path=/user/**
filters:
- StripPrefix=1
- id: order-service
uri: lb://order-service
predicates:
- Path=/order/**
filters:
- StripPrefix=1

另外实现了一个全局过滤器用于鉴权:
@Component
public class AuthFilter implements GlobalFilter {
@Override
public Mono<Void> filter(ServerWebExchange exchange, GatewayFilterChain chain) {
// 这里可以加token校验逻辑
return chain.filter(exchange);
}
}
第四步:服务间通信使用OpenFeign + LoadBalancer
OrderService调用UserService查询用户信息:
@FeignClient(name = "user-center")
public interface UserClient {
@GetMapping("/users/{id}")
ResponseEntity<UserDTO> getUserById(@PathVariable Long id);
}
Feign会自动集成Ribbon或LoadBalancer进行负载均衡。
踩坑经验分享
微服务不是万能药,也不是完全没问题的。我们也在迁移过程中遇到了不少坑:
1. Nacos本地连接失败,服务不注册
一开始在本机开发时,服务总是无法注册到Nacos上。检查了很久才发现是防火墙设置的问题,有些机器默认屏蔽8848端口。
解决方案:
- 开放端口或换用其他网络模式
- 使用docker部署Nacos确保环境一致
- 同时在Nacos配置文件中增加健康检查日志输出
2. Feign远程调用超时,未熔断导致雪崩效应
在某次促销活动中,订单服务因为调用商品中心接口超时导致线程池耗尽,进而引发级联崩溃。
教训总结:
- 必须启用熔断机制(Hystrix 或 Resilience4j)
- 设置合理的超时参数,默认值往往不够安全
我们在后续加上Resilience4j配置:
resilience4j.circuitbreaker:
instances:
userServiceCircuitBreaker:
failure-rate-threshold: 50
wait-duration-in-open-state: 10s
permitted-number-of-calls-in-half-open-state: 5
3. 接口兼容性差,升级服务造成调用失败
由于各服务版本更新不同步,出现了老服务调新接口时返回结构不兼容的情况。
解决方案:
- 推行语义化版本号
- 建立接口文档规范(Swagger + SpringDoc)
- 制定接口变更通知机制,避免随意改动接口结构
成果与收益总结
经过近三个月的微服务重构,我们取得了以下成果:
| 维度 | 旧系统 | 新系统 | 提升幅度 |
|---|---|---|---|
| 部署效率 | 2小时 | 15分钟 | ↑90% |
| 故障隔离性 | 全局影响 | 单点影响 | 明显增强 |
| 接口调用链路 | 不清晰 | 可视化 | 改善巨大 |
| 团队协作体验 | 冲突频繁 | 更加独立 | 大幅提升 |
特别是在大促期间,服务响应更稳定,扩容也只需对特定服务操作,不像以前那样每次上线都像走钢丝。
经验建议与注意事项
作为过来人,我想给刚开始接触微服务的朋友们几点建议:
不要一开始就追求完美架构
- 微服务拆分没有标准答案,先拆得合理比拆得细更重要。
- 建议从两个核心服务开始,逐步迭代。
注意数据库设计
- 服务之间不能共享数据库,要封装好数据边界。
- 考虑使用 CQRS、事件驱动等手段处理分布式数据一致性。
接口设计要慎重
- 接口应具备向后兼容能力,尽量避免破坏性变更。
- 所有接口需要有完整的文档,可以用Swagger UI生成文档链接。
监控体系要提前布局
- 日志集中收集(ELK)、链路追踪(SkyWalking)、指标采集(Prometheus)都要尽早集成。
- 不然等出问题的时候你会哭着找日志。
运维也要跟得上
- 部署方式最好统一用Docker+K8s,否则几百个服务你手都会抖。
- 同时要建立完善的CI/CD流程,自动化打包部署。
结语:别怕起步晚,重在踏出第一步
回顾这一年的微服务改造之路,说实话我们遇到过很多问题,也有几次想放弃回到单体模式。但最终还是坚持了下来,收获远远大于付出。
Spring Cloud生态虽然庞杂,但它的生命力在于社区持续演进和企业级落地案例不断积累。只要我们边学边用、边用边改,就能把这套工具用得越来越顺手。
希望这篇文章能帮你少走一点弯路,哪怕只是少掉一个坑也好。如果有什么具体问题,欢迎留言交流,一起进步!

评论 0