Resilience4j Bulkhead, 외부 API 장애를 서비스 전체 장애로 번지지 않게 막는 방법
이번엔 Bulkhead를 정리해본다.
Resilience4j Retry + TimeLimiter, 운영에서 안전하게 붙이는 방법
이번엔 retry를 “한 번 더 해보자” 수준이 아니라, 실제 운영에서 안전하게 붙인 기준으로 정리해본다.
Kafka Consumer를 초당 1건으로 제어한 방법: Resilience4j RateLimiter 적용기
이번엔 딱 내가 실제로 썼던 케이스만 정리해본다.
Resilience4j Circuit Breaker, 운영에서 이렇게 적용했다
이번엔 Circuit Breaker를 이론 말고, 실제 적용한 방식 기준으로 정리해본다.
SLO/SLI/Error Budget, 운영에서 진짜로 쓰는 방식 정리
모니터링 도구는 다 붙였는데, 막상 장애가 나면 이런 상황이 자주 나온다.
Spring + Java21에서 Grafana + Prometheus 운영 모니터링 가이드
운영하다 보면 결국 이 질문으로 돌아오더라.
WebFlux에서 BlockHound로 블로킹 잡기: 실무 적용 가이드
WebFlux를 쓰는데도 응답이 갑자기 느려질 때가 있다. 대부분 원인은 비슷하다. 논블로킹 경로 안에 블로킹 코드가 섞여 들어간 경우다.
Spring WebFlux 비동기, 한 번에 이해하는 실전 가이드
트래픽이 늘어나면 서버가 버거워지는 이유는 생각보다 단순하다. CPU가 부족해서가 아니라, 스레드가 I/O 대기 중에 묶여버리는 경우가 많다.
BSSJ 아키텍처, 왜 지금 이 구조가 맞았는지
서버는 많지 않고, 운영은 단순해야 하고, 화면 경험은 분리하고 싶을 때가 있다. BSSJ 구조는 딱 그 조건에서 출발했다.
검색 결과가 없습니다.