Hunny's Daily

개발과 일상에서의 달콤한 순간들을 기록하며, 유용한 팁과 인사이트를 공유합니다.

  • 대용량 트래픽 제어하기 3편

    장애를 확산시키지 않는 시스템 설계 이 글은 「대용량 트래픽 제어하기」 시리즈 3편이다.1편과 2편에서 확장과 리소스 관점에서의 한계를 살펴봤다면, 3편에서는 관점을 전환한다. 대용량 트래픽 환경에서 가장 위험한 것은 “부족함”이 아니라 장애가 전파되는 구조다. 이 글에서는…

    Continue reading…

  • 대용량 트래픽 제어하기 2편

    Scale Out을 해도 시스템이 터지는 이유 이 글은 「대용량 트래픽 제어하기」 시리즈 2편이다.1편에서 트래픽 증가가 단순한 서버 수 부족 문제가 아니라는 점을 살펴봤다면, 2편에서는 Scale Out을 했음에도 불구하고 시스템이 불안정해지는 이유를 실제 운영 관점에서…

    Continue reading…

  • 대용량 트래픽 제어하기 1편

    트래픽이 몰리면 시스템에는 무슨 일이 일어날까 이 글은 「대용량 트래픽 제어하기」 시리즈 1편이다.이 시리즈에서는 단순한 개념 정리를 넘어, 실제 운영 환경에서 트래픽이 증가할 때 시스템 내부에서 어떤 일이 벌어지는지를 단계적으로 풀어간다. 1편에서는 대용량 트래픽…

    Continue reading…

  • 서킷 브레이커 + Retry 조합 설계

    재시도는 언제 도움이 되고, 언제 장애를 키울까 분산 시스템에서 실패는 피할 수 없다. 그래서 많은 시스템은 실패에 대비해 Retry를 사용한다. 그러나 Retry는 잘못 사용하면 장애를 완화하는 것이 아니라 오히려 증폭시킨다. 이 문제를 해결하기 위해…

    Continue reading…

  • 서킷 브레이커(Circuit Breaker)란 무엇인가

    장애를 막는 것이 아니라 전파를 막는 기술 대규모 트래픽 환경에서 장애는 반드시 발생한다. 중요한 것은 장애를 완전히 없애는 것이 아니라, 장애가 전체 시스템으로 확산되지 않도록 막는 것이다. 서킷 브레이커는 이 목적을 위해 사용되는 대표적인…

    Continue reading…

  • JVM 메모리와 GC, 그리고 Warmup 문제

    Pod는 떴는데 왜 지연시간이 급증할까 Kubernetes 환경에서 JVM 기반 애플리케이션을 운영하다 보면, 파드가 처음 올라온 직후 응답 지연이 크게 증가하는 현상을 자주 겪게 된다. 이 문제는 단순한 서버 성능 문제가 아니라, JVM 메모리 구조와…

    Continue reading…