슬라이드4장 · 처리율 제한 장치의 설계
1 / 16
개요
처리율 제한 장치란?
클라이언트나 서비스가 정해진 시간에 요청할 수 있는 횟수를 제한하는 컴포넌트. 임계치를 넘으면 차단한다 (보통 HTTP 429). Twitter 시간당 트윗 300개, OpenAI/Claude API의 분당 토큰 한도, GitHub API 시간당 5,000 요청 — 익숙한 제약은 모두 같은 형태다.
왜 이걸 두는가
- 🛡️ DoS 방어 — 의도적 공격이든, 버그·재시도 폭주든 한 사용자/IP가 시스템 전체를 마비시키지 못하게. 처리율 제한이 1차 방어선.
- 💰 비용 절감 — 외부 API 호출(LLM·SMS·이메일·결제)은 호출당 비용이 든다. 무한정 호출되면 회사 카드값이 폭발. LLM API 비용 폭주는 요즘 가장 흔한 시나리오.
- 🚦 서버 과부하 방지 — 인기 컨텐츠로 트래픽 몰리거나, 잘못된 클라이언트 루프, 봇 크롤링 등으로 자원이 고갈되는 걸 막음.
한 줄 요약: 시스템을 "공정하게 느리게" 만들어 다 같이 죽지 않게 하는 도구.
← / → · Space · Home / End · Esc6%