발급 건수, 카드 종류별 건수, 실패 건수 등 카드 발급 현황에 대한 지표 구성
무엇을 고려 하였는가?
서버로 들어오는 총 요청에 대한 파악을 위해 지표 구성
무엇을 고려 하였는가?
응답 시간에 대한 파악을 위해 지표 구성
무엇을 고려 하였는가?
에러 응답에 대해 파악하기 위한 지표 구성
무엇을 고려 하였는가?
http_server_requests_seconds_count{uri="/api"}[5m]http_server_requests_seconds_count 메트릭을 사용할꺼고,
increase(http_server_requests_seconds_count{uri="/api"}[5m])http_server_requests_seconds_counthttp_server_requests_seconds_bucket아래와 같이 카운터의 결과가 나왔을때, 각 increase의 값을 더해서 누적 수를 계산한다.
시간 누적수 증가
13:00:00 100
13:01:00 200 -> 100
13:02:00 300 -> 100
13:03:00 150 -> 0 (리셋 이벤트 발생)
13:04:00 0
13:05:00 0
13:06:00 50 -> 50
13:07:00 100 -> 50
--------------------
increase 결과: 3005분동안 요청된 총 증가량
increase(http_server_requests_seconds_count[5m])5분동안의 초당 증가율
rate(http_server_requests_seconds_count[5m])5분동안의 초당 증가율을 구하는데, 상위 1%는 제외하여 연산한다.
histogram_quantile(0.9, rate(http_server_requests_seconds_bucket[5m]))그라파나에서는 프로메테우스 웹 ui와는 다르게 from, to, step 를 추가 설정한다.
아래 쿼리는 (sum by (uri) (rate(httpserverrequestssecondscount{namespace=“$namespace”, uri!~”^(/actuator|/swagger|/api-docs).*“}[1m:1m]))),
롤아웃 후, 각 파드 별로 1건의 요청이 들어왔을때, increase 의 결과는 1이 아니라 0으로 표시가 된다.
http_server_requests_seconds_count{uri="/card-types/{cardType}/intro"}[5m] 결과
increase(http_server_requests_seconds_count{uri="/card-types/{cardType}/intro"}[5m]) 결과
2건의 요청이 들어왔을땐?
http_server_requests_seconds_count{uri="/card-types/{cardType}/intro"}[5m] 결과
increase(http_server_requests_seconds_count{uri="/card-types/{cardType}/intro"}[5m]) 결과