Metrics > Host(Node)

Host Metric Dashboard

Widget Type
Widget Title
Summary
Specification
Total Node Count
전체 Node 수량을 표시합니다.
Role : Control-Plane
Control-Plane role 을 가진 Node 수량을 표시합니다.
Role : Worker
Worker role 을 가진 Node 수량을 표시합니다.
Role : Spot-Worker
Spot-Worker role 을 가진 Node 수량을 표시합니다.
Max uptime of Node
Node 중 가장 오래 실행중인 시간을 표시합니다.
OS List of Host
사용중인 Host 의 OS 종류와 수량을 Table 로 표시합니다.
Pod Status
Pod Count by Node
Node 별로 실행중인 Pod 의 수에 대한 비율을 Pie Chart 로 표시합니다.
Pod Phase
전체 Pod Phase 에 대한 비율을 Pie Chart 로 표시합니다.
Pod Count Ranking (Top 10)
Pod 가 가장 많이 배포된 Node 10개의 Ranking 을 표시합니다.
CPU Status
CPU Usage (%)
전체의 CPU 평균 사용률을 Line Chart 형태로 표시합니다.
CPU by Host
Host 별 CPU 사용량 구성 비율을 Pi Chart 형태로 표시합니다.
CPU Usage
Ranking (Top 10)
CPU 를 가장 많이 사용하는 Node 10개의 Ranking 을 표시합니다.
CPU Table by Host
Host 별 CPU 상세 사용률을 Table 형태로 표시합니다.
Memory Status
Memory Usage (%)
전체의 Memory 평균 사용률을 Line Chart 형태로 표시합니다.
Memory by Host
Host 별 Memory 사용량 구성 비율을 Pi Chart 형태로 표시합니다.
Memory Usage
Ranking (Top 10)
Memory 를 가장 많이 사용하는 Node 10개의 Ranking 을 표시합니다.
CPU/Memory Usage Table
Host 별 CPU와 Memory 사용률을 Table 형태로 표시합니다.
Network Status
Rx by Host
Host 별 Network 수신량 비율을 Pi Chart 형태로 표시합니다.
Tx by Host
Host 별 Network 송신량 비율을 Pi Chart 형태로 표시합니다.
Network Rx / Tx
전체 Network 송수신량을 Line Chart 형태로 표시합니다.
Network Rx Ranking (Top 10)
Network 수신량이 가장 많은 10개의 Node 에 대한 Ranking 을 표시합니다.
Network Tx Ranking (Top 10)
Network 송신량이 가장 많은 10개의 Node 에 대한 Ranking 을 표시합니다.
Network IO Table
Host 별 Network 송수신 데이터 byte 수를 Table 형태로 표시합니다.
Disk
Status
Disk Read by Host
Host 별 Disk 에서 읽는 비율을 Pi Chart 형태로 표시합니다.
Disk Write by Host
Host 별 Disk 에 쓰는 비율을 Pi Chart 형태로 표시합니다.
Disk IO
전체 Disk 의 읽기/쓰기 양을 Line Chart 형태로 표시합니다.
Disk Read Ranking (Top 10)
Disk 읽기가 가장 많은 10개의 Node 에 대한 Ranking 을 표시합니다.
Disk Write Ranking (Top 10)
Disk 쓰기가 가장 많은 10개의 Node 에 대한 Ranking 을 표시합니다.
Disk IO Table
Host 별 Disk 에 읽고 쓰는 byte 수를 Table 형태로 표시합니다.

주요 Metric 설명

[1] Specification

1. OS List of Host

Host에 설치된 OS의 종류와 갯수를 Table Widget으로 구성하여 모니터링 합니다.

Dashboard 구성

Chart
Table
Type
Metrics
node_os_info
Value
Data
Groups
name
Aggregation
Count

Dashboard에서 사용한 Metric

Metric Name
node_os_info
Type
Config
Descritpion
노드에서 실행되는 운영 체제(OS)에 대한 정보를 수집
Labels
  • cluster_id
  • host
  • name
  • pretty_name
  • id
  • version
  • version_codename
  • version_id
  • image_version
  • build_id

2. Total Node Count

운영중인 전체 Node 개수를 확인합니다.일정 수치 이상이거나 이하일 경우 배경색으로 상태를 표시할 수 있습니다.

Dashboard 구성

Chart
Current
Type
Metrics
  • kube_node_role
Value
Last
Aggregation
Count

Dashboard에서 사용한 Metric

Metric Name
kube_node_role
Type
Guage
Descritpion
클러스터에서 노드의 역할 정보를 전달
Labels
  • cluster_id
  • host
  • role

[2] CPU Status

1. CPU by Host

Host 별 CPU 사용량의 구성 비율을 보기위해 Pi Chart 로 widget 을 구성하여 모니터링 합니다.Pi Chart 에서 많은 폭을 차지하는 Host 일 수록 전체 CPU Resource 중 많은 량을 사용하는 Host 임을 알 수 있습니다.

Dashboard 구성

Chart
Pie
Type
Metrics
  • node_cpu_usage
Value
Data or Last
Groups
Host
Aggregation
Avg

Dashboard에서 사용한 Metric

Metric Name
node_cpu_usage
Type
Guage
Descritpion
노드에서 실행 중인 컨테이너와 pod의 CPU 사용량
Labels
  • cluster_id
  • host

2. CPU Usage (%)

Tenant 전체의 CPU 평균 사용률에 대한 History 를 보기위해 Line Chart 로 widget 을 구성하여 모니터링 합니다.Line graph 가 평균적인 범위를 벗어나서 많이 올라간 부분이나 떨어진 부분을 가시화하여 특정 시점의 CPU Resource 사용량에 대한 특이사항을 확인할 수 있습니다.

Dashboard 구성

Chart
Timeseries
Type
Metrics
  • node_cpu_usage
Value
Data or Last
Groups
Host
Aggregation
Avg
Formula
  • 수치가 0~1 범위의 값
  • % 표현을 위해서는 formula를 a * 100 적용

Dashboard에서 사용한 Metric

Metric Name
node_cpu_usage
Type
Guage
Descritpion
노드에서 실행 중인 컨테이너와 pod의 CPU 사용량
Labels
  • cluster_id
  • host

[3] Memory Status

1. Memory Usage (%)

Tenant 전체의 Memory 사용률에 대한 History 를 보기위해 Bar chart 로 widget 을 구성하여 모니터링 합니다.Bar 가 평균적인 범위를 벗어나서 많이 올라간 부분이나 떨어진 부분을 가시화하여 특정 시점의 Memory Resource 사용량에 대한 특이사항을 확인할 수 있습니다.

Dashboard 구성

Chart
Timeseries
Type
Metrics
  • node_memory_MemFree_bytes
  • node_memory_Cached_bytes
  • node_memory_Buffers_bytes
  • node_memory_MemTotal_bytes
Value
Data or Last
Aggregation
Avg
Formula
  • Memory Usage : MemTotal - (MemFree + Buffers + Cached memory)
  • Percentage(%) : 100 * (1 - (a + b + c)/d)

Dashboard에서 사용한 Metric

Metric Name
node_memory_MemFree_bytes
Type
Guage
Descritpion
사용 가능한 메모리만 나타내며 디스크 캐싱 또는 기타 목적으로 사용되는 메모리는 포함하지 않는다는 점에 유의해야 합니다 .
Labels
  • cluster_id
  • host
Metric Name
node_memory_Cached_bytes
Type
Guage
Descritpion
페이지 캐시 사이즈 측정된 값입니다.
/proc/meminfo 파일의 Cached 항목의 값입니다.
Labels
  • cluster_id
  • host
Metric Name
node_memory_Buffers_bytes
Type
Guage
Descritpion
디스크 접근용 버퍼 크기를 측정한 값입니다.
/proc/meminfo 파일의 Buffers 항목의 값입니다.
Labels
  • cluster_id
  • host
Metric Name
node_memory_MemTotal_bytes
Type
Guage
Descritpion
사용된 메모리와 사용되지 않은 메모리를 모두 포함하여 시스템에 설치된 실제 메모리의 총량을 나타냅니다.
Labels
  • cluster_id
  • host

[4] Network Status

1. Network Rx Ranking (Top 10)

Host 별 Network 수신량을 Ranking Chart 로 widget 을 구성하여 모니터링 합니다.다른 Node 들에 비해서 Network 의 수신량이 많은 Node 들을 쉽게 파악하여 원인을 분석하고 조치를 취할 수 있습니다. 특히 Color Rule 을 설정하여 특정 수치 이상으로 올라간 Node 에 대해서는 다른 색으로 표시할 수 있습니다.

Dashboard 구성

Chart
Time Line
Type
Metrics
  • node_network_receive_bytes_total
Value
Rate
Groups
Host
Aggregation
Avg
Top
10

Dashboard에서 사용한 Metric

Metric Name
node_network_receive_bytes_total
Type
Counter
Descritpion
노드의 네트워크 인터페이스에서 수신한 총 바이트 수
Labels
  • cluster_id
  • host
  • device