Metrics > Host(Node)
Host Metric Dashboard
Widget Type | Widget Title | Summary |
Specification | Total Node Count | 전체 Node 수량을 표시합니다. |
Role : Control-Plane | Control-Plane role 을 가진 Node 수량을 표시합니다. | |
Role : Worker | Worker role 을 가진 Node 수량을 표시합니다. | |
Role : Spot-Worker | Spot-Worker role 을 가진 Node 수량을 표시합니다. | |
Max uptime of Node | Node 중 가장 오래 실행중인 시간을 표시합니다. | |
OS List of Host | 사용중인 Host 의 OS 종류와 수량을 Table 로 표시합니다. | |
Pod Status | Pod Count by Node | Node 별로 실행중인 Pod 의 수에 대한 비율을 Pie Chart 로 표시합니다. |
Pod Phase | 전체 Pod Phase 에 대한 비율을 Pie Chart 로 표시합니다. | |
Pod Count Ranking (Top 10) | Pod 가 가장 많이 배포된 Node 10개의 Ranking 을 표시합니다. | |
CPU Status | CPU Usage (%) | 전체의 CPU 평균 사용률을 Line Chart 형태로 표시합니다. |
CPU by Host | Host 별 CPU 사용량 구성 비율을 Pi Chart 형태로 표시합니다. | |
CPU Usage Ranking (Top 10) | CPU 를 가장 많이 사용하는 Node 10개의 Ranking 을 표시합니다. | |
CPU Table by Host | Host 별 CPU 상세 사용률을 Table 형태로 표시합니다. | |
Memory Status | Memory Usage (%) | 전체의 Memory 평균 사용률을 Line Chart 형태로 표시합니다. |
Memory by Host | Host 별 Memory 사용량 구성 비율을 Pi Chart 형태로 표시합니다. | |
Memory Usage Ranking (Top 10) | Memory 를 가장 많이 사용하는 Node 10개의 Ranking 을 표시합니다. | |
CPU/Memory Usage Table | Host 별 CPU와 Memory 사용률을 Table 형태로 표시합니다. | |
Network Status | Rx by Host | Host 별 Network 수신량 비율을 Pi Chart 형태로 표시합니다. |
Tx by Host | Host 별 Network 송신량 비율을 Pi Chart 형태로 표시합니다. | |
Network Rx / Tx | 전체 Network 송수신량을 Line Chart 형태로 표시합니다. | |
Network Rx Ranking (Top 10) | Network 수신량이 가장 많은 10개의 Node 에 대한 Ranking 을 표시합니다. | |
Network Tx Ranking (Top 10) | Network 송신량이 가장 많은 10개의 Node 에 대한 Ranking 을 표시합니다. | |
Network IO Table | Host 별 Network 송수신 데이터 byte 수를 Table 형태로 표시합니다. | |
Disk Status | Disk Read by Host | Host 별 Disk 에서 읽는 비율을 Pi Chart 형태로 표시합니다. |
Disk Write by Host | Host 별 Disk 에 쓰는 비율을 Pi Chart 형태로 표시합니다. | |
Disk IO | 전체 Disk 의 읽기/쓰기 양을 Line Chart 형태로 표시합니다. | |
Disk Read Ranking (Top 10) | Disk 읽기가 가장 많은 10개의 Node 에 대한 Ranking 을 표시합니다. | |
Disk Write Ranking (Top 10) | Disk 쓰기가 가장 많은 10개의 Node 에 대한 Ranking 을 표시합니다. | |
Disk IO Table | Host 별 Disk 에 읽고 쓰는 byte 수를 Table 형태로 표시합니다. |
주요 Metric 설명
[1] Specification
1. OS List of Host
Host에 설치된 OS의 종류와 갯수를 Table Widget으로 구성하여 모니터링 합니다.
Dashboard 구성
Chart | Table | |
Type | Metrics | node_os_info |
Value | Data | |
Groups | name | |
Aggregation | Count |
Dashboard에서 사용한 Metric
Metric Name | node_os_info |
Type | Config |
Descritpion | 노드에서 실행되는 운영 체제(OS)에 대한 정보를 수집 |
Labels |
|
2. Total Node Count
운영중인 전체 Node 개수를 확인합니다.일정 수치 이상이거나 이하일 경우 배경색으로 상태를 표시할 수 있습니다.
Dashboard 구성
Chart | Current | |
Type | Metrics |
|
Value | Last | |
Aggregation | Count |
Dashboard에서 사용한 Metric
Metric Name | kube_node_role |
Type | Guage |
Descritpion | 클러스터에서 노드의 역할 정보를 전달 |
Labels |
|
[2] CPU Status
1. CPU by Host
Host 별 CPU 사용량의 구성 비율을 보기위해 Pi Chart 로 widget 을 구성하여 모니터링 합니다.Pi Chart 에서 많은 폭을 차지하는 Host 일 수록 전체 CPU Resource 중 많은 량을 사용하는 Host 임을 알 수 있습니다.
Dashboard 구성
Chart | Pie | |
Type | Metrics |
|
Value | Data or Last | |
Groups | Host | |
Aggregation | Avg |
Dashboard에서 사용한 Metric
Metric Name | node_cpu_usage |
Type | Guage |
Descritpion | 노드에서 실행 중인 컨테이너와 pod의 CPU 사용량 |
Labels |
|
2. CPU Usage (%)
Tenant 전체의 CPU 평균 사용률에 대한 History 를 보기위해 Line Chart 로 widget 을 구성하여 모니터링 합니다.Line graph 가 평균적인 범위를 벗어나서 많이 올라간 부분이나 떨어진 부분을 가시화하여 특정 시점의 CPU Resource 사용량에 대한 특이사항을 확인할 수 있습니다.
Dashboard 구성
Chart | Timeseries | |
Type | Metrics |
|
Value | Data or Last | |
Groups | Host | |
Aggregation | Avg | |
Formula |
|
Dashboard에서 사용한 Metric
Metric Name | node_cpu_usage |
Type | Guage |
Descritpion | 노드에서 실행 중인 컨테이너와 pod의 CPU 사용량 |
Labels |
|
[3] Memory Status
1. Memory Usage (%)
Tenant 전체의 Memory 사용률에 대한 History 를 보기위해 Bar chart 로 widget 을 구성하여 모니터링 합니다.Bar 가 평균적인 범위를 벗어나서 많이 올라간 부분이나 떨어진 부분을 가시화하여 특정 시점의 Memory Resource 사용량에 대한 특이사항을 확인할 수 있습니다.
Dashboard 구성
Chart | Timeseries | |
Type | Metrics |
|
Value | Data or Last | |
Aggregation | Avg | |
Formula |
|
Dashboard에서 사용한 Metric
Metric Name | node_memory_MemFree_bytes |
Type | Guage |
Descritpion | 사용 가능한 메모리만 나타내며 디스크 캐싱 또는 기타 목적으로 사용되는 메모리는 포함하지 않는다는 점에 유의해야 합니다 . |
Labels |
|
Metric Name | node_memory_Cached_bytes |
Type | Guage |
Descritpion | 페이지 캐시 사이즈 측정된 값입니다. /proc/meminfo 파일의 Cached 항목의 값입니다. |
Labels |
|
Metric Name | node_memory_Buffers_bytes |
Type | Guage |
Descritpion | 디스크 접근용 버퍼 크기를 측정한 값입니다. /proc/meminfo 파일의 Buffers 항목의 값입니다. |
Labels |
|
Metric Name | node_memory_MemTotal_bytes |
Type | Guage |
Descritpion | 사용된 메모리와 사용되지 않은 메모리를 모두 포함하여 시스템에 설치된 실제 메모리의 총량을 나타냅니다. |
Labels |
|
[4] Network Status
1. Network Rx Ranking (Top 10)
Host 별 Network 수신량을 Ranking Chart 로 widget 을 구성하여 모니터링 합니다.다른 Node 들에 비해서 Network 의 수신량이 많은 Node 들을 쉽게 파악하여 원인을 분석하고 조치를 취할 수 있습니다. 특히 Color Rule 을 설정하여 특정 수치 이상으로 올라간 Node 에 대해서는 다른 색으로 표시할 수 있습니다.
Dashboard 구성
Chart | Time Line | |
Type | Metrics |
|
Value | Rate | |
Groups | Host | |
Aggregation | Avg | |
Top | 10 |
Dashboard에서 사용한 Metric
Metric Name | node_network_receive_bytes_total |
Type | Counter |
Descritpion | 노드의 네트워크 인터페이스에서 수신한 총 바이트 수 |
Labels |
|