Prometheus Time Series Collection and Processing Server

Rules

container_cpu_usage_is_high			46.496s ago	5.211ms
Rule	State	Error	Last Evaluation	Evaluation Time
alert: POD_CPU_IS_HIGH expr: sum by(container, pod, namespace) (rate(container_cpu_usage_seconds_total{container!=""}[5m])) * 100 > 90 for: 1m labels: severity: critical annotations: description: Container {{ $labels.container }} CPU usage inside POD {{ $labels.pod}} is high in {{ $labels.namespace}} summary: POD {{ $labels.pod}} CPU Usage is high in {{ $labels.namespace}}	ok		46.497s ago	5.201ms
container_memory_usage_is_high			57.065s ago	11.32ms
Rule	State	Error	Last Evaluation	Evaluation Time
alert: POD_MEMORY_USAGE_IS_HIGH expr: (sum by(container, pod, namespace) (container_memory_working_set_bytes{container!=""}) / sum by(container, pod, namespace) (container_spec_memory_limit_bytes > 0) * 100) > 80 for: 1m labels: severity: critical annotations: description: \|- Container Memory usage is above 80% VALUE = {{ $value }} LABELS = {{ $labels }} summary: Container {{ $labels.container }} Memory usage inside POD {{ $labels.pod}} is high in {{ $labels.namespace}}	ok		57.066s ago	11.31ms
node_cpu_greater_than_80			31.744s ago	1.407ms
Rule	State	Error	Last Evaluation	Evaluation Time
alert: NODE_CPU_IS_HIGH expr: 100 - (avg by(instance) (rate(node_cpu_seconds_total{mode="idle"}[5m])) * 100) > 90 for: 1m labels: severity: critical annotations: description: node {{ $labels.kubernetes_node }} cpu is high summary: node cpu is greater than 80 precent	ok		31.744s ago	1.394ms
node_disk_space_too_low			26.878s ago	828.1us
Rule	State	Error	Last Evaluation	Evaluation Time
alert: NODE_DISK_SPACE_IS_LOW expr: (100 * ((node_filesystem_avail_bytes{fstype!="rootfs",mountpoint="/"}) / (node_filesystem_size_bytes{fstype!="rootfs",mountpoint="/"}))) < 10 for: 1m labels: severity: critical annotations: description: node {{ $labels.node }} disk space is only {{ printf "%0.2f" $value }}% free. summary: node disk space remaining is less than 10 percent	ok		26.878s ago	816us
node_down			41.314s ago	371.1us
Rule	State	Error	Last Evaluation	Evaluation Time
alert: NODE_DOWN expr: up{component="kubernetes-nodes"} == 0 for: 3m labels: severity: warning annotations: description: '{{ $labels.job }} job failed to scrape instance {{ $labels.instance }} for more than 3 minutes. Node Seems to be down' summary: Node {{ $labels.kubernetes_node }} is down	ok		41.314s ago	359.4us
node_memory_left_lessser_than_10			52.03s ago	746.8us
Rule	State	Error	Last Evaluation	Evaluation Time
alert: NODE_MEMORY_LESS_THAN_10% expr: node_memory_MemAvailable_bytes / node_memory_MemTotal_bytes * 100 < 10 for: 1m labels: severity: critical annotations: description: node {{ $labels.kubernetes_node }} memory left is low summary: node memory left is lesser than 10 precent	ok		52.03s ago	735us
prometheus-job-down			23.307s ago	320.9us
Rule	State	Error	Last Evaluation	Evaluation Time
alert: prometheus-job-down expr: up{job="prometheus"} == 0 for: 1m labels: severity: warning annotations: description: Default Prometheus Job is Down LABELS = {{ $labels }} summary: The Default Prometheus Job is Down (job {{ $labels.job}})	ok		23.307s ago	310.5us

Rules

container_cpu_usage_is_high

46.496s ago

5.211ms

container_memory_usage_is_high

57.065s ago

11.32ms

node_cpu_greater_than_80

31.744s ago

1.407ms

node_disk_space_too_low

26.878s ago

828.1us

node_down

41.314s ago

371.1us

node_memory_left_lessser_than_10

52.03s ago

746.8us

prometheus-job-down

23.307s ago

320.9us