Google Container Cluster

Google Kubernetes Engine (GKE) is a managed, production-ready environment for deploying containerized applications. It brings Google latest innovations in developer productivity, resource efficiency, automated operations, and open source flexibility to accelerate your time to market.

Use OpsRamp Google Public cloud Integration to discover and collect metrics against the Google service.

Setup

To set up the Google integration and discover the Google service, go to Google Integration Discovery Profile and select Container Cluster.

Supported metrics

OpsRamp Metric	Google Metric	Metric Display Name	Unit	Description
google_container_container_accelerator_duty_cycle	kubernetes.io/container/accelerator/duty_cycle	Accelerator duty cycle	%	Percent of time over the past sample period (10s) during which the accelerator was actively processing. Values are integers between 0 and 100. Sampled every 60 seconds.
google_kubernetes_container_accelerator_memory_bandwidth_utilization	kubernetes.io/container/accelerator/memory_bandwidth_utilization	Memory bandwidth utilization	%	Current percentage of the accelerator memory bandwidth that is being used. Computed by dividing the memory bandwidth used over a sample period by the maximum supported bandwidth over the same sample period. Sampled every 60 seconds. After sampling, data is not visible for up to 120 seconds.
google_container_container_accelerator_memory_total	kubernetes.io/container/accelerator/memory_total	Accelerator memory total	bytes	Total accelerator memory in bytes. Sampled every 60 seconds.
google_container_container_accelerator_memory_used	kubernetes.io/container/accelerator/memory_used	Accelerator memory used	bytes	Total accelerator memory allocated in bytes. Sampled every 60 seconds.
google_container_container_accelerator_request	kubernetes.io/container/accelerator/request	Request accelerators	devices	Number of accelerator devices requested by the container. Sampled every 60 seconds.
google_kubernetes_container_accelerator_tensorcore_utilization	kubernetes.io/container/accelerator/tensorcore_utilization	Tensorcore utilization	%	Current percentage of the Tensorcore that is utilized. Computed by dividing the Tensorcore operations that were performed over a sample period by the supported number of Tensorcore operations over the same sample period. Sampled every 60 seconds. After sampling, data is not visible for up to 120 seconds.
google_container_container_cpu_core_usage_time	kubernetes.io/container/cpu/core_usage_time	CPU usage time	CPU seconds	Cumulative CPU usage on all cores used by the container in seconds. Sampled every 60 seconds.
google_container_container_cpu_limit_cores	kubernetes.io/container/cpu/limit_cores	Limit cores	CPU cores	CPU cores limit of the container. Sampled every 60 seconds.
google_container_container_cpu_limit_utilization	kubernetes.io/container/cpu/limit_utilization	CPU limit utilization	count	The fraction of the CPU limit that is currently in use on the instance. This value can be greater than 1 as a container might be allowed to exceed its CPU limit for extended periods of time. Sampled every 60 seconds. After sampling, data is not visible for up to 240 seconds.
google_container_container_cpu_request_cores	kubernetes.io/container/cpu/request_cores	Request cores	CPU cores	Number of CPU cores requested by the container. Sampled every 60 seconds. After sampling, data is not visible for up to 120 seconds.
google_container_container_cpu_request_utilization	kubernetes.io/container/cpu/request_utilization	CPU request utilization	count	The fraction of the requested CPU that is currently in use on the instance. This value can be greater than 1 as usage can exceed the request. Sampled every 60 seconds. After sampling, data is not visible for up to 240 seconds.
google_container_container_ephemeral_storage_limit_bytes	kubernetes.io/container/ephemeral_storage/limit_bytes	Ephemeral storage limit	bytes	Local ephemeral storage limit in bytes. Sampled every 60 seconds.
google_container_container_ephemeral_storage_request_bytes	kubernetes.io/container/ephemeral_storage/request_bytes	Ephemeral storage request	bytes	Local ephemeral storage request in bytes. Sampled every 60 seconds.
google_container_container_ephemeral_storage_used_bytes	kubernetes.io/container/ephemeral_storage/used_bytes	Ephemeral storage usage	bytes	Local ephemeral storage usage in bytes. Sampled every 60 seconds.
google_container_container_memory_limit_bytes	kubernetes.io/container/memory/limit_bytes	Memory limit	bytes	Memory limit of the container in bytes. Sampled every 60 seconds.
google_container_container_memory_limit_utilization	kubernetes.io/container/memory/limit_utilization	Memory limit utilization	count	The fraction of the memory limit that is currently in use on the instance. This value cannot exceed 1 as usage cannot exceed the limit. Sampled every 60 seconds. After sampling, data is not visible for up to 120 seconds.
google_container_container_memory_page_fault_count	kubernetes.io/container/memory/page_fault_count	Page faults	count	Number of page faults, broken down by Sampled every 60 seconds.
google_container_container_memory_request_bytes	kubernetes.io/container/memory/request_bytes	Memory request	bytes	Memory request of the container in bytes. Sampled every 60 seconds. After sampling, data is not visible for up to 120 seconds.
google_container_container_memory_request_utilization	kubernetes.io/container/memory/request_utilization	Memory request utilization	count	The fraction of the requested memory that is currently in use on the instance. This value can be greater than 1 as usage can exceed the request. Sampled every 60 seconds. After sampling, data is not visible for up to 240 seconds.
google_kubernetes_container_memory_swap_used_bytes	kubernetes.io/container/memory/swap_used_bytes	Container swap used bytes	bytes	Bytes of swap memory used by the container. Sampled every 60 seconds. After sampling, data is not visible for up to 120 seconds.
google_container_container_memory_used_bytes	kubernetes.io/container/memory/used_bytes	Memory usage	bytes	Memory usage in bytes. Sampled every 60 seconds.
google_kubernetes_container_multislice_accelerator_device_to_host_transfer_latencies	kubernetes.io/container/multislice/accelerator/device_to_host_transfer_latencies	Device to Host transfer latencies	microseconds	Distribution of device to host transfer latency for each chunk of data for multislice traffic. Sampled every 60 seconds. After sampling, data is not visible for up to 120 seconds.
google_kubernetes_container_multislice_accelerator_host_to_device_transfer_latencies	kubernetes.io/container/multislice/accelerator/host_to_device_transfer_latencies	Host to Device transfer latencies	microseconds	Distribution of host to device transfer latency for each chunk of data for multislice traffic. Sampled every 60 seconds. After sampling, data is not visible for up to 120 seconds.
google_kubernetes_container_multislice_network_collective_end_to_end_latencies	kubernetes.io/container/multislice/network/collective_end_to_end_latencies	Collective latencies	microseconds	Distribution of end to end collective latency for multislice traffic. Sampled every 60 seconds. After sampling, data is not visible for up to 120 seconds.
google_kubernetes_container_multislice_network_dcn_transfer_latencies	kubernetes.io/container/multislice/network/dcn_transfer_latencies	DCN (Data Center Network) transfer latencies	microseconds	Distribution of network transfer latencies for multislice traffic. Sampled every 60 seconds. After sampling, data is not visible for up to 120 seconds.
google_kubernetes_container_multislice_network_grpc_tcp_delivery_rates	kubernetes.io/container/multislice/network/grpc_tcp_delivery_rates	GRPC TCP Delivery Rates	Mbps	Distribution of gRPC TCP delivery rates for multislice traffic. Sampled every 60 seconds. After sampling, data is not visible for up to 120 seconds.
google_kubernetes_container_multislice_network_grpc_tcp_min_round_trip_times	kubernetes.io/container/multislice/network/grpc_tcp_min_round_trip_times	GRPC TCP Minimum Round Trip Times	microseconds	Distribution of gRPC TCP min round trip times for multislice traffic. Sampled every 60 seconds. After sampling, data is not visible for up to 120 seconds.
google_container_container_restart_count	kubernetes.io/container/restart_count	Restart count	count	Number of times the container has restarted. Sampled every 60 seconds. After sampling, data is not visible for up to 120 seconds.
google_container_container_uptime	kubernetes.io/container/uptime	Uptime	seconds	Time in seconds that the container has been running. Sampled every 60 seconds.

Event support

Supported
Configurable in OpsRamp Google Integration Discovery Profile.

External reference

Google Cloud Metrics - container