Thứ Ba, 21 tháng 10, 2025

Tối ưu hóa truy vấn Prometheus với PromQL

Đếm số lượng nút worker và theo dõi sự thay đổi tài nguyên trong Prometheus bằng PromQL. Khám phá các truy vấn, phương pháp hay nhất và ngưỡng động để giám sát Kubernetes.

Prometheus là một công cụ giám sát mạnh mẽ, cung cấp các số liệu chi tiết và thông tin chuyên sâu về hạ tầng cũng như ứng dụng của bạn, đặc biệt trong Kubernetes (k8s) và OpenShift Container Platform (OCP – Kubernetes doanh nghiệp). Khi viết các truy vấn PromQL (Prometheus Query Language), việc đảm bảo độ chính xác và tương thích là rất quan trọng, đặc biệt khi so sánh các chỉ số hoặc tính toán ngưỡng.

Trong bài viết này, chúng ta sẽ tìm hiểu cách đếm số lượng nút worker và theo dõi sự thay đổi tài nguyên một cách hiệu quả bằng PromQL.

Đếm số lượng nút worker trong PromQL

Để lấy số lượng nút worker trong cụm Kubernetes của bạn, metric kube_node_info thường được sử dụng. Tuy nhiên, metric này bao gồm tất cả các loại nút như master, infra và logging nodes, không chỉ riêng worker nodes. Để lọc chỉ các worker nodes, bạn có thể tinh chỉnh truy vấn bằng cách sử dụng bộ lọc nhãn (label matchers).

Dưới đây là một truy vấn để đếm chỉ các worker nodes:

count(kube_node_info{node=~".*worker.*"})

Giải thích

  • kube_node_info là metric cung cấp thông tin về tất cả các nút trong cụm.
  • {node=~”.worker.“} lọc ra các nút có tên chứa chuỗi con “worker.”
  • count() tính tổng số lượng các nút khớp với điều kiện lọc.

Truy vấn này đảm bảo rằng chỉ các worker nodes được đếm, điều này thường cần thiết khi tính toán các chỉ số mở rộng (scaling metrics) hoặc thiết lập ngưỡng trong PromQL.

Theo dõi sự thay đổi trong việc sử dụng tài nguyên

Một trường hợp phổ biến trong giám sát Kubernetes là theo dõi sự thay đổi số lượng pod theo thời gian. Ví dụ, bạn có thể muốn phát hiện xem số lượng pod có tăng đáng kể trong vòng 30 phút qua hay không. Kết hợp điều này với số lượng worker nodes giúp bạn thiết lập các ngưỡng mở rộng linh hoạt theo quy mô cụm.

Hãy xem xét truy vấn sau:

max(apiserver_storage_objects{resource="pods"}) - max(apiserver_storage_objects{resource="pods"} offset 30m) > (20 * count(kube_node_info{node=~".*worker.*"}))

Phân tích truy vấn Vế trái:

  • max(apiserver_storage_objects{resource=”pods”}) lấy số lượng pod tối đa hiện tại trong cụm.
  • max(apiserver_storage_objects{resource=”pods”} offset 30m) lấy số lượng pod tối đa cách đây 30 phút. Phép trừ giữa hai giá trị này tính toán sự thay đổi số lượng pod trong 30 phút qua.

Vế phải:

  • count(kube_node_info{node=~”.worker.“}) đếm số lượng worker nodes.
  • Nhân giá trị này với 20 để đặt một ngưỡng động dựa trên số lượng worker nodes.

So sánh: Truy vấn kiểm tra xem sự thay đổi số lượng pod có vượt quá ngưỡng đã tính hay không.

Giải quyết vấn đề cú pháp trong PromQL

Khi viết truy vấn PromQL, lỗi cú pháp hoặc kiểu dữ liệu không khớp có thể dẫn đến kết quả không mong muốn. Trong ví dụ trên, vế trái của truy vấn có thể trả về nhiều chuỗi thời gian (time series), trong khi vế phải là một giá trị vô hướng (scalar).

Để đảm bảo tính tương thích, bạn có thể bọc vế trái trong hàm max() để giảm nó về một giá trị vô hướng:

max(max(apiserver_storage_objects{resource="pods"}) - max(apiserver_storage_objects{resource="pods"} offset 30m)) > (20 * count(kube_node_info{node=~".*worker.*"}))

Tại sao sử dụng max()? Hàm max() đảm bảo rằng kết quả của phép trừ là một giá trị vô hướng (scalar), giúp nó tương thích với vế phải của truy vấn.

Các phương pháp hay nhất

1. Hiểu rõ các metric của bạn: Luôn tìm hiểu về các metric mà bạn đang truy vấn. Sử dụng label_values() hoặc giao diện Prometheus UI để kiểm tra nhãn (label) và giá trị của chúng. 2. Kiểm tra từng bước: Bắt đầu với các truy vấn nhỏ, kiểm tra kết quả trước khi xây dựng các biểu thức phức tạp. 3. Đảm bảo tính tương thích của scalar: Khi so sánh giá trị, đảm bảo cả hai vế của phép so sánh đều là scalar. Sử dụng các hàm tổng hợp như max(), sum(), hoặc avg() nếu cần. 4. Ngưỡng động: Sử dụng các metric đặc trưng của cụm (ví dụ: số lượng node) để đặt ngưỡng mở rộng động theo cơ sở hạ tầng.

Kết luận

PromQL là một công cụ mạnh mẽ, nhưng để viết các truy vấn chính xác và hiệu quả, bạn cần chú ý đến từng chi tiết. Bằng cách sử dụng các biểu thức tối ưu như count(kube_node_info{node=~”.worker.“}) để đếm số worker nodes và thiết lập ngưỡng động theo kích thước cụm, bạn có thể xây dựng các giải pháp giám sát mạnh mẽ và thích ứng với môi trường của mình.

Hãy thử nghiệm và kiểm tra các truy vấn của bạn để đảm bảo chúng mang lại thông tin hữu ích, giúp bạn chủ động phát hiện và xử lý các vấn đề trong cụm Kubernetes của mình.

=============================
Website không chứa bất kỳ quảng cáo nào, mọi đóng góp để duy trì phát triển cho website (donation) xin vui lòng gửi về STK 90.2142.8888 - Ngân hàng Vietcombank Thăng Long - TRAN VAN BINH
=============================
Nếu bạn không muốn bị AI thay thế và tiết kiệm 3-5 NĂM trên con đường trở thành DBA chuyên nghiệp hay làm chủ Database thì hãy đăng ký ngay KHOÁ HỌC ORACLE DATABASE A-Z ENTERPRISE, được Coaching trực tiếp từ tôi với toàn bộ bí kíp thực chiến, thủ tục, quy trình của gần 20 năm kinh nghiệm (mà bạn sẽ KHÔNG THỂ tìm kiếm trên Internet/Google) từ đó giúp bạn dễ dàng quản trị mọi hệ thống Core tại Việt Nam và trên thế giới, đỗ OCP.
- CÁCH ĐĂNG KÝ: Gõ (.) hoặc để lại số điện thoại hoặc inbox https://m.me/tranvanbinh.vn hoặc Hotline/Zalo 090.29.12.888
- Chi tiết tham khảo:
https://bit.ly/oaz_w
=============================
2 khóa học online qua video giúp bạn nhanh chóng có những kiến thức nền tảng về Linux, Oracle, học mọi nơi, chỉ cần có Internet/4G:
- Oracle cơ bản: https://bit.ly/admin_1200
- Linux: https://bit.ly/linux_1200
=============================
KẾT NỐI VỚI CHUYÊN GIA TRẦN VĂN BÌNH:
📧 Mail: binhoracle@gmail.com
☎️ Mobile/Zalo: 0902912888
👨 Facebook: https://www.facebook.com/BinhOracleMaster
👨 Inbox Messenger: https://m.me/101036604657441 (profile)
👨 Fanpage: https://www.facebook.com/tranvanbinh.vn
👨 Inbox Fanpage: https://m.me/tranvanbinh.vn
👨👩 Group FB: https://www.facebook.com/groups/DBAVietNam
👨 Website: https://www.tranvanbinh.vn
👨 Blogger: https://tranvanbinhmaster.blogspot.com
🎬 Youtube: https://www.youtube.com/@binhguru
👨 Tiktok: https://www.tiktok.com/@binhguru
👨 Linkin: https://www.linkedin.com/in/binhoracle
👨 Twitter: https://twitter.com/binhguru
👨 Podcast: https://www.podbean.com/pu/pbblog-eskre-5f82d6
👨 Địa chỉ: Tòa nhà Sun Square - 21 Lê Đức Thọ - Phường Mỹ Đình 1 - Quận Nam Từ Liêm - TP.Hà Nội

=============================
cơ sở dữ liệu, cơ sở dữ liệu quốc gia, database, AI, trí tuệ nhân tạo, artificial intelligence, machine learning, deep learning, LLM, ChatGPT, DeepSeek, Grok, oracle tutorial, học oracle database, Tự học Oracle, Tài liệu Oracle 12c tiếng Việt, Hướng dẫn sử dụng Oracle Database, Oracle SQL cơ bản, Oracle SQL là gì, Khóa học Oracle Hà Nội, Học chứng chỉ Oracle ở đầu, Khóa học Oracle online,sql tutorial, khóa học pl/sql tutorial, học dba, học dba ở việt nam, khóa học dba, khóa học dba sql, tài liệu học dba oracle, Khóa học Oracle online, học oracle sql, học oracle ở đâu tphcm, học oracle bắt đầu từ đâu, học oracle ở hà nội, oracle database tutorial, oracle database 12c, oracle database là gì, oracle database 11g, oracle download, oracle database 19c/21c/23c/23ai, oracle dba tutorial, oracle tunning, sql tunning , oracle 12c, oracle multitenant, Container Databases (CDB), Pluggable Databases (PDB), oracle cloud, oracle security, oracle fga, audit_trail,oracle RAC, ASM, oracle dataguard, oracle goldengate, mview, oracle exadata, oracle oca, oracle ocp, oracle ocm , oracle weblogic, postgresql tutorial, mysql tutorial, mariadb tutorial, ms sql server tutorial, nosql, mongodb tutorial, oci, cloud, middleware tutorial, docker, k8s, micro service, hoc solaris tutorial, hoc linux tutorial, hoc aix tutorial, unix tutorial, securecrt, xshell, mobaxterm, putty

ĐỌC NHIỀU

Trần Văn Bình - Oracle Database Master