Dưới đây là Checklist vận hành chuẩn cho hệ thống HAProxy + Keepalived + Pacemaker trên Oracle Linux 7 mà các đội NOC/DevOps/FO trực ca thường dùng. Tôi chia thành:
Checklist hàng ngày
Checklist hàng tuần
Checklist hàng tháng
Checklist trước/sau change
Checklist khi xảy ra sự cố
Cách viết theo kiểu dễ hiểu + câu lệnh cụ thể + kết quả mong đợi để dùng luôn trong vận hành.
1. CHECKLIST HÀNG NGÀY (Daily Operations)
1.1 Kiểm tra trạng thái cluster
Lệnh
pcs status
Kết quả mong đợi
Tất cả node Online
Resource Started
Ví dụ:
Online: [ node1 node2 ]
vip_haproxy Started node1
haproxy_srv Started node1
Nếu thấy
FAILED
Stopped
OFFLINE
→ phải kiểm tra ngay.
1.2 Kiểm tra VIP
Lệnh
ip a | grep 10.51.246.35
Kết quả mong đợi
VIP tồn tại trên 1 node duy nhất.
Ví dụ
inet 10.51.246.35/24 scope global secondary eth0
Nếu VIP mất
→ người dùng sẽ không truy cập được.
1.3 Kiểm tra HAProxy
Lệnh
systemctl status haproxy
Kết quả mong đợi
Active: active (running)
Kiểm tra port
ss -lntp | grep haproxy
Ví dụ
LISTEN 0 128 0.0.0.0:80
1.4 Kiểm tra backend
Ví dụ backend Tomcat:
curl -I http://10.51.246.33:8080
curl -I http://10.51.246.34:8080
Kết quả mong đợi
HTTP/1.1 200 OK
1.5 Kiểm tra log lỗi
journalctl -u haproxy -n 50
journalctl -u keepalived -n 50
journalctl -u pacemaker -n 50
Tìm nhanh lỗi
grep -Ei "error|fail|down" /var/log/messages
1.6 Kiểm tra dung lượng log
du -sh /var/log/haproxy*
Nếu log > 5GB
→ cần rotate.
2. CHECKLIST HÀNG TUẦN (Weekly)
2.1 Kiểm tra cấu hình HAProxy
haproxy -c -f /etc/haproxy/haproxy.cfg
Kết quả mong đợi
Configuration file is valid
2.2 Kiểm tra trạng thái Keepalived
systemctl status keepalived
2.3 Kiểm tra quorum cluster
pcs quorum status
Kết quả mong đợi
Quorum: Yes
2.4 Kiểm tra network giữa các node
ping node2
ping node1
Hoặc
ping VIP
3. CHECKLIST HÀNG THÁNG (Monthly)
3.1 Test failover
Bước 1
Tắt node master
systemctl stop haproxy
Bước 2
Kiểm tra VIP
ip a
Kết quả mong đợi
VIP chuyển sang node backup.
3.2 Kiểm tra history cluster
pcs status history
Mục đích
Xem:
failover
restart
resource failure
3.3 Backup cấu hình cluster
pcs config > /backup/pcs_config_$(date +%F).txt
3.4 Backup config HAProxy
cp /etc/haproxy/haproxy.cfg /backup/
4. CHECKLIST TRƯỚC KHI THAY ĐỔI (Before Change)
4.1 Ghi lại hiện trạng
date
hostname
pcs status
ip a
ss -lntp
systemctl status haproxy
4.2 Backup cấu hình
cp -p /etc/haproxy/haproxy.cfg \
/etc/haproxy/haproxy.cfg.bak_$(date +%F_%H%M)
4.3 Kiểm tra config
haproxy -c -f /etc/haproxy/haproxy.cfg
5. CHECKLIST SAU KHI THAY ĐỔI (After Change)
systemctl reload haproxy
Kiểm tra
systemctl status haproxy
ss -lntp | grep haproxy
Test truy cập
curl -I http://VIP
Kiểm tra log
journalctl -u haproxy -n 50
6. CHECKLIST KHI XẢY RA SỰ CỐ
Người dùng báo không truy cập được
Bước 1 kiểm tra VIP
ip a | grep VIP
Bước 2 kiểm tra cluster
pcs status
Bước 3 kiểm tra HAProxy
systemctl status haproxy
Bước 4 kiểm tra port
ss -lntp | grep haproxy
Bước 5 kiểm tra backend
curl -I http://backend_ip:port
Bước 6 kiểm tra log
journalctl -u haproxy -xe
journalctl -u keepalived -xe
journalctl -u pacemaker -xe
7. CÁC CẢNH BÁO CẦN GIÁM SÁT TỰ ĐỘNG
Nếu dùng Prometheus + Grafana, nên cảnh báo khi:
| Metric | Ngưỡng |
|---|---|
| HAProxy down | critical |
| VIP missing | critical |
| backend down | warning |
| HTTP 5xx > 5% | warning |
| latency > 2s | warning |
| node cluster offline | critical |
Mô hình giám sát Grafana – Prometheus – Loki – Alertmanager cho phép thu thập metrics, log và cảnh báo tập trung cho toàn bộ hệ thống mà không ảnh hưởng hiệu suất hệ thống đang chạy
Giám sát hệ thống Grafana
.
8. BÀI HỌC KINH NGHIỆM
1. Không restart ngay
Trước khi restart luôn thu thập:
pcs status
ip a
ss -lntp
journalctl -u haproxy -n 100
2. Giám sát backend riêng
Không chỉ giám sát HAProxy.
3. Test failover định kỳ
Ít nhất mỗi quý.
9. BỘ LỆNH NGẮN GỌN CHO TRỰC CA
pcs status
systemctl status haproxy
systemctl status keepalived
ip a | grep VIP
ss -lntp | grep haproxy
curl -I http://backend
journalctl -u haproxy -n 50
TƯ VẤN: Click Here hoặc Hotline/Zalo 090.29.12.888
=============================
Website không chứa bất kỳ quảng cáo nào, mọi đóng góp để duy trì phát triển cho website (donation) xin vui lòng gửi về STK 90.2142.8888 - Ngân hàng Vietcombank Thăng Long - TRAN VAN BINH
=============================
Nếu bạn không muốn bị AI thay thế và tiết kiệm 3-5 NĂM trên con đường trở thành DBA chuyên nghiệp hay làm chủ Database thì hãy đăng ký ngay KHOÁ HỌC ORACLE DATABASE A-Z ENTERPRISE, được Coaching trực tiếp từ tôi với toàn bộ bí kíp thực chiến, thủ tục, quy trình của gần 20 năm kinh nghiệm (mà bạn sẽ KHÔNG THỂ tìm kiếm trên Internet/Google) từ đó giúp bạn dễ dàng quản trị mọi hệ thống Core tại Việt Nam và trên thế giới, đỗ OCP.
- CÁCH ĐĂNG KÝ: Gõ (.) hoặc để lại số điện thoại hoặc inbox https://m.me/tranvanbinh.vn hoặc Hotline/Zalo 090.29.12.888
- Chi tiết tham khảo:
https://bit.ly/oaz_w
=============================
2 khóa học online qua video giúp bạn nhanh chóng có những kiến thức nền tảng về Linux, Oracle, học mọi nơi, chỉ cần có Internet/4G:
- Oracle cơ bản: https://bit.ly/admin_1200
- Linux: https://bit.ly/linux_1200
=============================
KẾT NỐI VỚI CHUYÊN GIA TRẦN VĂN BÌNH:
📧 Mail: binhoracle@gmail.com
☎️ Mobile/Zalo: 0902912888
👨 Facebook: https://www.facebook.com/BinhOracleMaster
👨 Inbox Messenger: https://m.me/101036604657441 (profile)
👨 Fanpage: https://www.facebook.com/tranvanbinh.vn
👨 Inbox Fanpage: https://m.me/tranvanbinh.vn
👨👩 Group FB: https://www.facebook.com/groups/DBAVietNam
👨 Website: https://www.tranvanbinh.vn
👨 Blogger: https://tranvanbinhmaster.blogspot.com
🎬 Youtube: https://www.youtube.com/@binhguru
👨 Tiktok: https://www.tiktok.com/@binhguru
👨 Linkin: https://www.linkedin.com/in/binhoracle
👨 Twitter: https://twitter.com/binhguru
👨 Podcast: https://www.podbean.com/pu/pbblog-eskre-5f82d6
👨 Địa chỉ: Tòa nhà Sun Square - 21 Lê Đức Thọ - Phường Mỹ Đình 1 - Quận Nam Từ Liêm - TP.Hà Nội
=============================
cơ sở dữ liệu, cơ sở dữ liệu quốc gia, database, AI, trí tuệ nhân tạo, artificial intelligence, machine learning, deep learning, LLM, ChatGPT, DeepSeek, Grok, oracle tutorial, học oracle database, Tự học Oracle, Tài liệu Oracle 12c tiếng Việt, Hướng dẫn sử dụng Oracle Database, Oracle SQL cơ bản, Oracle SQL là gì, Khóa học Oracle Hà Nội, Học chứng chỉ Oracle ở đầu, Khóa học Oracle online,sql tutorial, khóa học pl/sql tutorial, học dba, học dba ở việt nam, khóa học dba, khóa học dba sql, tài liệu học dba oracle, Khóa học Oracle online, học oracle sql, học oracle ở đâu tphcm, học oracle bắt đầu từ đâu, học oracle ở hà nội, oracle database tutorial, oracle database 12c, oracle database là gì, oracle database 11g, oracle download, oracle database 19c/21c/23c/23ai, oracle dba tutorial, oracle tunning, sql tunning , oracle 12c, oracle multitenant, Container Databases (CDB), Pluggable Databases (PDB), oracle cloud, oracle security, oracle fga, audit_trail,oracle RAC, ASM, oracle dataguard, oracle goldengate, mview, oracle exadata, oracle oca, oracle ocp, oracle ocm , oracle weblogic, postgresql tutorial, mysql tutorial, mariadb tutorial, ms sql server tutorial, nosql, mongodb tutorial, oci, cloud, middleware tutorial, docker, k8s, micro service, hoc solaris tutorial, hoc linux tutorial, hoc aix tutorial, unix tutorial, securecrt, xshell, mobaxterm, putty