Chủ Nhật, 17 tháng 4, 2022

Quy trình kiểm tra và xử lý lỗi hệ thống CNTT


1Sơ đồ quy trình kiểm tra và xử lý lỗi  

2. Quy trình kiểm tra mức phần cứng, OS

2.1. Kiêm tra tải CPU, RAM

-  Kiểm tra trạng thái CPU: prstat -Z -n 1 1 1

Hình 34: Trạng thái CPU

-       Kiểm tra trạng thái RAM: /usr/sbin/prtconf | grep Memory

Hình 35: Trạng thái RAM

2.2. Kiêm tra tải dung lượng ổ đĩa

 Kiểm tra dung lượng ổ đĩa: df –h

Hình 36: Dung lượng ổ đĩa

2.3. Kiểm tra log OS

Solaris: tail -1000f /var/adm/message hoặc dmesg

Linux: tail -1000f /var/log/message

AIX: errpt -a |tail hoặc errpt |tail  hoặc errpt -a |more

3. Quy trình kiểm tra các thành phần hệ thống

Hệ thống XXX có service tự động kiểm tra trạng thái họat động của các module trong hệ thống, cũng như kiểm tra trạng thái kết nối tới các hệ thống khác một cách định kỳ và được lưu log trong database, thành viên quản trị có thể theo dõi được.

Mỗi khi kiểm tra thấy các mất kết nối tới các hệ thống khác hoặc các module không họat động, service này sẽ tự động gửi email và sms thông báo tới thành viên quản trị hệ thống để kịp thời xử lý sự cố.

Ngoài cách kiểm tra tự động như trên, thành viên quản trị còn có thể kiểm tra một cách thủ công bằng các phương pháp sau:

3.1. Kiểm tra nghiệp vụ chính xem có chạy ổn định không

3.2. Quy trình xác định lỗi và khắc phục:

Cần phải kiểm tra được nguyên nhân gây lỗi để đưa ra các phương án khắc phục thích hợp. Để xác định nguyên nhân gây lỗi thì thành viên quản trị cần tiến hành theo các bước:

- Bước 1: Kiểm tra trạng thái họat động các moduletheo mục Hướng dẫn vận hành hệ thống (Cách thức kiểm tra hoạt động của các module)


- Bước 2: Kiểm tra kết nối tới các hệ thống khác theo mục Sơ đồ kết nối hệ thống.


- Bước 3: Kiểm tra logstheo mục Hướng dẫn vận hành hệ thống (Thông tin log của thành phần phần mềm)


- Bước 4: Xác định nguyên nhân gây lỗi (do bản thân DBAViet hay do các hệ thống khác)


- Bước 5: Xác định lỗi chi tiết từ đó đưa ra cách khắc phục.

- Bước 6: Trong trường hợp lỗi mà không khắc phục được, liên hệ tới điều hành cấp Trung tâm theo danh sách tại mục Danh sách liên hệ khi có sự cố để làm việc với chuyên gia phía đối tác tìm phương án khắc phục lỗi.

 

4. Quy trình xử lý các lỗi thường gặp

4.1. Các lỗi hệ thống

- Bước 1: Kiểm tra trạng thái họat động các module theo mục các Module phần mềm. Thực hiện lệnh kiểm tra theo hướng dẫn tại mục Hướng dẫn vận hành hệ thống (Cách thức kiểm tra hoạt động của các module)


- Bước 2: Khởi động lại các module nếu bị tắt theo hướng dẫn tại mục Hướng dẫn vận hành hệ thống (vận hành tắt, bật các module)


- Bước 3: Kiểm tra lại nghiệp vụ


- Bước 4: Nếu không thành công, liên hệ với quan trị viên theo danh sách tại tại mục Danh sách liên hệ khi có sự cố.


4.2. Các lỗi phần cứng

Lưu đồ xử lý sự cố phần cứng hệ thống như sau:

Hình 37: Biểu đồ kiểm tra phần cứng

-     Các phần cứng của hệ thống như: Các máy chủ DBAViet hoạt động theo mô hình Active/Active hoặc Active/Standby nên khi một trong hai phần tử bị sự cố, hệ thống vẫn hoạt động bình thường, có thể tháo thiết bị gặp sự cố để sửa chữa, bảo trì.

-     Các ổ đĩa cứng của server/diskarray, Storage đều được cài đặt Raid 0+1 hay Raid 5, nên khi một ổ đĩa gặp sự cố có thể tháo/thay thế nóng ổ đĩa bị hỏng này.

-     Yêu cầu thực hiện: Với các lỗi phần cứng phức tạp, cần báo cho các cấp cao có thẩm quyền để yêu cầu chuyên gia hỗ trợ thực hiện khắc phục.

 

4.3. Các lỗi kết nối

- Bước 1: Kiểm tra các kết nối tới các hệ thống theo bảng dưới đây bằng lệnh telnet:

telnet  [ip của hệ thống]  [cổng dịch vụ]

+ Nếu kết quả telnet có dòng thông báo Connected: kết nối thành công.

+ Nết kết quả telnet không thành công: liên hệ với quản trị hệ thống tương ứng theo danh sách


-     Bước 2: Thực hiện lại nghiệp vụ


-     Bước 3: Với những lỗi không thể khắc phục, báo ngay cho quản trị viên theo danh sách tại mục để phối hợp xử lý.

 

Hình 38: Biểu đồ kiểm tra kết nối

4.4. Các lỗi phần mềm

- Hiện tượng: Xảy ra các lỗi có những từ Connection resufed

- Nguyên nhân: có nhiều kết nối tới Oracle không được giải phóng dẫn tới hiện tượng hết kết nối

- Cách khắc phục:  Thực hiện theo hướng dẫn vận hành hệ thống phần 3 của tài liệu vận hành

- Trong trường hợp khởi động lại các Module mà dịch vụ không hoạt động, báo ngay cho quản trị viên theo danh sách để phối hợp xử lý.

5. Quy trình sao lưu và khôi phục hệ thống

5.1. Quy trình sao lưu cấu hình hệ thống

Hình 40: Quy trình sao lưu hệ thống

+ Sao lưu mã nguồn , chương trình

-          Nén tất cả dữ liệu tại thư mục /app01/DBAViet/ rồi tải về server backup.

-          Dùng lệnh sau để nén file: tar –cvf data.tar /app01/DBAViet/

+ Sao lưu cơ sở dữ liệu dùng exp (có thể dùng expdp hoặc rman):

-          Export cơ sở dữ liệu oracle dưới dạng file .dmp.

-          Dùng lệnh sau để export: exp username/password@orcl file=/app01DBAViet/backup/data.dmp

5.2. Quy trình phục hồi hệ thống

Hình 41: Quy trình khôi phục hệ thống

-     Giải nén và copy dữ liệu mã nguồn, chương trình vào thư mục cài đặt. Lệnh giải nén: tar -xf data.tar


-     Import dữ liệu sao lưu dưới dạng file .dmp vào cơ sở dữ liệu. Dùng lệnh sau để import: imp username/password@orcl file=/app01/DBAViet/backup/data.dmp

(hoặc recovery với rman)


-     Khởi động lại tất cả các dịch vụ theo mục Vận hành các thành phần của hệ thống


-     Kiểm tra các kết nối tới hệ thống khác.


-     Kiểm tra họat động của nghiệp vụ


-     Trong trường hợp khởi động lại các Module mà dịch vụ không hoạt động, báo ngay cho quản trị viên theo danh sách để phối hợp xử lý.


=============================
* KHOÁ HỌC ORACLE DATABASE A-Z ENTERPRISE trực tiếp từ tôi giúp bạn bước đầu trở thành những chuyên gia DBA, đủ kinh nghiệm đi thi chứng chỉ OA/OCP, đặc biệt là rất nhiều kinh nghiệm, bí kíp thực chiến trên các hệ thống Core tại VN chỉ sau 1 khoá học.
* CÁCH ĐĂNG KÝ: Gõ (.) hoặc để lại số điện thoại hoặc inbox https://m.me/tranvanbinh.vn hoặc Hotline/Zalo 090.29.12.888
* Chi tiết tham khảo:
https://bit.ly/oaz_w
=============================
KẾT NỐI VỚI CHUYÊN GIA TRẦN VĂN BÌNH:
📧 Mail: binhoracle@gmail.com
☎️ Mobile: 0902912888
⚡️ Skype: tranbinh48ca
👨 Facebook: https://www.facebook.com/BinhOracleMaster
👨 Inbox Messenger: https://m.me/101036604657441 (profile)
👨 Fanpage: https://www.facebook.com/tranvanbinh.vn
👨 Inbox Fanpage: https://m.me/tranvanbinh.vn
👨👩 Group FB: https://www.facebook.com/groups/DBAVietNam
👨 Website: https://www.tranvanbinh.vn
👨 Blogger: https://tranvanbinhmaster.blogspot.com
🎬 Youtube: http://bit.ly/ytb_binhoraclemaster
👨 Tiktok: https://www.tiktok.com/@binhoraclemaster?lang=vi
👨 Linkin: https://www.linkedin.com/in/binhoracle
👨 Twitter: https://twitter.com/binhoracle
👨 Địa chỉ: Tòa nhà Sun Square - 21 Lê Đức Thọ - Phường Mỹ Đình 1 - Quận Nam Từ Liêm - TP.Hà Nội

=============================
học oracle database, Tự học Oracle, Tài liệu Oracle 12c tiếng Việt, Hướng dẫn sử dụng Oracle Database, Oracle SQL cơ bản, Oracle SQL là gì, Khóa học Oracle Hà Nội, Học chứng chỉ Oracle ở đầu, Khóa học Oracle online,khóa học pl/sql, học dba, học dba ở việt nam, khóa học dba, khóa học dba sql, tài liệu học dba oracle, Khóa học Oracle online, học oracle sql, học oracle ở đâu tphcm, học oracle bắt đầu từ đâu, học oracle ở hà nội, oracle database tutorial, oracle database 12c, oracle database là gì, oracle database 11g, oracle download, oracle database 19c, oracle dba tutorial, oracle tunning, sql tunning , oracle 12c, oracle multitenant, Container Databases (CDB), Pluggable Databases (PDB), oracle cloud, oracle security, oracle fga, audit_trail, oracle dataguard, oracle goldengate, mview, oracle exadata, oracle oca, oracle ocp, oracle ocm , oracle weblogic, middleware, hoc solaris, hoc linux, hoc aix, unix, securecrt, xshell, mobaxterm, putty

ĐỌC NHIỀU

Trần Văn Bình - Oracle Database Master