Chủ Nhật, 20 tháng 7, 2025

🧮 BÀI 13: REGULAR EXPRESSION (REGEX) TRONG PYTHON – TÌM KIẾM & XỬ LÝ CHUỖI THÔNG MINH

🎯 1. Tổng quan

Regex là một ngôn ngữ đặc biệt giúp bạn:

  • Tìm kiếm chuỗi có mẫu cụ thể (số điện thoại, email, URL…)

  • Kiểm tra định dạng đầu vào

  • Tách / trích xuất thông tin

  • Thay thế nội dung

Python hỗ trợ Regex qua thư viện chuẩn re.


🔤 2. Một số ký hiệu regex cơ bản

Ký hiệuÝ nghĩaVí dụ
.Bất kỳ 1 ký tự"a.c" khớp "abc", "axc"
^Bắt đầu chuỗi"^abc" khớp "abc123"
$Kết thúc chuỗi"123$" khớp "abc123"
*Lặp 0 hoặc nhiều lần"a*" khớp "", "a", "aaa"
+Lặp 1 hoặc nhiều lần"a+" khớp "a", "aa"
?Lặp 0 hoặc 1 lần"a?" khớp "", "a"
[]1 ký tự trong tập"[abc]" khớp "a", "b"
\dSố ([0-9])\d+ khớp "123"
\wKý tự chữ/số\w+ khớp "abc123"
\sKhoảng trắng\s+ khớp " "
``Hoặc

🧰 3. Thư viện re trong Python

python
import re

Các hàm thường dùng:

HàmMô tả
re.search()Tìm lần đầu tiên
re.findall()Trả về tất cả kết quả khớp
re.sub()Thay thế chuỗi
re.match()So khớp từ đầu chuỗi
re.compile()Tạo regex tái sử dụng

🔍 4. Ví dụ minh họa thực tế

a. Tìm email trong đoạn văn bản

python
text = "Liên hệ: admin@domain.com hoặc support@abc.vn" emails = re.findall(r'\b[\w.-]+@[\w.-]+\.\w+\b', text) print(emails) # ['admin@domain.com', 'support@abc.vn']

b. Kiểm tra chuỗi là số điện thoại Việt Nam?

python
sdt = "0901234567" if re.fullmatch(r'0\d{9}', sdt): print("Số điện thoại hợp lệ")

c. Tìm các số trong chuỗi

python
s = "Tôi có 2 con mèo, 1 con chó và 10 con gà." so = re.findall(r'\d+', s) print(so) # ['2', '1', '10']

d. Thay thế từ nhạy cảm

python
text = "Thằng ngu này dốt thật" clean = re.sub(r"(ngu|dốt)", "***", text, flags=re.IGNORECASE) print(clean) # Thằng *** này *** thật

e. Tách từ bằng khoảng trắng hoặc dấu chấm phẩy

python
s = "Python; Java Golang;C++" words = re.split(r'[; ]+', s) print(words) # ['Python', 'Java', 'Golang', 'C++']

🧠 5. Mẹo viết và đọc regex

MẹoGiải thích
Dùng r'' để viết regexVí dụ: r"\d+" thay vì "\\d+"
Viết đơn giản, dễ hiểuTránh viết regex quá phức tạp trong 1 dòng
Dùng re.compile() nếu dùng nhiều lầnTăng hiệu suất
Dùng re.VERBOSE để chú thích dễ hiểuRegex rõ ràng hơn

🧪 6. Ứng dụng thực tế nâng cao

a. Trích số tiền từ chuỗi log

python
log = "Đơn hàng thành công: 1.250.000 VND" sotien = re.findall(r'\d[\d.]*', log) print(sotien) # ['1.250.000']

b. Kiểm tra định dạng ngày: dd/mm/yyyy

python
date = "19/07/2025" pattern = r'\d{2}/\d{2}/\d{4}' if re.fullmatch(pattern, date): print("Định dạng ngày hợp lệ")

📚 7. Bài tập gợi ý

  1. Viết regex tìm email trong file văn bản

  2. Viết regex tách domain từ địa chỉ URL

  3. Viết regex kiểm tra password ≥8 ký tự, có số và chữ

  4. Thay thế tất cả số trong chuỗi bằng ký hiệu #


✅ 8. Kết luận

  • Regex là vũ khí tối thượng để xử lý văn bản, log, kiểm tra định dạng

  • Python hỗ trợ rất mạnh mẽ qua thư viện re

  • Nắm chắc regex giúp bạn viết các công cụ như: log parser, kiểm tra dữ liệu, trích xuất email, xử lý biểu mẫu…

=============================
Website không chứa bất kỳ quảng cáo nào, mọi đóng góp để duy trì phát triển cho website (donation) xin vui lòng gửi về STK 90.2142.8888 - Ngân hàng Vietcombank Thăng Long - TRAN VAN BINH
=============================
Nếu bạn không muốn bị AI thay thế và tiết kiệm 3-5 NĂM trên con đường trở thành DBA chuyên nghiệp hay làm chủ Database thì hãy đăng ký ngay KHOÁ HỌC ORACLE DATABASE A-Z ENTERPRISE, được Coaching trực tiếp từ tôi với toàn bộ bí kíp thực chiến, thủ tục, quy trình của gần 20 năm kinh nghiệm (mà bạn sẽ KHÔNG THỂ tìm kiếm trên Internet/Google) từ đó giúp bạn dễ dàng quản trị mọi hệ thống Core tại Việt Nam và trên thế giới, đỗ OCP.
- CÁCH ĐĂNG KÝ: Gõ (.) hoặc để lại số điện thoại hoặc inbox https://m.me/tranvanbinh.vn hoặc Hotline/Zalo 090.29.12.888
- Chi tiết tham khảo:
https://bit.ly/oaz_w
=============================
2 khóa học online qua video giúp bạn nhanh chóng có những kiến thức nền tảng về Linux, Oracle, học mọi nơi, chỉ cần có Internet/4G:
- Oracle cơ bản: https://bit.ly/admin_1200
- Linux: https://bit.ly/linux_1200
=============================
KẾT NỐI VỚI CHUYÊN GIA TRẦN VĂN BÌNH:
📧 Mail: binhoracle@gmail.com
☎️ Mobile/Zalo: 0902912888
👨 Facebook: https://www.facebook.com/BinhOracleMaster
👨 Inbox Messenger: https://m.me/101036604657441 (profile)
👨 Fanpage: https://www.facebook.com/tranvanbinh.vn
👨 Inbox Fanpage: https://m.me/tranvanbinh.vn
👨👩 Group FB: https://www.facebook.com/groups/DBAVietNam
👨 Website: https://www.tranvanbinh.vn
👨 Blogger: https://tranvanbinhmaster.blogspot.com
🎬 Youtube: https://www.youtube.com/@binhguru
👨 Tiktok: https://www.tiktok.com/@binhguru
👨 Linkin: https://www.linkedin.com/in/binhoracle
👨 Twitter: https://twitter.com/binhguru
👨 Podcast: https://www.podbean.com/pu/pbblog-eskre-5f82d6
👨 Địa chỉ: Tòa nhà Sun Square - 21 Lê Đức Thọ - Phường Mỹ Đình 1 - Quận Nam Từ Liêm - TP.Hà Nội

=============================
AI, trí tuệ nhân tạo, artificial intelligence, machine learning, deep learning, LLM, ChatGPT, DeepSeek, Grok, oracle tutorial, học oracle database, Tự học Oracle, Tài liệu Oracle 12c tiếng Việt, Hướng dẫn sử dụng Oracle Database, Oracle SQL cơ bản, Oracle SQL là gì, Khóa học Oracle Hà Nội, Học chứng chỉ Oracle ở đầu, Khóa học Oracle online,sql tutorial, khóa học pl/sql tutorial, học dba, học dba ở việt nam, khóa học dba, khóa học dba sql, tài liệu học dba oracle, Khóa học Oracle online, học oracle sql, học oracle ở đâu tphcm, học oracle bắt đầu từ đâu, học oracle ở hà nội, oracle database tutorial, oracle database 12c, oracle database là gì, oracle database 11g, oracle download, oracle database 19c, oracle dba tutorial, oracle tunning, sql tunning , oracle 12c, oracle multitenant, Container Databases (CDB), Pluggable Databases (PDB), oracle cloud, oracle security, oracle fga, audit_trail,oracle RAC, ASM, oracle dataguard, oracle goldengate, mview, oracle exadata, oracle oca, oracle ocp, oracle ocm , oracle weblogic, postgresql tutorial, mysql tutorial, mariadb tutorial, ms sql server tutorial, nosql, mongodb tutorial, oci, cloud, middleware tutorial, hoc solaris tutorial, hoc linux tutorial, hoc aix tutorial, unix tutorial, securecrt, xshell, mobaxterm, putty

ĐỌC NHIỀU

Trần Văn Bình - Oracle Database Master