Chủ Nhật, 20 tháng 7, 2025

📊 BÀI 15: XỬ LÝ DỮ LIỆU DẠNG BẢNG VỚI PANDAS – ĐỌC, GHI, LỌC, NHÓM, THỐNG KÊ

🎯 1. Tổng quan

Pandas là thư viện cực mạnh dùng để:

  • Đọc & ghi dữ liệu .csv, Excel, SQL

  • Biểu diễn dữ liệu dạng DataFrame (giống bảng Excel)

  • Lọc, xử lý, nhóm, tính toán thống kê

  • Là nền tảng cho Data Analysis, Machine Learning, BI…

⚠️ Cài đặt nếu chưa có:

bash
pip install pandas

📦 2. Import thư viện và tạo DataFrame cơ bản

python
import pandas as pd # Tạo bảng dữ liệu từ dict data = { "Tên": ["Minh", "Linh", "An"], "Tuổi": [30, 25, 22], "Điểm": [8.5, 9.0, 7.5] } df = pd.DataFrame(data) print(df)

📁 3. Đọc & ghi file CSV

a. Đọc từ file CSV

File: data.csv

csv
Tên,Tuổi,Điểm Minh,30,8.5 Linh,25,9.0 An,22,7.5
python
df = pd.read_csv("data.csv") print(df.head()) # hiển thị 5 dòng đầu

b. Ghi DataFrame ra CSV

python
df.to_csv("output.csv", index=False)

index=False để không ghi số thứ tự dòng


🔍 4. Truy cập dữ liệu

python
print(df["Tên"]) # Truy cập cột print(df.iloc[0]) # Truy cập dòng đầu tiên print(df.loc[1, "Tuổi"]) # Dòng 1, cột "Tuổi"

🔎 5. Lọc dữ liệu theo điều kiện

python
# Học sinh có điểm > 8 ket_qua = df[df["Điểm"] > 8] print(ket_qua)

🧮 6. Tính toán thống kê

python
print(df["Điểm"].mean()) # Trung bình print(df["Tuổi"].max()) # Lớn nhất print(df.describe()) # Thống kê tổng quan

🔄 7. Thêm & xóa cột

python
df["Xếp loại"] = ["Khá", "Giỏi", "Trung bình"] df = df.drop("Tuổi", axis=1) # Xóa cột Tuổi

📊 8. Nhóm dữ liệu – Group By

python
# Giả sử có thêm cột Lớp df["Lớp"] = ["A", "A", "B"] nhom = df.groupby("Lớp")["Điểm"].mean() print(nhom)

🧪 9. Bài tập + Lời giải


✅ Bài 1: Đọc file sinhvien.csv, lọc SV có điểm ≥8

File: sinhvien.csv

csv
Tên,Tuổi,Điểm Minh,21,9.0 An,22,7.0 Linh,20,8.5

Script:

python
import pandas as pd df = pd.read_csv("sinhvien.csv") gioi = df[df["Điểm"] >= 8] print(gioi)

✅ Bài 2: Thêm cột “Xếp loại” theo điểm

python
def xep_loai(diem): if diem >= 8: return "Giỏi" elif diem >= 6.5: return "Khá" else: return "Trung bình" df["Xếp loại"] = df["Điểm"].apply(xep_loai) print(df)

✅ Bài 3: Ghi kết quả ra file mới

python
df.to_csv("ketqua.csv", index=False)

✅ Bài 4: Tính điểm trung bình theo từng lớp

Thêm cột lớp vào file CSV hoặc thêm bằng code:

python
df["Lớp"] = ["A", "A", "B"] tb_lop = df.groupby("Lớp")["Điểm"].mean() print(tb_lop)

✅ 10. Kết luận

  • pandas là công cụ phân tích dữ liệu số 1 trong Python

  • Làm chủ read_csv, lọc, nhóm, tính toán → bạn có thể xử lý mọi file dữ liệu dạng bảng

  • Rất quan trọng cho: Data Science, ML, BI, xử lý báo cáo, Excel tự động hóa

=============================
Website không chứa bất kỳ quảng cáo nào, mọi đóng góp để duy trì phát triển cho website (donation) xin vui lòng gửi về STK 90.2142.8888 - Ngân hàng Vietcombank Thăng Long - TRAN VAN BINH
=============================
Nếu bạn không muốn bị AI thay thế và tiết kiệm 3-5 NĂM trên con đường trở thành DBA chuyên nghiệp hay làm chủ Database thì hãy đăng ký ngay KHOÁ HỌC ORACLE DATABASE A-Z ENTERPRISE, được Coaching trực tiếp từ tôi với toàn bộ bí kíp thực chiến, thủ tục, quy trình của gần 20 năm kinh nghiệm (mà bạn sẽ KHÔNG THỂ tìm kiếm trên Internet/Google) từ đó giúp bạn dễ dàng quản trị mọi hệ thống Core tại Việt Nam và trên thế giới, đỗ OCP.
- CÁCH ĐĂNG KÝ: Gõ (.) hoặc để lại số điện thoại hoặc inbox https://m.me/tranvanbinh.vn hoặc Hotline/Zalo 090.29.12.888
- Chi tiết tham khảo:
https://bit.ly/oaz_w
=============================
2 khóa học online qua video giúp bạn nhanh chóng có những kiến thức nền tảng về Linux, Oracle, học mọi nơi, chỉ cần có Internet/4G:
- Oracle cơ bản: https://bit.ly/admin_1200
- Linux: https://bit.ly/linux_1200
=============================
KẾT NỐI VỚI CHUYÊN GIA TRẦN VĂN BÌNH:
📧 Mail: binhoracle@gmail.com
☎️ Mobile/Zalo: 0902912888
👨 Facebook: https://www.facebook.com/BinhOracleMaster
👨 Inbox Messenger: https://m.me/101036604657441 (profile)
👨 Fanpage: https://www.facebook.com/tranvanbinh.vn
👨 Inbox Fanpage: https://m.me/tranvanbinh.vn
👨👩 Group FB: https://www.facebook.com/groups/DBAVietNam
👨 Website: https://www.tranvanbinh.vn
👨 Blogger: https://tranvanbinhmaster.blogspot.com
🎬 Youtube: https://www.youtube.com/@binhguru
👨 Tiktok: https://www.tiktok.com/@binhguru
👨 Linkin: https://www.linkedin.com/in/binhoracle
👨 Twitter: https://twitter.com/binhguru
👨 Podcast: https://www.podbean.com/pu/pbblog-eskre-5f82d6
👨 Địa chỉ: Tòa nhà Sun Square - 21 Lê Đức Thọ - Phường Mỹ Đình 1 - Quận Nam Từ Liêm - TP.Hà Nội

=============================
AI, trí tuệ nhân tạo, artificial intelligence, machine learning, deep learning, LLM, ChatGPT, DeepSeek, Grok, oracle tutorial, học oracle database, Tự học Oracle, Tài liệu Oracle 12c tiếng Việt, Hướng dẫn sử dụng Oracle Database, Oracle SQL cơ bản, Oracle SQL là gì, Khóa học Oracle Hà Nội, Học chứng chỉ Oracle ở đầu, Khóa học Oracle online,sql tutorial, khóa học pl/sql tutorial, học dba, học dba ở việt nam, khóa học dba, khóa học dba sql, tài liệu học dba oracle, Khóa học Oracle online, học oracle sql, học oracle ở đâu tphcm, học oracle bắt đầu từ đâu, học oracle ở hà nội, oracle database tutorial, oracle database 12c, oracle database là gì, oracle database 11g, oracle download, oracle database 19c, oracle dba tutorial, oracle tunning, sql tunning , oracle 12c, oracle multitenant, Container Databases (CDB), Pluggable Databases (PDB), oracle cloud, oracle security, oracle fga, audit_trail,oracle RAC, ASM, oracle dataguard, oracle goldengate, mview, oracle exadata, oracle oca, oracle ocp, oracle ocm , oracle weblogic, postgresql tutorial, mysql tutorial, mariadb tutorial, ms sql server tutorial, nosql, mongodb tutorial, oci, cloud, middleware tutorial, hoc solaris tutorial, hoc linux tutorial, hoc aix tutorial, unix tutorial, securecrt, xshell, mobaxterm, putty

ĐỌC NHIỀU

Trần Văn Bình - Oracle Database Master