SQL để phân tích dữ liệu
I. SQL là gì và vai trò của SQL trong phân tích dữ liệu?
SQL (Structured Query Language) là ngôn ngữ chuẩn để truy vấn và thao tác dữ liệu trong các hệ quản trị cơ sở dữ liệu (RDBMS) như MySQL, SQL Server, Oracle, PostgreSQL.
🔑 Vai trò của SQL đối với Business Analyst (BA):
Truy xuất và tổng hợp dữ liệu từ các hệ thống ERP, CRM.
Phân tích xu hướng, hiệu suất kinh doanh (doanh thu, khách hàng, sản phẩm...).
Tạo báo cáo động, phục vụ quyết định quản trị.
Làm việc chặt chẽ với Data Analyst, Data Engineer, Developer để định hình dữ liệu.
II. Các câu lệnh SQL cơ bản trong phân tích dữ liệu
1. Lấy dữ liệu (SELECT)
✅ Ý nghĩa: Lấy danh sách đơn hàng từ năm 2024.
2. Lọc dữ liệu (WHERE, BETWEEN, LIKE)
✅ Lọc sản phẩm có giá từ 100 đến 500.
✅ Tìm khách hàng tên bắt đầu bằng "Nguyen".
3. Nhóm dữ liệu (GROUP BY) và Tính toán (SUM, AVG, COUNT)
✅ Doanh thu theo khách hàng.
4. Sắp xếp dữ liệu (ORDER BY)
✅ Sản phẩm có giá cao nhất lên đầu.
5. Kết hợp bảng (JOIN)
✅ Lấy tên khách hàng và tổng tiền đơn hàng.
III. Kỹ thuật nâng cao trong phân tích dữ liệu với SQL
1. Tổng hợp theo nhiều cấp (GROUP BY với nhiều cột)
✅ Doanh thu theo năm của mỗi khách hàng.
2. Hàm cửa sổ (Window Function) để phân tích nâng cao
✅ Xếp hạng đơn hàng theo khách hàng.
3. Truy vấn lồng nhau (Subquery)
✅ Lọc đơn hàng có giá trị cao hơn trung bình.
4. Lấy dữ liệu duy nhất (DISTINCT)
✅ Lấy danh sách khách hàng đã từng đặt hàng.
5. Giới hạn số dòng trả về (LIMIT / TOP)
✅ Top 5 khách hàng có doanh thu cao nhất.
IV. Ví dụ thực tế phân tích dữ liệu với SQL
Tình huống phân tích
Câu lệnh SQL áp dụng
Tổng doanh thu theo tháng
GROUP BY MONTH(ngay_dat)
+ SUM(tong_tien)
Khách hàng mua nhiều nhất (top khách hàng)
GROUP BY khach_hang_id
+ ORDER BY SUM(tong_tien)
Sản phẩm bán chạy nhất
GROUP BY san_pham_id
+ COUNT(*)
So sánh doanh thu giữa các vùng
JOIN
+ GROUP BY khu_vuc
+ SUM(tong_tien)
Xác định tăng trưởng doanh thu theo quý
GROUP BY QUARTER(ngay_dat)
+ SUM(tong_tien)
V. Công cụ hỗ trợ BA sử dụng SQL hiệu quả
Công cụ
Mô tả
SQL Server Management Studio (SSMS)
Công cụ quản lý SQL Server.
MySQL Workbench
Giao diện trực quan để làm việc với MySQL.
DBeaver
Công cụ kết nối nhiều loại DBMS.
Azure Data Studio
Công cụ nhẹ, hiện đại cho SQL Server, PostgreSQL.
Power BI / Tableau (kết nối SQL)
Trực quan hóa kết quả SQL.
✅ VI. Kết luận
SQL là công cụ không thể thiếu giúp Business Analyst khai thác và phân tích dữ liệu thực tế.
Việc kết hợp giữa các câu lệnh cơ bản và nâng cao giúp BA tạo báo cáo chính xác, từ đó hỗ trợ ra quyết định kinh doanh.
Hiểu và sử dụng thành thạo SQL là kỹ năng nền tảng, đặc biệt với những BA làm trong Data-driven business.
Last updated