Cách đọc và diễn giải dữ liệu trên Biểu đồ hộp

Tuấn Long

Phân tích dữ liệu

Thống kê & Phân tích dữ liệu

28 Tháng M. một, 2023

Cách đọc và diễn giải dữ liệu trên Biểu đồ hộp

Biểu đồ hộp (box plot) là một sáng tạo của nhà Toán học thiên tài J.Tukey. Trong một không gian nhỏ bé của một chiếc hộp và hai cái râu hàm chứa rất nhiều thông tin, đặc biệt là thông tin của một biến định lượng. Với bộ dữ liệu phù hợp trong tay, bạn có thể dễ dàng vẽ biểu đồ trên tất cả các phần mềm phân tích dữ liệu.

Trong bài viết này, mình sẽ hướng dẫn các bạn cách tạo ra một biểu đồ hộp bằng tay cùng cách đọc cũng như diễn giải dữ liệu trên đó nhé.

---

---

Để vẽ biểu đồ hộp, dữ liệu của bạn không được nằm một cách ngẫu hứng, mà phải được tổ chức thành một dataframe theo nguyên tắc "tidy". Thậm chí, nếu bạn muốn so sánh giữa hai hay nhiều nhóm với mỗi nhóm dại diện cho một chiếc hộp, thì khi đó dữ liệu sẽ phải được tổ chức theo một nguyên tắc còn phức tạp hơn nữa.

Thành ra, không phải ngẫu nhiên ở đầu bài viết mình đề cập tới cái gọi là "dữ liệu phù hợp". Sự thực là kể cả khi bạn đã có trong tay phần mềm mạnh mẽ như Excel, thì cũng không có nghĩa là bạn có thể sẽ vẽ biểu đồ hộp được ngay đâu (cười).

----

Huế, 6:11 PM 11/28/2023

(*) Vui lòng trích nguồn khi sử dụng

---

Data Team, Sociology Hue - HUSC

Design & Content: Tuấn Long | tuanlong.dhkh@gmail.com