5 lý do không nên sử dụng biểu đồ của Google Form trong báo cáo nghiên cứu

Tuấn Long

Phân tích dữ liệu

Thống kê & Phân tích dữ liệu

01 Tháng Sáu, 2024

5 lý do không nên sử dụng biểu đồ của Google Form trong báo cáo nghiên cứu

Gần đây khi xem các báo cáo nghiên cứu khoa học của sinh viên, mình thấy nhiều bạn sử dụng biểu đồ có sẵn trong Google Form làm thành phương tiện để trực quan dữ liệu. Đây là một trong những tính năng rất hữu ích của Google Form. Nếu trước đây người ta phải đưa dữ liệu về các phần mềm phân tích để chạy bản đồ thi nay có thể thấy ngay kết quả khi vừa có dữ liệu. Ví dụ, nếu trong Form có câu hỏi về "Giới tính", với hai đáp án là "Nam" và "Nữ" thì tương ứng với số phiếu phản hồi lại (response) sẽ là một biểu đồ tròn, trong đó nêu rõ có bao nhiều người "Nam" / "Nữ" trả lời, và tỉ lệ % là bao nhiêu.

Tuy nhiên, đưa các biểu đồ trong Google Form vào báo cáo khoa học mà chưa qua tinh chỉnh là không đúng về mặt nguyên tắc và không thực sự hữu dụng trong các trường hợp phân tích phức tạp. Dưới đây là 5 lý mà mình khuyên các bạn không nên sử dụng biểu đồ của Google Form trong báo cáo nghiên cứu của mình
---

1 - Không đảm bảo tiêu chuẩn khoa học

Biểu đồ trong Google Form thường bao gồm 3 dạng: biểu đồ tròn (pie chart), biểu đồ cột ngang (bar chart) và biểu đồ cột dọc (column chart). Trong phần lớn các trường hợp, chúng có thể hiển thị dữ liệu khá rõ ràng nhưng đây đều là các biểu đồ được tối giản để tập trung vào mô tả lại dữ liệu thay vì hiển thị đầy đủ các tham số như các báo cáo khoa học yêu cầu.

Biểu đồ trên Google Form không có tiêu đề, không có caption, không có nơi hiển thị nguồn dữ liệu - người viết buộc phải tự thêm vào trên Word khi sử dụng những biểu đồ này. Nếu áp dụng dạng biểu đồ này với các nghiên cứu có yêu cầu nghiêm ngặt về hình thức thể hiện thông tin trên một biểu đồ, thì Google Form chắc chắn không thể đáp ứng nổi.

---

2 - Hiển thị dữ liệu chưa qua chỉnh sửa

Khác với biểu đồ được tạo nên từ các phần mềm phân tích chuyên biệt như Excel, SPSS, Minitab hoặc R... Biểu đồ trên Google Form chỉ là sự phản án dữ liệu thô đang được lưu trữ trên một file Spearsheet (Excel của Google). Dữ liệu có sao thì Form sẽ ánh xạ lại y chang như thế. Nghĩa là nếu dữ liệu có sai sót, thiếu nội dung hoặc nội dung bị nhầm lẫn - thì Form sẽ không giúp bạn phát hiện để xử lý mà chỉ hiển thị lại những gì dữ liệu đang sở hữu. Nếu người dùng không rành về kỹ thuật, hậu quả sẽ khôn lường.

Với những người thích sử dụng Google Form có thể sẽ cho rằng với các đáp án được tạo sẵn thì khả năng sai sót là không nhiều. Vấn đề không đơn giản như vậy, vì Google Form sẽ hiển thị tất cả các thông tin thu được, nên khi khảo sát diễn ra với câu trả lời đóng thì không sao, còn với câu hỏi mở hoặc với câu hỏi vừa đóng vừa mở thì rất rắc rối. Thay vì trực quan những dữ liệu đã được làm sạch, gộp biến hoặc biến đổi để khai mở thông tin thì việc có gì vẽ nấy sẽ là thảm họa trong phân tích bởi chúng không giúp làm rõ được thông tin, trái lại còn hiển thị dữ liệu thô thành một mớ bùng nhùng.

Ví dụ, bạn muốn biết tuổi của một ai đó để có cơ sở phân loại họ theo nhóm tuổi (thiếu niên, thanh niên, trung niên, lão niên) nhưng không tiện hỏi trực tiếp, cách làm thông thường sẽ là (1) hỏi năm sinh (2) biến đổi năm sinh thành số tuổi và (3) gộp số tuổi thành các nhóm tuổi tương ứng với một khoảng số tuổi nào đó. Nhưng nếu bạn làm trên Google Form, trừ phi là bạn hỏi luôn họ thuộc nhóm tuổi nào, nếu không, Form sẽ không giúp bạn biế đổi dữ liệu sang thành dạng thông tin mà cần.

---

3 - Không thể tùy chỉnh các tham số

Suy cho cùng thì Google Form chỉ là công cụ giúp thu thập dữ liệu (data gathering) chứ không phải phần mềm phân tích dữ liệu (data analysis). Các biểu đồ trong Form chỉ đóng vai trò giúp người nghiên cứu có một bức tranh sơ bộ về tình hình khảo sát, vì thế biểu đồ trong Form là thứ được dùng để xem (visual) chứ không phải là biểu đồ khoa học thực thụ. Quả thật vậy, Google Form không có tính năng thay đổi các tham số trên biểu đồ như màu sắc, tên, nhãn, các giá trị, chú giải ... Cho nên, ngay cả khi bạn biết rằng cần phải thay đổi tham số thì cũng không thể làm gì hơn.

Tệ hơn nữa, đôi khi Google Form còn không cho ngươi dùng copy trực tiếp biểu đồ về các file báo cáo như Word hoặc Powerpoint. Người dùng phải sử dụng các công cụ chụp màn hình như Screen-Shot hoặc Snipping Tools để chụp lấy biểu đồ và dán về báo cáo. Việc làm này không chỉ khiến các biểu đồ không thể chỉnh sửa mà còn nghiên nhiên biến biểu đồ đó thành một file ảnh có độ phân giải thấp. Khi in ấn báo cáo sử dụng biểu đồ dạng này, các biểu đồ có thể bị mờ, nhờ, mất nét. Nếu in đen trắng, thậm chí còn không thấy gì.

---

4 - Hiển thị dữ liệu không đầy đủ

Biểu đồ tròn là dạng biểu đồ rất phổ biến trong Google Form, chúng gọn gàng, đẹp mắt và dễ sử dụng. Tuy nhiên, với dạng câu hỏi khảo sát chứa từ 4 thuộc tính trở lên, hoặc tồn tại một thuộc tính nào đó có tỉ lệ % quá ít (<5%), thì các biểu đồ tròn này sẽ không hiển thị tỉ lệ %. Ngoài việc nhận định thuộc tính đó chiếm tỉ lệ quá ít, ta sẽ không đủ cơ sở để so sánh thuộc tính này với các thuộc tính khác.

Nếu nghiên cứu rơi vào dạng khám phá những hiện tượng thiểu số hoặc quan tâm các tỉ lệ nhỏ thì biểu đồ tròn của Google Form sẽ không bao giờ có thể đáp ứng được nhu cầu của bạn. Nếu bạn không hiểu điều này mà vẫn ung dung đưa chúng vào báo cáo nghiên cứu thì "ngày tàn" của bạn chắc không còn lâu đâu (cười).

---

5 - Chỉ trực quan cho một biến số

Thống kê mô tả một biến số và trực quan cho các dữ liệu chỉ bao gồm một biến số là thao tác hữu ích, chúng cung cấp cho ta bức tranh tổng quan về khách thể và hiện tượng mà ta đang khảo sát. Mặc dù vậy, hiện tượng xã hội không bao giờ chỉ là các chỉ báo tồn tại với nhau một cách rời rạc.

Ví dụ, khi "nghiên cứu về định hướng việc làm của sinh viên", câu hỏi cần quan tâm sẽ không chỉ dừng lại các sinh viên đang có những [dự định] gì cho tương lai (đơn biến) mà xa hơn nữa là so sánh những [dự định] đó giữa các nhóm [Giới tính] khác nhau ? Hoặc chỉ ra mối quan hệ giữa các nhóm SV có [Giới tính] khác nhau với [Mức độ hài lòng] về chương trình đào tạo của nhà trường ? Hay đánh giá mức độ tương quan giữa [Mức lương kỳ vọng] với [Điểm GPA] ...

Với các nghiên cứu cần chỉ ra mối quan hệ giữa hai biến định tính, ta sẽ cần sử dụng bảng chéo và kiểm định Chi-sq; còn với các phân tích tương quan ta sẽ cần tới biểu đồ tán xạ và kiểm định tương quan Pearson / Sherman. Trong tình huống này, các biểu đồ đơn biến của Google Form sẽ không thể đáp ứng được nhiệm vụ trên. Nếu người dùng chỉ dựa vào biểu đồ trên Google Form, thì nghiên cứu của bạn sẽ bị cản trở rất nhiều trong việc đào sâu chỉ rõ mối quan hệ / tương quan giữa các biến số. Báo cáo nghiên cứu chỉ có một biến số, đặc biệt là các báo cáo nghiên cứu trong khoa học xã hội, là dạng báo cáo không đem lại nhiều giá trị ngoài việc mô tả.

---

Kết luận

Google Form là công cụ rất mạnh để thu thập dữ liệu có cấu trúc như khảo sát xã hội và không thể làm điều gì nhiều hơn việc thu thập dữ liệu. Vì thế, Google Form không được thiết kế để tối ưu cho việc phân tích hoặc trực quan dữ liệu.

Để phân tích dữ liệu từ Google Form, bạn cần (1) mở được nơi chứa dữ liệu của Google Form là Spearsheet, (2) tải về máy dưới định dạng .xlsx và (3) import vào các phần mềm phân tích dữ liệu chuyên dụng. Bạn cũng có thể dưa data từ Spearsheet tới các ứng dụng phân tích online thuộc hệ sinh thái của Google Workspace như Google Data Analysis hoặc Google Data Studio ... để tạo nên các biểu đồ khoa học chất lượng thay vì cap màn hình của Google Form và đưa vào báo cáo.

Vì một tương lai không còn làm nghiên cứu theo kiểu "mì ăn liền" như thế này, các bạn sinh viên hãy tránh việc copy biểu đồ trên Google Form rồi đưa vào báo cáo nhé.

Công đức vô lượng (cười)

---

Huế, 11:41 PM 6/1/2024

(*) Vui lòng trích nguồn khi sử dụng bài viết