8 lưu ý khi sử dụng biến Định tính và Định lượng

Tuấn Long

Nghiên cứu

Phân tích dữ liệu

27 Tháng Chín, 2023

8 lưu ý khi sử dụng biến Định tính và Định lượng

Tiếp tục với nội dung bài viết về biến số (variable), bài viết này mình sẽ trinh bày về sự khác biệt cơ bản giữa biến số định tính - định lượng cùng một số lưu ý quan trọng mà mình tự đúc kết được sau một thời gian học và nghiên cứu.

===

1. Biến định tính

Biến số định tính (qualitative variable) hay còn gọi là biến phân loại / biến phạm trù (categorical variable) - có các đặc trưng cơ bản sau:

---

  • Có các thuộc tính / giá trị / dữ liệu giúp mô tả / đo lường được TÍNH CHẤT PHÂN LOẠI của sự vật hiện tượng
  • Chúng thường được biểu hiện bằng ký tự (chữ viết: A-Z)
  • Nội dung tính chất của chúng thường được biểu hiện qua các từ loại như: Danh từ, Tính từ, Động từ ...
  • Ta có thể đếm (count), so sánh hơn thua (dữ liệu thứ bậc) và phân loại giữa các nhóm giá trị, nhưng tuyệt nhiên không thể thực hiện các phép tính toán số học với loại dữ liệu này
  • Dữ liệu định tính không mang đơn vị đo
  • Ví dụ: sắc đẹp, tình trạng sức khỏe, trạng thái hôn nhân, tôn giáo, dân tộc ....

===

2. Biến định lượng

Biến số định lượng (quantitative variable) có các đặc trưng cơ bản sau:

---

  • Có các thuộc tính / giá trị / dữ liệu giúp mô tả / đo lường được TÍNH CHẤT SỐ LƯỢNG của sự vật hiện tượng
  • Chúng thường được biểu hiện bằng ký số (con số: 0-9)
  • Nội dung số lượng của chúng thường được biểu hiện qua các con số
  • Ta không chỉ thể đếm, so sánh hơn thua, phân loại mà còn có thể dễ dàng thực hiện các tính toán (calculate) số học với dữ liệu định lượng
  • Dữ liệu định lượng luôn mang trong mình đơn vị đo
  • Ví dụ: thu nhập, tuổi, chiều cao, cân nặng, chỉ số tự do ngôn luận, chỉ số BMI...

Theo kinh nghiệm của mình, những người lần đầu tiếp xúc với khái niệm biến số thường sẽ không thể tránh khỏi các mơ hồ. Mình đã liệt kê ra một số câu hỏi thường gặp ở đây và giải thích chúng. Hy vọng giúp được các bạn !

===

3. Một số lưu ý quan trọng

---

3.1 - Tại sao không thể thực hiện tính toán với biến định tính ?

Vì dữ liệu của biến định tính phản ánh tính chất phân loại của biến số chứ không bao hàm các đặc trưng tính toán số học, nên ta không thể cộng trừ nhân chia chúng lại với nhau. Các biến số [Học vấn, dân tộc, Chất lượng dịch vụ, Tôn giáo, Giới tính ...] đều là các biến định tính. Thuộc tính của các biến số này phản ánh tên gọi và tính chất của hiện tượng xã hội.

không tồn tại một dạng logic nào khi lấy Học vấn + Dịch vụ và cũng không một máy tính nào có thể thực hiện được phép tính (calculate) trên, vì chúng sai về mặt bản chất.

Tương tự bạn không thể sử dụng phép nhân để "nhân" hai màu Xanh dương và Vàng với nhau, Xanh dương trộn với Vàng có thể ra màu Xanh lá nhưng phép nhân kia là hoàn toàn vô nghĩa được vì chúng là màu sắc mà màu sắc là tính chất, không phải con số.

---

3.2 - Đếm có phải là tính toán không ?

Đếm (count) không phải là tính toán (calculate). Việc đếm giúp bạn thống kê được có bao nhiêu tính chất xuất hiện trong mẫu nghiên cứu.

Ví dụ: bạn có thể đếm để biết được có bao nhiêu người theo Công giáo, bao nhiêu người theo Phâtj giáo, bao nhiêu người theo Hồi giáo? Nhưng các thuộc tính của tôn giáo này là tên gọi, phản ánh sự khác biệt nội dung, tính chất.

Chúng không phải là con số, ta có thể đếm để xem tần số (frequency) hay xem tỉ lệ % nhưng không thể cộng trừ nhân chia các tôn giáo lại với nhau, vì việc làm này hoàn toàn vô nghĩa.

---

3.3 - Có thể so sánh các biến định tính không ?

Tất nhiên là được, nhưng không phải biến số định tính nào ta cũng có thể dễ dàng so sánh, nếu các thuộc tính của biến số này không phản ánh trạng thái phân cấp.

Ví dụ như biến số [Tôn giáo] gồm các thuộc tính như "Phật giáo", "Công giáo Roma", "Hồi giáo" ... ta có thể dễ dàng phân biệt được tôn giáo này với tôn giáo kia nhưng không thể nào tùy tiện so sánh các tôn giáo với nhau nếu không chỉ ra được các tiêu chí so sánh thuyết phục.

---

3.4 - Có phải tất các các biến định tính đều được thể hiện bằng ký tự ?

Ký tự hay chữ cái là cách thường được sử dụng để biểu hiện giá trị thuộc biến định tính vì chúng dễ dàng thể hiện khi nói tới các tính chất gây mơ hồ, khó hiểu mà các con số không thể nào làm thay. Tuy nhiên, trong nhiều trường hợp, biến định tính có thể được thể hiện bằng cả ký tự lẫn ký số chứ không nhất thiết chỉ có ký tự.

mặc dù vậy, bạn cần hiểu rằng đó chỉ là hình thức mã hóa thông tin (coding) trước khi nhập dữ liệu vào các phần mềm máy tính. Điều cốt lõi trong việc phân biệt các biến số là dựa vào bản chất của dữ liệu.

Ngay cả khi chúng ta mã hóa thông tin cho các thuộc tính bằng các con số như "1 = Phật giáo" , "2 = Công giáo Roma" và "3 = Hồi giáo" ...thì các con số này chỉ là con số đại diện cho phương án các loại tôn giáo, hoàn toàn không có nghĩa phản ánh cấp độ hay số liệu cho các tôn giáo này.

Tương tự với những: con số trên áo của các cầu thủ, số điện thoại, số tài khoản ngân hàng, mã số VISA, số trên thẻ chứng minh nhân dân (ID) - tuy rằng chúng được thể hiện bằng ký số nhưng bản chất của chúng là dùng để phân biệt người này với người khác, tài khoản này với toàn khoản khác. Giúp phân biệt là chức năng của các biến định tính.

---

3.5. Ta có cần thực hiện mã hóa cho biến định lượng không ?

Khác với biến định tính, biến định lượng ghi nhận thông tin theo dạng ký số nên ta hầu như không cần phải mã hóa thông tin vì bản thân các giá trị nhận lại là quá đa dạng và khác biệt, tự chúng đã là một sự mã hóa.

Mặc dù vậy, khi thao tác nhập liệu trên máy tính, bạn vẫn phải thực hiện khai báo các tình chất của biến số hết sức cẩn thận, vì trong khi bạn có thể nhận thức được sự khác biệt thì máy tính lại có thể phát sinh nhầm lẫn .

---

3.6. Liệu có tiêu chí nào giúp ta phân biệt biến định tính và định lượng một cách triệt để không ?

Điều cốt lõi trong việc phân biệt các biến số là dựa vào bản chất của dữ liệu, nhưng đây là là mội nội dung không dễ để phán đoán trong khi việc thể hiện dữ liệu có lúc là bằng ký tự, có lúc lại bằng ký số. Trong tình huống cần phán đoán, các bạn có thể dựa vào một tiêu chí khác, đó là: Đơn vị đo.

Biến định lượng luôn mang trong mình đơn vị đo. Đây là khác biệt dễ phân biệt nhất giữa biến định tính và định lượng. Ví dụ:

  • [Chiều cao] có thể được đo theo cm (168 cm) hoặc mét (1.68 m) ;
  • [Cân nặng] có thể được cân theo kg (70 kg) hoặc tạ (0.7 tạ)
  • [Điểm số] thường có đơn vị đo là (điểm)
  • [Thu nhập] có thể đo theo VNĐ hoặc Dollar

Trong khi sắc đẹp, chất liệu, tôn giáo, quê quán, hạnh kiểm ... hoặc cũng là biến [Chiều cao] nhưng lại được phân loại thành các thuộc tính như "Cao", "Bình thường", "Lùn" - thì chúng lại không có đơn vị đo nữa - chúng là biến định tính.

---

Nếu bạn thắc mắc tình huống như: 15 học sinh, 8 công nhân, 12 bác sĩ, 5 em bé và đặt câu hỏi rằng các từ "học sinh", "công nhân" ... này có phải là đơn vị đo không, thì câu trả lời là không, bởi:

  • Thứ nhất, các giá trị này trả lời cho câu hỏi có bao nhiêu người, câu hỏi về số lượng (number) vốn đã mang trong nó biến định lượng ;
  • Thứ hai, các từ "học sinh", "công nhân" ... là con người, trong khoa học xã hội ta không coi "người" là đơn vị đó mà gọi đó là đơn vị nghiên cứu (cá nhân từng học sinh hoặc nhóm 15 học sinh, hoặc tầng lớp học sinh trong xã hội)

---

3.7 - Biến định tính cung cấp ít thông tin hơn so với biến định lượng ?

Trong nghiên cứu thuần định tính (qualitative research) thì nhận định trên hoàn toàn không đúng, nhưng trong địa hạt của nghiên cứu định lượng thì quả là như vậy.

Nhìn chung, với biến số định tính ta chỉ có thể đếm tần số xuất hiện (frequencies) hay tính tỉ lệ % (percentage); với dữ liệu định tính có tính chất thứ bậc ta có thể phát biểu theo dạng so sánh nhưng tuyệt nhiên không thể tính trung bình hay độ lệch chuẩn cho các biến số định tính như thế này.

Ngược lại, bạn có thể làm được rất nhiều thứ với biến định lượng từ thống kê mô tả tới thống kê suy luận hoặc thực hiện các mô hình hồi quy. Phần lớn các chương trình máy tính tỏ ra tối ưu hơn khi thực hiện các phân tích định lượng, trong khi phân tích các biến định tính sẽ cần tới một chút nghệ thuật trong việc đọc hiểu và gán nhãn (phân tích nội dung).

---

Tuy nhiên, mọi thứ đều chỉ mang tính chất tương đối vì điều quan trọng nhất không nằm ở biến số mà nằm ở việc bạn đang muốn dùng dữ liệu để trả lời cho câu hỏi nào. Trong tình huống đó, tất cả những gì mà bạn cần là bộ dữ liệu thích hợp, bất kể dữ liệu định lượng chỉ chiếm một tỉ lệ nhỏ ở trong đó.

===

Thay lời kết

Trên đây mình đã trình bày cho các bạn các đặc trưng của biến số định tính và biến định lượng cùng một số lưu ý khi sử dụng hai dạng biến số này.

Định tính - Định lượng, suy cho cùng là hai mặt của một đồng xu, có cái này phải có cái kia, không phải lúc nào cũng tách bạch. Chính điều đó càng khiến cho các thông tin ghi nhận trong khoa học xã hội trở nên vô cùng đa dạng và phong phú.

---

Ngoài hiểu biết về tính chất và số lượng của biến số, để có được dữ liệu phù hợp, các nhà nghiên cứu thực nghiệm đã phát triển các thang đo (scale) khác nhau để thu thập dữ liệu khác nhau, phục vụ cho các nhu cầu đo lường khác nhau.

Các thang đo này có cấp độ phức tạp khác nhau và còn được gọi là cấp độ đo lường của dữ liệu (level of measurement). Hiện có 4 cấp độ đo lường phổ biến nhất, bao gồm:

---

  • Thang đo định danh (nominal scale) ;
  • Thang do thứ bậc (ordinal variable) ;
  • Thang đo khoảng (interval variable) ;
  • Thang đo tỉ lệ (ratio variable)

---

Nội dung thang đo này cực kỳ quan trọng, nhất là khi bạn muốn chuyển hóa các biến số và chỉ báo thực nghiệm thành các câu hỏi cụ thể trong bảng hỏi hay phiếu khảo sát. Tuy nhiên đó là sẽ là nội dung của một bài viết khác.

Hẹn gặp lại các bạn ở các bài viết tiếp theo nhé !

Thân ái <3

---

Huế, 4:50 PM 9/27/2023

(*) Vui lòng trích nguồn khi sử dụng bài viết. Cám ơn !

---

TÀI LIỆU THAM KHẢO CHÍNH:

  1. David Borman (2018), "Statistics 101 - A crash course in statistics"
  2. Earl R. Babbie (2013), "The Practice of Social Research", Wadsworth, Cengage Learning
  3. W. Lawrence Neuman (2014), "Social Research Methods Qualitative and Quantitative Approaches", Pearson Education Limited
  4. M. J. Albers (2017), "Introduction to Quantitative Data Analysis in the Behavioral and Social Sciences"
  5. Gordon Mace & Francois Petry (2013), “Cẩm nang xây dựng dự án nghiên cứu trong khoa học xã hội”, NXB Tri thức
  6. Michel Beaud (2014), “Nghệ thuật viết luận văn”, NXB Tri thức
  7. Nguyễn Xuân Nghĩa (2010), “Phương pháp & kĩ thuật trong nghiên cứu xã hội”, NXB Phương Đông
  8. Nguyễn Văn Tuấn (2018), “Đi vào nghiên cứu khoa học”, NXB Tổng hợp TP. HCM
  9. Phan Văn Quyết & Nguyễn Quý Thanh (2001), “Phương pháp nghiên cứu Xã hội học”, NXB Đại học Quốc gia Hà Nội