Biến số được tạo nên như thế nào ?

Tuấn Long

Nghiên cứu

Phân tích dữ liệu

25 Tháng Chín, 2023

Biến số được tạo nên như thế nào ?

(*) Bài viết này mình sẽ chia sẻ một chút hiểu biết của mình về một trong những khái niệm từng khiến mình hoang mang nhất thời còn đi học: Biến số.

===

1. Biến số là gì ?

Có rất nhiều tài liệu viết về định nghĩa của biến số. Tựu trung lại, biến số (variable) là một (1) đặc trưng đo lường của con người / sự vật / hiện tượng trong tự nhiên và xã hội. (2) Biến số mang trong mình các giá trị (hoặc thuộc tính) riêng biệt và (3) các giá trị đó sẽ thay đổi từ khách thể này sang khách thể khác.

Có lẽ thông tin quan trọng nhất với biến số chính là sự thay đổi, vì bản thân từ "variable" trong tiếng Anh đã có nghĩa là "thay đổi" và sự thay đổi này diễn ra giữa các khách thể khác nhau. Ngược lại với biến số là hằng số (constant).

---

Ví dụ: Cùng là khía cạnh [Giới tính], nhưng ở anh Long thì [Giới tính] là "Nam", còn khi qua em Châu thì [Giới tính] đã là "Nữ" ; hoặc, tuy cô Minh cũng có [Giới tính] là "Nữ" nhưng ở khía cạnh [Học vấn] thì cô Minh đã là "Thạc sĩ" trong khi em Châu mới chỉ ..."tốt nghiệp mầm non" (cười).

---

Trong ví dụ trên, (1) [Giới tính] [Học vấn] chính là các biến số, (2) chúng mang các giá trị thay đổi từ khách thể này sang khách thể khác và (3) giúp cung cấp một cái nhìn cụ thể hơn về các khác thể này. Chả ai có thể biết được chính xác bạn là ai nếu không hỏi thêm các thông tin khác như giới tính, tuổi tác, nghề nghiệp hay các mối quan hệ xã hội ...

===

2. Biến số được hình thành như thế nào ?

Biến số không tự nó sinh ra, mà là một hệ quả được tạo nên từ quá trình thao tác hóa khái niệm (operationalization).

Thao thác hóa khái niệm là một quá trình, tại đó, các nhà nghiên cứu sẽ chuyển hóa nội hàm của một khái niệm phức tạp, trừu tượng thành các biến số (variable) và chỉ báo (indicator) khả dĩ có thể giúp nhà nghiên cứu mô tả và đo lường.

---
Ví dụ:

Chúng ta từng nghe tới cụm từ "người Việt Nam" nhưng làm sao để người khác có thể hình dung được như thế nào là một người Việt Nam khi mà bản thân họ còn chưa bao giờ tiếp xúc. Lúc này, cụm từ "người Việt Nam" trở thành một khái niệm phức tạp và trừu tượng, mà để nhận thức được, ta cần chỉ ra các khía cạnh cụ thể của khái niệm này.

Quá trình này có bản chất là trả lời cho câu hỏi: "Một người Việt Nam sẽ trông ra sao ?" hoặc "Người Việt Nam có những đặc điểm nhận dạng như thế nào ?" Ta có thể trả lời như sau:

Người Việt Nam là một dân tộc sống sinh sống ở Đông Nam Á, họ sở hữu đầy đủ các đặc điểm của người Châu Á như tóc đen, da vàng, mắt nâu, dáng người tương đối thấp bé, nhẹ cân... Họ sinh sống trên lãnh thổ của nước CHXHCN Việt Nam, mang quốc tịch Việt Nam và là một công dân của Việt Nam. Nếu bạn bước ra ngoài đường và gặp một người Châu Á mang mặc trên người chiếc áo có cờ đỏ sao vàng hoặc áo dài, họ có xu hướng đi cùng nhau với nụ cười thường xuyên xuất hiện trên môi - rất có thể đó chính là người Việt Nam".

Đoạn văn bản trên đưa ra các thông tin về người Việt, tuy không đầy đủ và tuyệt đối chính xác nhưng cũng đã phần nào giúp chúng ta hình dung được về người Việt Nam.

Ít nhất, vẻ bề ngoài của họ sẽ không giống với người Châu Âu, không giống với người Châu Phi thậm chí cũng không giống như thổ dân Bắc Mĩ. Nhưng vì họ rất giống người Vân Nam (Trung Quốc) hoặc Thái Lan, vì thế, cách tốt nhất để xác định xem họ có phải người Việt Nam hay không đó là nhìn vào quốc tịch và văn hóa của họ.

---

Như bạn thấy đấy, cùng là biến số đó nhưng trong khi tên của nó không thay đổi thì các giá trị / thuộc tính của nó thì lại thay đổi trên các khách thể khác nhau. Không bao giờ có chuyện mọi người sở hữu những thuộc tính giống hệt nhau trừ phi họ là sản phẩm của một nền công nghiệp nhân bản vô tính.

===

3. Cấu tạo của biến số

Một biến số thường gồm hai phần: [Tên biến số] (variable name) và [Thuộc tính] (attribute). Thuộc tính của biến được thể hiện qua các [Giá trị] (values). Khi một tập hợp của các giá trị này được tổ chức theo một nguyên tắc nhất định - thì chúng được gọi là Dữ liệu [data].

---

3.1. Biến số và thuộc tính khác nhau ra sao ?

Có thể nói việc phân biệt biến số và thuộc tính của nó là một trong các nội dung khiến nhiều người cảm thấy bối rối nhất khi lần đầu tiếp xúc với khái niệm này.

Thực ra việc làm này không hề khó. Hãy cứ xem hình minh họa dưới đây, bạn sẽ hiểu. Theo đó [Học vấn] là tên biến số và các cấp học như: "Cấp I", "Cấp II", "Cấp III", "Đại học" và "Sau đại học" chính là các thuộc tính của biến số [Học vấn].

---

Một biến số thường sẽ mang trong mình một số lượng hữu hạn các thuộc tính, ví dụ

  • Biến số [Giới tính] có các 02 thuộc tính là "Nam" và "Nữ" ;
  • Biến số [Quốc tịch] có ít nhất 193 thuộc tính, bao gồm tên của 193 quốc gia và vùng lãnh thổ được Liên hợp quốc công nhận.
  • Biến số [Tình trạng hôn nhân] gồm các thuộc tính như: "Độc thân", "Kết hôn", "Ly thân", "Ly hôn", "Góa - Bụa" ...

---

Việc xác định thuộc tính của biến số có thể dựa vào: (1) kinh nghiệm của bản thân, (2) tri thức bản địa ; song tốt nhất là được (3) rút ra từ lý thuyết khoa học, từ (4) các tài liệu có cơ sở pháp lý hoặc từ (5) bản chất của dữ liệu.

Ví dụ: cùng là biến số [Chiều cao] nhưng ta có thể ghi nhận ít nhất hai nhóm thuộc tính: (1) là các trạng thái chiều cao như "Rất cao", "Cao", "Bình thường", "Thấp" và "Lùn" (dữ liệu định tính) ; song cũng có thể là (2) các chỉ số chiều cao cụ thể như: 1.63m, 1.84m, 1.76m, 1.53m ... (dữ liệu định lượng)

---

3.2. Thuộc tính và giá trị khác nhau như thế nào ?

Việc phân biệt [Thuộc tính] [Giá trị] của biến số cũng là một việc nên làm, vì thoạt nhìn qua thì chúng có vẻ rất giống nhau. Như đã nói ở trên, một biến số thường sẽ mang trong mình một số lượng hữu hạn các thuộc tính. Ví dụ, biến số [Học vấn] có 5 thuộc tính là "Cấp I", "Cấp II", "Cấp III", "Đại học" và "Sau đại học".

Nhưng khi ta phỏng vấn trên một mẫu dân cư (đại khái có 162 người), mỗi người này sẽ mang trong mình một thông tin về [Học vấn] của chính họ. Có người học hết "Cấp I", có người đã tốt nghiệp "Cấp III". Báo cáo ghi nhận trong 162 người tham gia phòng vấn thì có 100 người nhận mình là đã học xong "Cấp III", 40 người học hết "Cấp II" 20 người khác mới học xong "Cấp I" và chỉ có 02 người là tốt nghiệp "Đại học".

Nếu sắp xếp các thông tin này vào thành một nhóm thì ta có thể ghi nhận thành: [Học vấn] = "Cấp I", "Cấp I", "Cấp III, "Cấp III", "Cấp III", "Cấp III", "Cấp II", "Đại học", "Cấp III" ... cứ như thế cho hết 162 người. Nếu năm cấp học kìa là thuộc tính, vậy thì dãy thông tin về [Học vấn] của 162 người kể trên được gọi là các [Giá trị].

---

Như bạn thấy đấy, giá trị của biến số đã thay đổi từ khách thể này sang khách thể khác, tương ứng với bao nhiêu khách thể sẽ có bấy nhiêu giá trị. Trong khi đó, các thuộc tính thì luôn là một cái gì đó hữu hạn mà thôi.

Và với tập hợp của các giá trị trên, nếu chúng ta tổ chức chúng lại với nhau theo các nguyên tắc nào đó (cấu trúc / phi cấu trúc) - thì các giá trị này được gọi chung là dữ liệu.

===

Kết luận

Biến số là một trong những khái niệm then chốt quan trọng nhất trong nghiên cứu khoa học xã hội thực nghiệm.

Điều cốt yếu nhất mà bạn cần nắm về biến số là: (1) Biến số bao gồm [Tên biến] [Thuộc tính], trong đó (2) thuộc tính của biến được thể hiện qua các giá trị, mà giá trị của biến sẽ thay đổi từ khách thể này sang khác thể khác.

Hiểu đúng khái niệm biến số giúp việc phân tích và nghiên cứu của chúng ta trở nên có hệ thống và giúp cụ thể hóa quá trình đo lường trong khoa học xã hội.

Ở các bài viết sau, mình sẽ chia sẻ kỹ hơn về các loại biến số cũng như cách sử dụng chúng, đặc biệt là (1) cách phân biệt các biến định tính - định lượng ; (2) phân biệt biến số dựa trên quan hệ độc lập - phụ thuộc và (3) phân biệt biến số dựa trên thang đo.

---

Huế, 11:57 PM 9/26/2023

(*) Vui lòng trích nguồn khi sử dụng bài viết. Cám ơn !

---

TÀI LIỆU THAM KHẢO CHÍNH:

  1. David Borman (2018), "Statistics 101 - A crash course in statistics"
  2. Earl R. Babbie (2013), "The Practice of Social Research", Wadsworth, Cengage Learning
  3. W. Lawrence Neuman (2014), "Social Research Methods Qualitative and Quantitative Approaches", Pearson Education Limited
  4. M. J. Albers (2017), "Introduction to Quantitative Data Analysis in the Behavioral and Social Sciences"
  5. Gordon Mace & Francois Petry (2013), “Cẩm nang xây dựng dự án nghiên cứu trong khoa học xã hội”, NXB Tri thức
  6. Michel Beaud (2014), “Nghệ thuật viết luận văn”, NXB Tri thức
  7. Nguyễn Xuân Nghĩa (2010), “Phương pháp & kĩ thuật trong nghiên cứu xã hội”, NXB Phương Đông
  8. Nguyễn Văn Tuấn (2018), “Đi vào nghiên cứu khoa học”, NXB Tổng hợp TP. HCM
  9. Phan Văn Quyết & Nguyễn Quý Thanh (2001), “Phương pháp nghiên cứu Xã hội học”, NXB Đại học Quốc gia Hà Nội