3 điểu mấu chốt trong phân tích mối quan hệ giữa các biến số

Tuấn Long

Nghiên cứu

Phân tích dữ liệu

01 Tháng Sáu, 2024

3 điểu mấu chốt trong phân tích mối quan hệ giữa các biến số

(*) Vào cuối tháng 05.2024 có một bạn đọc gửi cho mình mấy câu hỏi qua email. Mình thấy câu hỏi của bạn ấy khá hay nên đã trả lời và chia sẻ lên đây để bạn nào quan tâm có thể cùng tham khảo. Khi viết blog này mình chỉ đơn giản là chia sẻ chút hiểu biết của bạn thân trong quá trình tự học, tự nghiên cứu nên cá nhân mình cũng rất trân quý những bạn đọc đã liên hệ với mình để làm rõ thêm những nội dung mà mình từng viết trước đó.

Xin phép được dấu tên bạn và một lần nữa cám ơn câu hỏi của bạn <3

=====

Bạn đọc:

Chào Thầy, Thầy phân tích kỹ và rõ bài này rất hay: Phân biệt khái niệm “Mối liên hệ” và “Tương quan”. [ ... ] Ở đây, muốn phân biệt cụm từ “mối liên hệ” và “mối quan hệ” giữa 2 đối tượng. Trong nghiên cứu định lượng, khi xem xét:

  • TH 1: Công bố thông tin tác động đến hiệu quả tài chính của DN
  • TH 2: Hiệu quả tài chính tác động đến công bố thông tin của DN
  • TH 3: Mối QUAN HỆ giữa công bố thông tin và hiệu quả tài chính của DN (tức muốn xem xét cả TH 1 và TH 2, gọi là tác động qua lại)

Như vậy TH 1 và TH 2 dùng từ “mối liên hệ” (tức là công bố thông tin có mối liên hệ đến hiệu quả tài chính hoặc hiệu quả tài chính có mối liên hệ đến công bố thông tin), trong khi TH 3 dùng từ “mối quan hệ”. Hai cụm từ này có thể sử dụng thay thế cho nhau được không ? Mình khá lăn tăn trường hợp này, mọi người cũng thường thắc mắc khi dùng 2 cụm từ này.

Cám ơn Thầy quan tâm chia sẻ thông tin

---

Trả lời:

Chào bạn, mình đã hiểu ý của bạn,
Mình xin chia sẻ thế này để bạn tham khảo

Mình cho là sẽ không có câu trả lời rạch ròi để phân biệt "mối quan hệ" và "mối liên hệ" trong các tình huống nghiên cứu mà bạn vừa đưa ra vì lý do kinh nghiệm và thói quen trong cách dùng từ của một số học giả.

Ngay cả với từ "tương quan" mà mình từng phân tích trước đây, rõ ràng không phải ai cũng dùng nó theo cách mà mình phân tích, vì trong tiếng Việt sự khác biệt giữa "tương quan", "quan hệ" và "liên hệ" là không quá rạch ròi. Mình không thể nói người ta sai, nếu họ "phân tích mối quan hệ" giữa hai biến tỉ lệ bằng cách sử dụng hệ số tương quan Pearson hay chạy "phân tích tương quan" giữa hai biến định tính bằng cách sử dụng kiểm định Chi-sq. Mình cho rằng, họ chỉ sai khi áp dụng thuật ngữ "phân tích tương quan" lẫn lộn cho mọi loại biến số hoặc khi dịch qua Tiếng Anh, họ dùng "correlation analysis" cho tất cả các biến sử dụng thang do "nominal" .

---

Như vậy, cách làm đúng trong các tình huống này là (1) phải dựa vào nội hàm của thuật ngữ chứ không nên chỉ dừng lại ở lớp vỏ ngôn từ. Mình cho rằng, việc sử dụng "mối liên hệ" để mô tả tác động một chiều và "mối quan hệ" để tác động hai chiều như bạn chia sẻ cũng là một trong những cách tiếp cận khái quát có thể sử dụng được, song cũng không nhất định chỉ là như thế vì không có cơ sở.

Để tăng tính thuyết phục, mình nghĩ rằng ta nên (2) quan tâm tới logic trong mối quan hệ giữa các biến số / hiện tượng. Vì không phải mối quan hệ nào cũng là quan hệ ngang cấp. Trong xã hội sẽ có người tới trước (Sơn Tinh), kẻ tới sau (Thủy Tinh), người làm chủ (lão bá hộ), kẻ làm tớ (anh tiều phu) ... Tương tự, mối quan hệ giữa các biến số sẽ có "biến độc lập", "biến phụ thuộc" và một số "biến trung gian" khác

Vậy thì, cái mà bạn đang bị mơ hồ ở đây, rất có thể xuất phát từ việc bạn chưa chỉ rõ được đâu là biến độc lập và đâu là biến phụ thuộc, nghĩa là chưa xác định được mối quan hệ nhân - quả giữa các hiện tượng

---

Bạn biết đấy, ở một số nghiên cứu thì mối quan hệ này là rất tường minh, vd "thu nhập cá nhân và đóng thuế", trong đó [thu nhập cá nhân] là biến độc lập, quyết định tới việc một người phải [đóng thuế] cao hay thấp. Trong tình huống này, bạn chỉ cần đưa ra được phương trình hồi quy là có thể thấy được mối quan hệ / mối liên hệ / mối tương quan tuyến tính giữa các biến số.

Song cũng có không ít các trường hợp xuất hiện khó khăn trong việc xác định hình thức mối quan hệ, vd như "sự trung thành của khách hàng" và "sự hài lòng trong đánh giá dịch vụ". Mối quan hệ giữa hai biến số này rất có thể sẽ là mối quan hệ hai chiều. Một mặt khách hàng "hài lòng về dịch vụ" nên "trung thành với dịch vụ" đó, song cũng rất có thể họ đã có thiện cảm trước đó (họ hài lòng) nên họ mới trung thành với dịch vụ. Tình huống này người ta phải sử dụng tới các phân tích nhiểu chiều như PCA và SEM để xác định.

Cuối cùng, mối "quan hệ" / "liên hệ" đó có thực sự mang ý nghĩa nhân - quả không hay chỉ là mối quan hệ ngẫu nhiên, ta cũng không thể võ đoán mà (3) phải dựa vào lý thuyết khoa học hoặc kinh nghiệm thực tế. Những lý thuyết này sẽ được sử dụng để lý giải / giải thích cho các số liệu mà bạn tìm ra được từ các phân tích trên.

---

Tóm lại theo cách hiểu của mình, thì việc bạn sử dụng từ "liên hệ" hay "quan hệ" sẽ không quá quan trọng bằng việc xác định được (1) nội hàm của hiện tượng / thuật ngữ / biến số đó là gì, (2) vai trò logic của các biến số trong mối quan hệ cụ thể đó ra sao và (3) có những lý thuyết nào được sử dụng để lý giải cho mối quan hệ đó.

Theo đó, bạn có thể sử dụng một trong hai từ này và sẽ càng tốt hơn nữa nếu trong báo cáo bạn dùng chúng một cách nhất quán. Nếu từ đầu bạn đã dùng từ "mối quan hệ", thì hãy áp dụng thuật ngữ đó cho toàn bộ báo cáo làm rõ chúng bằng cách chỉ ra vai trò độc lập và phụ thuộc của các biến trong mối quan hệ này.

Chúc bạn vui !

---

Bạn đọc:

Cám ơn Thầy đã chia sẻ chân tình kiến thức. Thầy dành thời gian diễn giải nội dung cụ thể thể hiện sự tận tâm hướng dẫn. Mình xin phép kết bạn Zalo với Thầy để chia sẻ kiến thức nhé. Cám ơn Thầy nhiều !

---

Trả lời (End):

Không có gì bạn ạ, mình rất vui vì giúp được bạn Bạn cứ gửi kết bạn qua Zalo nhé, có điều minh cũng không hay lên Zalo lắm nên sợ bạn nhắn tin sẽ ít khi phản hồi (cười). Thay vào đó bạn có thể liên lạc qua email, mình sẽ lựa thời gian phù hợp để trả lời bạn nhé.

Thân ái chào bạn !

---

(*) Bạn đọc có thể xem lại bài viết "Phân biệt khái niệm “Mối liên hệ” và “Tương quan” [tại đây]
---

Huế, 11:49 AM 6/1/2024