Người dùng SPSS không còn quá xa lạ với phân tích hồi quy. Đây là một phương pháp phân tích, xử lý hiệu quả trong phần mềm SPSS. Ngày hôm nay chúng tôi sẽ giới thiệu tới các bạn một loại phương pháp trong phân tích hồi quy – phương pháp phân tích hồi quy nhị phân Binary Logistic. Vậy phương pháp hồi quy nhị phân là gì, có chức năng và đặc điểm như thế nào? Quy trình chạy phân tích hồi quy nhị phân trong SPSS? Hãy cùng chúng tôi tìm hiểu trong bài viết này nhé.
Phần mềm SPSS dùng để phân tích số liệu trong nghiên cứu khoa học hay trong bài luận văn thạc sĩ là rất quan trong, tuy nhiên không phải ai cũng biết cách sử dụng, phần lớn các bạn không có nhiều kinh nghiệm trong quá trình chạy SPSS. Dù thế bạn cũng đừng lo lắng vì hiện nay Luận Văn Tốt có cung cấp cho các bạn dịch vụ xử lý số liệu trong SPSS, với kinh nghiệm hơn 10 năm trong nghề chúng tôi cam kết sẽ mang đến cho các bạn kết quả chính xác và bào mật tuyệt đối, nhắn tin hoặc gọi Zalo/tele : 0934573149 bạn nhé!!
Phương pháp phân tích hồi quy nhị phân – Binary Logistic là gì?
Hồi quy nhị phân là một trong những phương pháp hồi quy hiệu quả, được vận dụng nhiều nhất. Đây là mô hình phổ biến trong các bài nghiên cứu mang tính ước lượng, dự đoán về một sự vật, hiện tượng sắp xảy ra. Đặc điểm nổi bật của phương pháp phân tích hồi quy nhị phân chính là các biến phụ thuộc của bài toán chỉ có 2 giá trị là 0 và 1. Đây cũng là lý do tại sao nó được gọi là phương pháp phân tích hồi quy nhị phân.
Trong xã hội ngày nay có nhiều vấn đề, hiện tượng tự nhiên, kinh tế, xã hội, giáo dục, chính trị cần tới dự đoán. Chẳng hạn như các mô hình nghiên cứu về: các chiến dịch quảng cáo có thực sự hiệu quả không; các chương trình vay vốn của ngân hàng có hữu ích không; xu hướng phát triển kinh tế mới là gì; xu hướng mua sắm của khách hàng trong năm tới; … Còn rất nhiều vấn đề nghiên cứu có tính chất tương tự như thế từ nhiều lĩnh vực khác nhau. Và các biến phụ thuộc trong những bài nghiên cứu đó sẽ được biểu hiện, mã hóa thành 2 giá trị là 0 và 1. Các biến đó sẽ được gọi là biến nhị phân.
Người dùng sẽ không thể phân tích các biến phụ thuộc – dạng nhị phân ở các dạng hồi quy bình thường. Vì như thế các giả định sẽ không khả thi và thậm chí là vi phạm, đối lập với các giả định gốc. Thông thường, các bài nghiên cứu theo dạng phân tích hồi quy nhị phân thường sẽ là “có hay không”. Chính vì vậy khi mà các biến phụ thuộc có hai biểu hiện không phù hợp thì ngay lập tức các giả định ban đầu sẽ trở thành sai và bị hủy bỏ. Những giả định của phần dư sẽ không chuẩn. Từ đó, dẫn tới các giá trị, chức năng thống kê, kiểm định, đánh giá của phương pháp phân tích hồi quy nhị phân thông thường bị mất hiệu lực.
Bài viết tham khảo thêm : Phân Tích Khác Biệt Trung Bình Two – Way – Anova
Phương trình phân tích hồi quy nhị phân – Binary Logistic trong SPSS
Trong phần mềm SPSS, phương trình phân tích hồi quy nhị phân sẽ có dạng như sau:
Log( e ) = Pi/ (1 – Pi) = B0 + B1X1 + B2X2 + …. + BnXn
Trong đó, các thành phần mang ý nghĩa:
Pi: Xác suất xảy ra sự kiện. Đây là xác suất có thể xảy ra của vấn đề mà bạn dự đoán ngay từ đầu (vấn đề nghiên cứu).
B0, B1, … Bn: Hệ số hồi quy. Các hệ số hồi quy của từng biến tương ứng.
X0, X1, … Xn: Biến độc lập. Các biến độc lập tương ứng với từng hệ số hồi quy của chúng.
Mục đích của phương pháp phân tích hồi quy nhị phân – Binary Logistic là để tính khả năng dự báo cho một sự vật, hiện tượng trong xã hội. Và phương trình trên là phương trình cụ thể để tính ra được xác suất, phần trăm, khả năng những dự báo đó được thực thi trong tương lai.
Chạy phương trình phân tích hồi quy nhị phân – Binary Logistic trên phần mềm SPSS
Thông qua bài viết chúng tôi muốn chia sẻ thêm cho các bạn nội dung về Tổng Quan Về Phương Pháp Dự Báo Trong Phần Mềm SPSS. Đây cũng là phần tài liệu hữu ích cho các bạn khi phân tích số liệu trên SPSS bạn nhé!!
Ở phần trên, chúng tôi đã trình bày về lý thuyết chung của mô hình hồi quy nhị phân. Dưới đây chúng tôi sẽ tiến hành chạy phân tích hồi quy nhị phân trên phần mềm SPSS để các bạn hiểu rõ hơn về phương pháp này. Trước khi tiến hành chạy phương trình, chúng tôi cần nói với các bạn một lưu ý. Đối với các biến độc lập là biến định tính của từng nhóm yếu tố. Các bạn cần phải mã hóa từng biến định tính để dễ dàng thực hiện phương pháp hồi quy. Sau đây sẽ là các bước cụ thể để thực hiện phương pháp hồi quy nhị phân – Binary Logistic trong SPSS.
Bước 1: các bạn cần phải thực hiện thức tự các thao tác sau: Analyze > Regression > Binary Logistic.
Bước 2: tiến hành đưa các biến phụ thuộc Y vào mục Dependent và đưa các biến độc lập X vào mục Covariates.
Bước 3: Tại mục Options, bạn hãy tích vào hàng Classification plots và tiếp tục chọn Continue để quay lại cửa sổ ban đầu.
Bước 4: Tiếp theo, tại mục Method, chọn Enter. Sau đó ấn OK để chạy phương trình và đưa ra các bảng kết quả khác nhau.
Sau khi phần mềm tiến hành chạy, phân tích dữ liệu thì sẽ xuất hiện các bảng số liệu. Dưới đây chúng tôi sẽ giải tích từng bảng số liệu để các bạn hiểu rõ hơn về vấn đề.
Đầu tiên là bảng Case Processing Summary, tại đây các bạn sẽ thấy được những thông tin chi tiết về từng điểm dữ liệu. Và các điểm dữ liệu này sẽ được đưa vào để phân tích nhị phân. Tức là trong bảng số liệu này chỉ có những dữ liệu đạt yêu cầu để tiến hành phân tích nhị phân. Những dữ liệu không đạt yêu cầu hệ thống sẽ tự loại bỏ và không xuất hiện trong bảng Case Processing Summary.
Tiếp theo là bảng Dependent Variable Encoding, bảng này thể hiện các biến phụ thuộc sẽ được mã hóa theo mẫu nào. Từ đầu chúng tôi đã nói, các biến phụ thuộc được mã hóa thành 2 giá trị là 0 và 1. Thì tại bảng này, các bạn sẽ thấy được biến nào là 0 và biến nào là 1. Thông thường một bài nghiên cứu trong phân tích hồi quy nhị phân sẽ thường có hai biến phụ thuộc chính là “không …” và “có ….”. Ví dụ là “Không tăng trưởng” và “tăng trưởng”. Và trong hồi quy nhị phân, các biến “không …” sẽ là 0 và các biến “có …” sẽ là 1.
Trong phần Block 1, sẽ có một số mô hình, một số bảng kết quả độc lập. Đầu tiên là bảng Omnibus Tests of Model Coefficients. Bảng số liệu này sẽ cho các bạn thấy được kết quả phân tích các hệ số của biến độc lập. Tại dòng Step 1, các bạn có thể thấy được những số liệu được chạy đầu tiên trong mô hình logistic. Đối với từng trường hợp, từng phương pháp cụ thể mà có thể sẽ xuất hiện thêm Step 2, Step 3. Cũng trong bảng số liệu này, tại cột Chi – Square và Sig thể hiện các kết quả kiểm định bình thường. Cụ thể là kiểm định, đánh giá về hệ số hồi quy của các biến độc lập. Xem xét xem các giá trị của các biến đó có bằng 0 hay không. Đối với bảng Omnibus Tests of Model Coefficients, các bạn sẽ tập trung vào các số liệu thuộc ô Sig ở hàng Model. Nhìn và đánh giá số liệu đó với giá trị 0.05. Nếu mà giá trị Sig nhỏ hơn 0.05 thì là mô hình hồi quy phù hợp. Nếu giá trị Sig lớn hơn 0.05 thì mô hình hồi quy là không phù hợp.
Bảng Model Summary, đây là bảng số liệu sẽ tóm tắt cho các bạn kết quả của mô hình. Tại đây các bạn sẽ để ý tới cột -2 LL, để xem những số liệu. Căn cứ vào các số liệu đó tiến hành kiểm định, so sánh giữa các mô hình hồi quy nhị phân với nhau. Nếu các Mô Hình Phân Tích Hồi Quy Nhị Phân có giá trị -2 LL nhỏ hơn thì sẽ tốt hơn. Đây là ý nghĩa lớn nhất của các thông số thuộc cột -2 LL. Các cột Cox & Snell R Square và Nagelkerke R Square thể hiện giá trị bình phương giả của các biến độc lập. Lưu ý trong mô hình hồi quy Logistic không sử dụng những giá trị R bình phương giống với mô hình hồi quy tuyến tính. Các chỉ số trong hai cột này dùng để so sánh những mô hình hồi quy có cùng số liệu, cùng một biến phụ thuộc. Từ đó đánh giá xem mô hình nào tốt hơn, hiệu quả hơn. Nếu giá trị R bình phương giả mà lớn hơn thì sẽ tốt hơn. Bên cạnh đó, còn có thể so sánh bằng cách giá trị bình phương giả mà càng cao thì mô hình đó càng có độ phù hợp cao hơn các mô hình khác.
Bảng Classification Table, bảng này thể hiện sự phân loại các đối tượng với nhau. Cụ thể là phân loại các đối tượng “không …” và “Có …” (như chúng tôi đã đề cập ở phần trên). Đồng thời căn cứ vào các số liệu để tiến hành dự đoán, phân tích khả năng của dự báo ban đầu. Từ các phiếu trả lời, các số liệu phân tích, các bạn có thể tính toán và tổng hợp được phần trăm của các đối tượng. Xem xem đối tương “không” hay đối “có” chiếm nhiều phần trăm hơn. Từ đó đưa ra kết quả cho dự đoán ban đầu.
Bảng Variables in the Equation, đây là bảng số liệu sẽ cung cấp các thông tin chi tiết về phương trình hồi quy cho các bạn. Ở bảng này, chúng ta vẫn sẽ tiếp tục quan tâm tới cột Sig của phương pháp kiểm định Wald đầu tiên trong bảng. Tiến hành so sánh giá trị Sig với 0,05 để xem xem biến nào có tác động lên biến nào, biến nào ảnh hưởng bởi biến nào. Tại cột B, các bạn sẽ thấy được đó là những hệ số hồi quy chưa được chuẩn hóa của các biến độc lập. Những giá trị đó có thể là giá trị âm cũng có thể là giá trị dương. Trong trường hợp hệ số hồi quy chưa được chuẩn hóa (B) mang dấu âm thì đồng nghĩa với việc biến độc lập đó đang tác động tỷ lệ nghicgj với các biến phụ thuộc. Ngược lại, nếu B mà mang dấu dương thì tức là các biến độc lập tác động tỷ lệ thuận với các biến phụ thuộc. Trong Phương Trình Phân Tích Hồi Quy Nhị phân không tồn tại hệ số hồi quy chuẩn hóa. Chính vì thể mà không thể kiểm định, phân tích được thứ tự tác động của các biến độc lập lên các biến phụ thuộc.
Sau khi đánh giá tất cả các dữ liệu ở các bảng kết quả, các bạn đã có thể đưa các số liệu vào phương trình hồi quy nhị phân – Binary Logistic mà chúng tôi đã đưa ra ở phần trên để tính kết quả cuối cùng.
Trên đây là toàn bộ thông tin chúng tôi muốn chia sẻ tới các bạn về phương pháp phân tích hồi quy nhị phân – Binary Logistic. Bài viết đã đưa đến cho các bạn những thông tin tổng quan về mô hình hồi quy nhị phân, phương trình hồi quy nhị phân và cách chạy mô hình hồi quy nhị phân trong SPSS. Chúng tôi cũng triển khai phân tích sâu từng bảng số liệu trong hồi quy nhị phân. Mong rằng bài viết này sẽ giúp các bạn hiểu hơn về phân tích hồi quy nhị phân trong phần mềm SPSS. Chúc các bạn thành công.