Cách Lọc Dữ Liệu Trong Spss, Có Video Hướng Dẫn Cụ Thể

5/5 - (9 bình chọn)

Trong SPSS (Statistical Package for the Social Sciences), lọc dữ liệu được sử dụng để chọn ra các bản ghi (cases) hoặc biến (variables) cụ thể từ tập dữ liệu lớn. Lọc dữ liệu giúp người dùng tập trung vào các thông tin quan trọng hơn và giảm thiểu các nhiễu dữ liệu không cần thiết.

Lọc dữ liệu trong SPSS có thể được thực hiện bằng cách sử dụng lệnh “Select Cases”. Lệnh này cho phép người dùng chỉ định một hoặc nhiều điều kiện để lọc dữ liệu. Chẳng hạn, người dùng có thể chỉ định để lọc dữ liệu từ một nhóm người dùng cụ thể hoặc từ một khoảng thời gian nhất định.

Nếu các bạn muốn tiết kiệm tối ưu thời gian của mình hoặc các bạn khó khăn khi sử dụng các phương pháp phân tích xử lý dữ liệu cho các bạn nghiên cứu. luận văn tốt nghiệp … thì hãy tham khảo dịch vụ chạy SPSS thuê của Luận Văn Tốt, bạn có thể trao đổi trực tiếp qua sđt/zalo/tele : 0934573149 để được tư vấn và báo giá bạn nhé.

Dùng bảng tần số

Dùng bảng tần số
Dùng bảng tần số

Bảng tần số (frequency table) là một công cụ quan trọng trong phân tích dữ liệu. Nó cho phép người dùng đếm số lần xuất hiện của các giá trị riêng lẻ hoặc các nhóm trong tập dữ liệu. Bảng tần số cung cấp cho người dùng cái nhìn tổng quan về phân bố của các giá trị trong tập dữ liệu và giúp họ dễ dàng tìm ra các xu hướng hoặc mẫu chính trong dữ liệu.

Để tạo bảng tần số trong SPSS, người dùng cần chọn biến cần phân tích và chọn phương thức tính toán bảng tần số trong menu. Khi bảng tần số được tạo, nó sẽ hiển thị số lần xuất hiện của từng giá trị riêng lẻ hoặc nhóm của biến.

Bảng tần số có thể được sử dụng để trả lời một số câu hỏi về dữ liệu, chẳng hạn như:

  • Có bao nhiêu đối tượng được khảo sát trong tập dữ liệu?
  • Phân bố của giới tính như thế nào trong tập dữ liệu?
  • Các giá trị của biến số đó phân bố ra sao trong tập dữ liệu?

Bảng tần số có thể được mở rộng để bao gồm các thông tin khác như phần trăm và số tổng hợp, giúp người dùng dễ dàng hiểu hơn về phân bố của dữ liệu. Bảng tần số cũng có thể được sử dụng để tạo biểu đồ như biểu đồ cột hoặc biểu đồ tròn để trực quan hóa dữ liệu.

Hướng dẫn cụ thể các bước Dùng bảng tần số

Để tạo bảng tần số trong SPSS, làm theo các bước sau:

  1. Mở tập tin dữ liệu trong SPSS và chọn biến cần phân tích trong danh sách biến.
  2. Chọn “Analyze” từ thanh công cụ chính, sau đó chọn “Descriptive Statistics” và chọn “Frequencies”.
  3. Di chuyển biến cần phân tích vào ô “Variables” bằng cách nhấp vào nút mũi tên bên trái, hoặc kéo và thả biến từ danh sách biến vào ô “Variables”.
  4. Chọn các tùy chọn phù hợp để tính toán bảng tần số. Các tùy chọn này bao gồm tính toán phần trăm, giá trị tổng hợp, hiển thị giá trị trung bình, độ lệch chuẩn và giá trị tối đa/tối thiểu.
  5. Nhấn nút “OK” để tạo bảng tần số.
  6. Bảng tần số sẽ xuất hiện trên màn hình. Người dùng có thể lưu kết quả bằng cách chọn “File” và sau đó chọn “Save As”.

Ngoài ra, người dùng có thể trực quan hóa bảng tần số bằng cách tạo biểu đồ, chẳng hạn như biểu đồ cột hoặc biểu đồ tròn. Để tạo biểu đồ, chọn “Graphs” từ thanh công cụ chính, sau đó chọn loại biểu đồ phù hợp và kéo và thả biến từ bảng tần số vào biểu đồ. Chọn các tùy chọn phù hợp để tùy chỉnh biểu đồ và nhấn nút “OK” để tạo biểu đồ.

Bài viết tham khảo : Một Số Thuật Ngữ Của Spss

Bài viết tham khảo : Hồi Quy Với Biến Độc Lập Định Tính 

Dùng Bảng Kết Hợp

Dùng Bảng Kết Hợp
Dùng Bảng Kết Hợp

Bảng kết hợp (cross-tabulation table) là một công cụ phân tích dữ liệu được sử dụng để tìm mối quan hệ giữa hai biến. Nó cho phép người dùng đếm số lần xuất hiện của các giá trị đồng thời của hai biến và tạo ra một bảng dữ liệu hai chiều.

Bảng kết hợp cho phép người dùng tìm ra các mẫu và xu hướng trong dữ liệu bằng cách so sánh số lượng xuất hiện của các giá trị đồng thời của hai biến. Nó cũng có thể được sử dụng để kiểm tra các giả thuyết về mối quan hệ giữa hai biến và đưa ra kết luận dựa trên kết quả.

Để tạo bảng kết hợp trong SPSS, người dùng cần chọn hai biến cần phân tích và chọn phương thức tính toán bảng kết hợp trong menu. Khi bảng kết hợp được tạo, nó sẽ hiển thị số lần xuất hiện của từng giá trị đồng thời của hai biến.

Bảng kết hợp có thể được sử dụng để trả lời một số câu hỏi về dữ liệu, chẳng hạn như:

  • Có mối quan hệ giữa hai biến trong tập dữ liệu không?
  • Phân bố của một biến khác nhau giữa các giá trị của biến khác như thế nào trong tập dữ liệu?
  • Liên quan giữa giới tính và sở thích thể thao như thế nào trong tập dữ liệu?

Bảng kết hợp cũng có thể được sử dụng để tạo biểu đồ như biểu đồ cột, biểu đồ dòng hoặc biểu đồ phân phối tần suất để trực quan hóa dữ liệu.

Dưới đây là các bước để tạo bảng kết hợp trong SPSS:

  1. Mở tập tin dữ liệu trong SPSS và chọn hai biến cần phân tích.
  2. Chọn “Analyze” từ thanh công cụ chính, sau đó chọn “Descriptive Statistics” và chọn “Crosstabs”.
  3. Di chuyển biến cần phân tích vào ô “Row” hoặc “Column” bằng cách kéo và thả từ danh sách biến.
  4. Chọn các tùy chọn phù hợp để tính toán bảng kết hợp, bao gồm tính toán phần trăm, giá trị tổng hợp và hiển thị giá trị trung bình.
  5. Nhấn nút “OK” để tạo bảng

Kết quả bảng kết hợp sẽ hiển thị trong một bảng hai chiều với số lượng và phần trăm xuất hiện của các giá trị đồng thời của hai biến. Người dùng có thể sử dụng các tùy chọn trong menu “Table” để tạo biểu đồ hoặc hiển thị thêm thông tin về bảng kết hợp.

  1. Nếu người dùng muốn kiểm tra mức độ liên quan giữa hai biến, họ có thể sử dụng các thống kê như chi-square test hoặc phi-coefficient, được cung cấp trong tab “Statistics” trong menu Crosstabs.
  2. Người dùng có thể sao chép bảng kết hợp vào tài liệu khác bằng cách chọn nút “Copy” hoặc “Export” trong menu “File”.

Lưu ý rằng bảng kết hợp chỉ thể hiện mối quan hệ giữa hai biến cụ thể được phân tích và không đại diện cho toàn bộ dữ liệu. Việc phân tích thêm nhiều biến có thể cung cấp thêm thông tin và đưa ra kết luận tốt hơn về tập dữ liệu.

Quy Trình Lọc Dữ Liệu Trong Spss

Quy Trình Lọc Dữ Liệu Trong Spss
Quy Trình Lọc Dữ Liệu Trong Spss

Quy trình lọc dữ liệu trong SPSS có thể được thực hiện bằng các bước sau:

  1. Mở tập tin dữ liệu trong SPSS bằng cách chọn “File” và sau đó chọn “Open”.
  2. Chọn biến hoặc các biến cần lọc dữ liệu bằng cách sử dụng thanh chọn biến ở phía bên trái màn hình.
  3. Chọn “Data” và sau đó chọn “Select Cases”.
  4. Chọn “If condition is satisfied” và sau đó nhập điều kiện để lọc dữ liệu vào ô trống bên dưới. Ví dụ, nếu bạn muốn lọc dữ liệu để chỉ bao gồm các mục trong biến “age” từ 18 đến 40, bạn có thể nhập “age >= 18 and age <= 40”.
  5. Chọn “Continue” và sau đó chọn “OK”.
  6. Dữ liệu đã được lọc và chỉ hiển thị các giá trị thỏa mãn điều kiện bạn đã nhập.
  7. Nếu bạn muốn lưu các dữ liệu đã được lọc, chọn “File” và sau đó chọn “Save As” để lưu tập tin dữ liệu mới.

Lưu ý rằng quá trình lọc dữ liệu không xóa dữ liệu gốc mà chỉ tạo ra một phiên bản mới của tập tin dữ liệu chỉ bao gồm các dòng thỏa mãn điều kiện đã nhập. Do đó, hãy chắc chắn lưu tập tin mới nếu bạn muốn giữ các thay đổi này.

Ví Dụ Chi Tiết Về Lọc Dữ Liệu Trong Spss

Ví dụ sau sẽ minh họa quy trình lọc dữ liệu trong SPSS.

Giả sử bạn đang làm việc với một tập tin dữ liệu về khảo sát ý kiến của khách hàng về một sản phẩm mới. Tập tin dữ liệu bao gồm các biến sau: “age” (tuổi), “gender” (giới tính), “income” (thu nhập), “satisfaction” (sự hài lòng với sản phẩm), và “purchase” (việc mua sản phẩm).

Bạn muốn lọc dữ liệu chỉ để bao gồm các bản ghi của khách hàng nữ và có thu nhập từ 20.000 đô la trở lên.

Bước 1: Mở tập tin dữ liệu trong SPSS bằng cách chọn “File” và sau đó chọn “Open”.

Bước 2: Chọn các biến “gender” và “income” bằng cách sử dụng thanh chọn biến ở phía bên trái màn hình.

Bước 3: Chọn “Data” và sau đó chọn “Select Cases”.

Bước 4: Chọn “If condition is satisfied” và sau đó nhập điều kiện để lọc dữ liệu vào ô trống bên dưới. Trong ví dụ này, bạn sẽ nhập “gender = ‘Female’ and income >= 20000”.

Bước 5: Chọn “Continue” và sau đó chọn “OK”.

Bước 6: Dữ liệu đã được lọc và chỉ hiển thị các giá trị thỏa mãn điều kiện bạn đã nhập.

Bước 7: Nếu bạn muốn lưu các dữ liệu đã được lọc, chọn “File” và sau đó chọn “Save As” để lưu tập tin dữ liệu mới.

Lưu ý rằng quá trình lọc dữ liệu này sẽ chỉ hiển thị các bản ghi của khách hàng nữ và có thu nhập từ 20.000 đô la trở lên. Các bản ghi khác sẽ không bị xóa khỏi tập tin gốc, mà chỉ bị loại bỏ khỏi phiên bản mới của tập tin dữ liệu. Nếu bạn muốn xóa các bản ghi này khỏi tập tin gốc, bạn có thể sử dụng tùy chọn “Delete Cases” thay vì “Select Cases” trong SPSS.

Chức năng lựa chọn dữ liệu select cases , cách lựa chọn dữ liệu thỏa điều kiện để chạy SPSS

Đặt vấn đề

Giả sử bạn có file spss có 200 người trả lời, giờ bạn cần lọc ra một số ít người trong 200 người đó thỏa một điều kiện cho trước  nào đó, thì sẽ làm như thế nào? Giải pháp là dùng chức năng select cases nhé

Phân bổ tần số GIỚI TÍNH và ĐỘ TUỔI như bên dưới

Giờ bạn chỉ muốn chạy thống kê tần số về ĐỘ TUỔI  trên những người có giới tính Nam, còn giới tính Nữ không chạy( ở đây mình chọn Nam, không chọn Nữ dể ví dụ thôi, chứ không phải phân biệt giới tính nha) . Vậy các xử lý như thế  nào?

Có 2 cách xử lý:

1. Xóa những dòng có giới tính là Nữ bên excel hoặc SPSS, sau đó chạy thống kê

2. Dùng menu select case như bên dưới đây, lúc đó không cần xóa dữ liệu. Nhưng vẫn chọn được dữ liệu cần thiết

Cách thực hiện select cases trên SPSS

Bước 1: vào menu Data – Select Cases

Bước 2: chọn mục If condition is satisfied, nhấn nút If như hình dưới

hình

Bước 3: trong hộp điều kiện, nhập vào giá trị GIOITINH=1 , xong bấm continue, và bấm OK

( Do quy định giới tính là 1,2 tương ứng với Nam,Nữ)

Như vậy là đã chọn những quan sát thỏa điều kiện xong, để xem kết quả , ta quay lại file dữ liệu và nhận thấy có một số dòng không thoản điều kiện đã bị gạch chéo như hình dưới. Lúc đó SPSS hiểu là khi chạy thống kê sẽ không sử dụng những dòng này.

 

hinh 3

Ta thực hiện chạy thống kê tần số lại, kết quả cho thấy mục GIỚI TÍNH chỉ còn 86 người Nam, và tương ứng với ĐỘ TUỔI có 63 người có độ tuổi < 25 tuổi, và 23 người có độ tuổi từ 25 đến 35 tuổi.

Như vậy ta đã dùng chức năng select cases để lựa chọn những dữ liệu cần thiết để thực hiện việc thống kê. Lưu ý là các bạn nhớ bỏ chọn select case bằng cách chọn lại tất cả các cases(Vào menu Data – Select Cases- Chọn All cases – xong bấm OK) khi không có nhu cầu sử dụng lọc dữ liệu, hoặc đơn giản nhất là tắt file spss mở lại là dữ liệu sẽ được chọn tất cả như ban đầu nhé

Ví Dụ Lọc Trên 2 Biến

Ví dụ sau sẽ minh họa cách lọc dữ liệu trên 2 biến trong SPSS.

Giả sử bạn đang làm việc với một tập tin dữ liệu về độ tuổi và mức thu nhập của nhân viên trong một công ty. Tập tin dữ liệu bao gồm các biến sau: “age” (tuổi) và “income” (thu nhập).

Bạn muốn lọc dữ liệu chỉ để bao gồm các bản ghi của nhân viên có tuổi từ 30 đến 50 và thu nhập từ 20.000 đô la trở lên.

Bước 1: Mở tập tin dữ liệu trong SPSS bằng cách chọn “File” và sau đó chọn “Open”.

Bước 2: Chọn các biến “age” và “income” bằng cách sử dụng thanh chọn biến ở phía bên trái màn hình.

Bước 3: Chọn “Data” và sau đó chọn “Select Cases”.

Bước 4: Chọn “If condition is satisfied” và sau đó nhập điều kiện để lọc dữ liệu vào ô trống bên dưới. Trong ví dụ này, bạn sẽ nhập “age >= 30 and age <= 50 and income >= 20000”.

Bước 5: Chọn “Continue” và sau đó chọn “OK”.

Bước 6: Dữ liệu đã được lọc và chỉ hiển thị các giá trị thỏa mãn điều kiện bạn đã nhập.

Bước 7: Nếu bạn muốn lưu các dữ liệu đã được lọc, chọn “File” và sau đó chọn “Save As” để lưu tập tin dữ liệu mới.

Lưu ý rằng quá trình lọc dữ liệu này sẽ chỉ hiển thị các bản ghi của nhân viên có tuổi từ 30 đến 50 và thu nhập từ 20.000 đô la trở lên. Các bản ghi khác sẽ không bị xóa khỏi tập tin gốc, mà chỉ bị loại bỏ khỏi phiên bản mới của tập tin dữ liệu. Nếu bạn muốn xóa các bản ghi này khỏi tập tin gốc, bạn có thể sử dụng tùy chọn “Delete Cases” thay vì “Select Cases” trong SPSS.

Ví Dụ Bộ Lọc Không Có Biến Bộ Lọc

Ví dụ sau đây sẽ minh họa cách sử dụng bộ lọc không có biến bộ lọc trong SPSS:

Giả sử bạn đang làm việc với một tập tin dữ liệu về điểm số của sinh viên trong một lớp học. Tập tin dữ liệu bao gồm các biến sau: “name” (tên), “gender” (giới tính), “age” (tuổi) và “score” (điểm số).

Bạn muốn lọc dữ liệu để chỉ bao gồm các bản ghi của sinh viên có điểm số trên trung bình.

Bước 1: Mở tập tin dữ liệu trong SPSS bằng cách chọn “File” và sau đó chọn “Open”.

Bước 2: Chọn các biến “name”, “gender”, “age” và “score” bằng cách sử dụng thanh chọn biến ở phía bên trái màn hình.

Bước 3: Chọn “Data” và sau đó chọn “Select Cases”.

Bước 4: Chọn “If condition is satisfied” và sau đó nhập điều kiện để lọc dữ liệu vào ô trống bên dưới. Trong ví dụ này, bạn sẽ nhập “score > mean(score)”.

Bước 5: Chọn “Continue” và sau đó chọn “OK”.

Bước 6: Dữ liệu đã được lọc và chỉ hiển thị các giá trị thỏa mãn điều kiện bạn đã nhập. Trong trường hợp này, chỉ hiển thị các bản ghi của sinh viên có điểm số cao hơn điểm số trung bình của toàn bộ lớp.

Bước 7: Nếu bạn muốn lưu các dữ liệu đã được lọc, chọn “File” và sau đó chọn “Save As” để lưu tập tin dữ liệu mới.

Lưu ý rằng bộ lọc này không sử dụng biến bộ lọc để lọc dữ liệu. Thay vào đó, nó sử dụng một điều kiện để lọc dữ liệu. Trong ví dụ này, điều kiện là điểm số của sinh viên phải lớn hơn điểm số trung bình của toàn bộ lớp.

Việc xử lý các dữ liệu trên SPSS trong luận văn hay các công trình nghiên cứu, thì không phải bạn nào cũng biết cách và kinh nghiệm để làm. Nên thông qua nội dung được chia sẻ thì Luận Văn Tốt muốn Hướng Dẫn Tải Phần Mềm Spss Nhanh Chóng để hỗ trợ các bạn thêm trong quá trình làm bài bạn nhé!!

Ví Dụ Lọc Bằng Select Case Trong Spss

Dưới đây là một ví dụ về cách sử dụng tính năng Select Cases trong SPSS để lọc dữ liệu:

Giả sử bạn đang nghiên cứu về tác động của việc uống cà phê đến sự tập trung trong công việc. Bộ dữ liệu của bạn bao gồm một biến liên tục “caffeine” đo lượng caffeine đã tiêu thụ mỗi ngày (đơn vị là mg), và một biến nhị phân “focused” để chỉ ra liệu người đó có tập trung trong công việc hay không (1 nếu tập trung và 0 nếu không tập trung).

Bạn muốn lọc dữ liệu để chỉ bao gồm các bản ghi của những người đã uống ít nhất 200 mg caffeine mỗi ngày.

Bước 1: Mở tập tin dữ liệu trong SPSS bằng cách chọn “File” và sau đó chọn “Open”.

Bước 2: Chọn các biến “caffeine” và “focused” bằng cách sử dụng thanh chọn biến ở phía bên trái màn hình.

Bước 3: Chọn “Data” và sau đó chọn “Select Cases”.

Bước 4: Chọn “If condition is satisfied” và sau đó nhập điều kiện để lọc dữ liệu vào ô trống bên dưới. Trong ví dụ này, bạn sẽ nhập “caffeine >= 200”.

Bước 5: Chọn “Continue” và sau đó chọn “OK”.

Bước 6: Dữ liệu đã được lọc và chỉ hiển thị các giá trị thỏa mãn điều kiện bạn đã nhập. Trong trường hợp này, chỉ hiển thị các bản ghi của những người đã uống ít nhất 200 mg caffeine mỗi ngày.

Bước 7: Nếu bạn muốn lưu các dữ liệu đã được lọc, chọn “File” và sau đó chọn “Save As” để lưu tập tin dữ liệu mới.

Lưu ý rằng tính năng Select Cases cho phép bạn lọc dữ liệu bằng cách chỉ định một điều kiện. Trong ví dụ này, điều kiện là “caffeine >= 200”. Bất kỳ bản ghi nào có giá trị “caffeine” nhỏ hơn 200 sẽ bị loại bỏ khỏi tập dữ liệu.

Các Lưu Ý Khi Chỉnh Sửa Dữ Liệu Bằng Bộ Lọc

Khi chỉnh sửa dữ liệu bằng bộ lọc trong SPSS, bạn cần lưu ý những điều sau đây:

  1. Thực hiện sao lưu dữ liệu gốc: Trước khi sử dụng bộ lọc để chỉnh sửa dữ liệu, nên sao lưu bản gốc để đảm bảo an toàn cho dữ liệu.
  2. Kiểm tra kết quả lọc: Sau khi áp dụng bộ lọc, nên kiểm tra kết quả lọc để đảm bảo rằng chỉ các bản ghi thỏa mãn điều kiện của bộ lọc được hiển thị.
  3. Cẩn thận khi xóa bản ghi: Khi sử dụng bộ lọc để loại bỏ bản ghi, bạn cần cẩn thận để đảm bảo rằng các bản ghi không cần thiết đã được loại bỏ. Nếu xóa sai bản ghi có thể dẫn đến sai sót trong phân tích và đánh giá kết quả.
  4. Chỉnh sửa dữ liệu cẩn thận: Khi sử dụng bộ lọc để chỉnh sửa dữ liệu, bạn cần cẩn thận để đảm bảo rằng chỉnh sửa dữ liệu đúng và không làm sai lệch kết quả.
  5. Lưu tập tin dữ liệu mới: Sau khi sử dụng bộ lọc để chỉnh sửa dữ liệu, nên lưu tập tin dữ liệu mới để không ghi đè lên tập tin gốc và đảm bảo an toàn cho dữ liệu.
  6. Lưu ý khi sử dụng bộ lọc nhiều lần: Khi sử dụng bộ lọc nhiều lần để chỉnh sửa dữ liệu, bạn cần chú ý để đảm bảo rằng các điều kiện của bộ lọc không trùng lặp và không bị mâu thuẫn với nhau.
  7. Tối ưu hóa hiệu suất tính toán: Khi sử dụng bộ lọc để chỉnh sửa dữ liệu, nên tối ưu hóa hiệu suất tính toán để đảm bảo rằng quá trình chỉnh sửa dữ liệu diễn ra nhanh chóng và không ảnh hưởng đến hoạt động của phần mềm.

Video hướng Cách Lọc Dữ Liệu Trong Spss dẫn bổ dung

copy libk video này vào, nó sẽ hiện video  bổ sung cho bài có video

Các điều kiện lọc dữ liệu trong SPSS được đặt trong cửa sổ “Select Cases” và có thể được xác định bằng cách sử dụng các toán tử so sánh và các hàm logic, chẳng hạn như “=”, “<“, “>”, “AND” và “OR”. Khi lọc dữ liệu được áp dụng, chỉ các bản ghi hoặc biến phù hợp với các điều kiện được đặt sẽ được hiển thị trong SPSS.

5 1 đánh giá
Article Rating
Theo dõi
Thông báo của
guest
0 Comments
Phản hồi nội tuyến
Xem tất cả bình luận
0
Rất thích suy nghĩ của bạn, hãy bình luận.x
Liên hệ