NGUYỄN VĂN CANG Tham gia nhóm HI DUE Z để nhận được nhiều tài liệu Kinh Tế bổ ích nhé :3 Nguyễn Văn Cang 1 Xử lý dữ liệu trên SPSS 1. Nhập liệu 1.1. Chuẩn bị dữ liệu Dữ liệu chéo là dữ liệu phổ biến nhất dùng trong SPSS. Dạng tổng quát của dữ liệu chéo như sau: Đơn vị tổng thể 1 2 3 … n Tiêu thức 1 Tiêu thức 2 x11 x21 x31 x12 x22 x32 … Tiêu thức k x1k x2k x3k … … … xn1 xn2 xnk Trong bảng trên, dữ liệu của một đơn vị tổng thể được thể hiện trên một dòng. Ví dụ: Có dữ liệu mẫu về 18 đơn thư khiếu nại của khách hàng được chọn ngẫu nhiên. Số Giới Gía trị Số ngày thứ Tuổi tính Nơi sản Ngày của bảo tự khách của mua phẩm mua hành đơn hàng khách còn lại (tr.đ) thư hàng 1 72 22 Nữ A 2,5 20/10/06 2 04/06/05 24 26 Nam B 1,8 3 37 10/02/07 25 Nam A 12,5 4 13 24/08/05 27 Nữ B 4,5 5 12/04/05 58 26 B 2,8 Nữ Nữ 6 64 16/05/07 26 D 6,4 Nam 22/08/06 7 45 25 F 10,2 Nữ 05/02/05 8 81 27 A 3,5 Nam 18/06/06 9 69 26 C 6,8 Nữ 04/8/06 10 21 48 C 5,5 Nam 02/04/07 11 12 26 A 4,7 Nam 08/06/07 12 48 25 A 8,2 Nam 15/03/07 13 57 26 C 9,1 Nữ 24/02/07 14 92 25 B 7,4 Nam 27/05/07 15 102 60 A 5,8 Nữ 15/01/07 16 34 27 B 4,4 Nữ 22/04/07 17 68 26 B 9,7 Nam 25/12/06 18 39 27 C 2,6 Kí hiệu: B.T: Bồi thường Nguyễn Văn Cang 2 Loại sự cố Kêu Bể Rỉ Nứt Cháy Hỏng Kêu Nứt Hỏng Rỉ Bể Kêu Rỉ Bể Cháy Nứt Bể Kêu Yêu cầu của khách hàng B.T Đổi Đổi B.T B.T B.T Sửa Đổi B.T Đổi Sửa Đổi Sửa B.T Sửa B.T B.T Sửa Xử lý dữ liệu trên SPSS 1.2. Khai báo nhập liệu Kích hoạt biểu tượng SPSS trên Desktop hay Start Program SPSS. Ta được màn hình gốc như sau: Bấm chọn Data View để chuyển qua màn hình nhập liệu Bấm chọn Variable View để chuyển qua màn hình khai báo nhập liệu Ta phải khai báo khuôn mẫu của dữ liệu trước khi nhập. + Chọn Variable View ở đáy màn hình để chuyển qua màn hình khai báo nhập liệu như ở trang sau. + Khai báo lần lượt từng tiêu thức, mỗi tiêu thức một dòng (trên máy gọi là một variable). Trong đó: * Name: Đánh vào tên rút gọn của tiêu thức (tối đa 8 ký tự không có ký tự đặc biệt). Tên này sẽ được hiển thị ở đầu vào và sử dụng trong quá trình xử lý trên máy cho tiện. * Type: Chọn kiểu dữ liệu cho tiêu thức như số, chuổi, ngày… * Width: Xác định độ rộng (ký tự) cho dữ liệu. Nguyễn Văn Cang 3 Xử lý dữ liệu trên SPSS Nhập giá trị mã hóa Nhập giá trị gốc Nút chuyển từng giá trị đã mã hóa vào ô kết quả bên cạnh Nhập giá trị mã hóa Missing Nguyễn Văn Cang 4 Xử lý dữ liệu trên SPSS * Decimals: Số chữ số thập phân của kiểu dữ liệu số. * Label: Khai báo tên gốc của tiêu thức. Tên này dài hơn Name ở trên cho dể nhận diện ở dữ liệu đầu ra. * Values: Nếu nhập đầy đủ giá trị gốc thì chọn None. Với các tiêu thức định tính (thuộc tính), để nhập liệu nhanh chóng, người ta thường mã hóa các giá trị của tiêu thức bằng các số nguyên. Ví dụ, tiêu thức ‘Yêu cầu của khách hàng’ được mã hóa như sau: Giá trị gốc (Value Label) - Bồi thường - Đổi - Sửa Giá trị mã hóa (Value) 1 2 3 Ta khai báo từng Value và Value Label tương ứng rồi chọn add đưa vào ô chứa. Chọn OK để kết thúc khai báo. * Missing: Khai báo giá trị mã hóa đặc biệt cho những giá trị bị khuyết (không có số liệu) nếu có của tiêu thức. Nên chọn những giá trị không có thực nhưng đúng kiểu dữ liệu đã khai báo cho tiêu thức đó. Chẳng hạn, với tiêu thức ‘Tuổi’, -1 nghĩa là không thu thập được, -2 nghĩa là chờ bổ sung. Tất cả các giá trị có mã khai báo ở ô này sẽ không tham gia vào quá trình xử lý dữ liệu của máy. Nếu chọn mặc định None thì khi có giá trị bị khuyết (nhập liệu cho tiêu thức khác ở đơn vị tổng thể nào đó mà không nhập cho tiêu thức có mặc định none) máy sẽ gán dấu phẩy hệ thống. Đây là mã system missing và nó cũng không tham gia vào quá trình xử lý dữ liệu của máy. * Column: Khai báo độ rộng cho cột nhập dữ liệu. * Align: Chọn định vị trái, giữa hay phải cho cột dữ liệu. * Measure: Chọn loại thang đo dữ liệu của tiêu thức: danh định (Nominal), thứ bậc (Ordinal) và khoảng cách hay tỉ lệ (Scale). + Sau khi khai báo xong tất cả các tiêu thức, nếu chưa muốn nhập liệu ngay, ta vào File Save as để lưu. Nếu muốn nhập liệu ngay, bấm chọn Data View ở đáy màn hình để chuyển qua màn hình nhập liệu: Nguyễn Văn Cang 5 Xử lý dữ liệu trên SPSS Bấm chọn nút này để nhập các giá trị mã hóa Bấm chọn ô này để chuyển qua màn hình nhập liệu Trên màn hình này, ta nhập dữ liệu của một đơn vị tổng thể trên một dòng màn hình. Nhập dần dần cho đến đơn vị tổng thể cuối cùng. Vào File Save as để lưu dữ liệu. 1.3. Nhập liệu 1.3.1. Mã hóa dữ liệu định tính: Để việc nhập liệu được nhanh chóng và chính xác, dữ liệu của các tiêu thức thuộc tính cần được mã hóa. Mỗi biểu hiện của tiêu thức (biến) được mã hóa bằng một con số duy nhất. Các con số mã hóa thường được dùng nhất là 0, 1, 2, …, 8, 9. Ví dụ: Xin cho biết anh chị thuộc nghề nghiệp nào sau đây: □ Công chức Được mã hóa là 1 □ Doanh nhân Được mã hóa là 2 □ Công nhân Được mã hóa là 3 □ Nông dân Được mã hóa là 4 □ Nghề khác Được mã hóa là 5 Việc mã hóa cần được tiến hành tập trung, do một số ít người phụ trách để tránh sự thiếu thống nhất. Trật tự các cột biến cần được nhập theo đúng trật tự các câu hỏi trong bản câu hỏi. Trật tự các dòng dữ liệu, mỗi dòng tương ứng với một bản câu hỏi điều tra, cần được nhập theo đúng trật tự các bản câu hỏi điều tra để tiện việc tìm kiếm, tra cứu khi cần. Nguyễn Văn Cang 6 Xử lý dữ liệu trên SPSS 1.3.2. Nhập liệu với câu hỏi có thể chọn nhiều trả lời: Mỗi mục chọn của câu hỏi cần được nhập thành một biến phụ có dạng biến thay phiên 9 (hay biến đếm có hai giá trị 1 và 0). Để máy tính có thể đếm được trong quá trình xử lý, biến phụ này phải được khai báo là biến số (định lượng). Nó thường được mã hóa giá trị “1” tương ứng với mục đó được chọn, giá trị “0” tương ứng với mục đó không được chọn. Ví dụ: Câu 12. Bạn đã dùng loại bút bi nào sau đây (chọn một hoặc nhiều): □ Bến nghé Được nhập theo biến có tên c12c1 □ Thiên long Được nhập theo biến có tên c12c2 □ Loại khác Được nhập theo biến có tên c12c3 Câu hỏi trên được nhập thành ba biến phụ định lượng dạng thay phiên. Biến c12c1 có giá trị “1” tương ứng với Bến nghé được chọn, giá trị “0” tương ứng với Bến nghé không được chọn. Biến c12c2 có giá trị “1” tương ứng với Thiên long được chọn, giá trị “0” tương ứng với Thiên long không được chọn. Biến c12c3 có giá trị “1” tương ứng với Loại khác được chọn, giá trị “0” tương ứng với Loại khác không được chọn. Mỗi biến phụ nói trên có thể được sử dụng để phân tích như một biến bình thường. Tuy nhiên chúng thường được ghép thành biến ghép cho câu hỏi chính của chúng. 2. Tạo biến mới từ biến đã có 2.1. Sử dụng Compute Ví dụ, ta cần thiết lập biến mới có tên ‘lngtsp’ bằng cách lấy logarit cơ số tự nhiên của biến có tên ‘gtsp’ đã có. Bấm chọn Transform Compute. Ta có cửa sổ: Chọn biến cũ để tính biến mới Nguyễn Văn Cang Chọn hàm hổ trợ 7 Xử lý dữ liệu trên SPSS + Trong ô Target variable: Khai báo tên rút gọn của biến mới (Name); + Trong ô Type&Lable: Khai báo kiểu dữ liệu (Type) và nhãn của biến mới (Lable). + Trong ô Numeric Expression: Khai báo biểu thức tính giá trị biến mới từ các biến cũ. + Nếu cần lọc dữ liệu, chọn ô If bên dưới để khai báo các điều kiện lọc. Chọn OK để có kết quả của biến mới. Chú ý: Các giá trị Missing của biến cũ sẽ được tự động gán giá trị khuyết hệ thống System Missing (dấu phẩy hệ thống) cho biến mới. 2.2. Sử dụng Recode Into different variables. Bấm chọn Transform Recode Into different variables. Nhập tên, nhãn biến mới Chọn Change để khẳng định tên, nhãn biến mới Chọn biến cũ cần chuyển đổi Sau khi khai báo như hình trên, bấm chọn ô Old and New Values để khai báo các chuyển đổi từ biến cũ sang biến mới. Ví dụ, ta cần phân tổ tiêu thức ‘Tuổi’ thành 3 tổ: dưới 30, từ 30 đến 40, 40 trở lên. Ta khai báo như sau, ưu tiên tổ có giá trị cao khai báo trước: Old Value 40 through highest 30 through 40 Lowest through 30 New Value 3 2 1 + Trong ô Old value, chọn lựa khai báo từng tổ theo biến cũ. Trong ô New value khai báo ‘giá trị mã hóa của tổ’ tương ứng với tổ đã khai báo ở Old value, như hướng dẫn trong hình ở trang sau: + Chú ý: Việc khai báo phải được tiến hành dần từng tổ và phải được xác nhận bằng nút Add, một lần cho một tổ; khai báo trước sẽ ưu tiên nhận giá trị mới trước. + Để sửa một khai báo trong ô Old New: Chọn dòng muốn sửa trong ô này rồi chọn ô Change; + Để gở bỏ một khai báo trong ô Old New: Chọn dòng muốn gở bỏ trong ô này rồi chọn ô Remove; Nguyễn Văn Cang 8 Xử lý dữ liệu trên SPSS + Chọn Continue để quay lại, chọn OK để kết thúc. Mã của tổ tương ứng Tổ chỉ gồm một giá trị TổMissing có giới hạn Missing dưới và trên Tổ chỉ có giới hạn trên Xác nhận từng tổ Tổ chỉ có giới hạn dưới Tổ gồm tất cả các giá trị còn lại Chọn kiểu dữ liệu định danh cho tổ 3. Thống kê mô tả 3.1. Sắp xếp các đơn vị tổng thể theo một tiêu thức nào đó Bấm chọn Data Sort case. Chọn tiêu thức cần sắp xếp Chọn tiêu thức muốn sắp xếp đưa vào ô Sort by. Chọn OK. 3.2. Mô tả thống kê theo một tiêu thức Bấm chọn Analyze Descriptive Statistic Frequency. Nguyễn Văn Cang 9 Xử lý dữ liệu trên SPSS Chọn các thống kê Chọn tiêu thức cần mô tả Chọn biểu đồ Bảng phân phối tần số Khi bấm chọn ô Statistics ta có cửa sổ sau: Tứ phân vị Độ lệch chuẩn đã hiệu chỉnh ̂ Quay lại Phương sai đã hiệu chỉnh ˆ 2 Khi bấm chọn ô Charts ta có cửa sổ sau: Chọn phân phối đồ Quay lại Nguyễn Văn Cang 10 Xử lý dữ liệu trên SPSS Màn hình kết quả như sau: Bấm chọn mục cần xem Bấm chọn ô này để trở lại màn hình kết quả Bấm chọn ô này để trở lại màn hình dữ liệu Chú ý: Dữ liệu định tính không mô tả được bằng các số đo thống kê mô tả (statistics) dù được mã hóa bằng các con số. 3.3. Mô tả một tiêu thức định lượng bằng biểu đồ cành và lá, hộp với ria, phân phối đồ Bấm chọn Analyze Descriptive Statistic Explore. Tiêu thức cần mô tả Tiêu thức phân nhóm tiêu thức cần mô tả ở trên (nếu cần) Chọn loại biểu đồ Nguyễn Văn Cang 11 Xử lý dữ liệu trên SPSS Chọn đưa tiêu thức định lượng cần mô tả vào ô Dependent Lit. Nếu cần mô tả tiêu thức này theo các phân nhóm khác nhau thì chọn đưa tiêu thức phân nhóm vào ô Factor List. Bấm chọn loại biểu đồ mong muốn trong ô Plots. Sau đó chọn OK. 3.4. Mô tả thống kê theo hai (hay nhiều) tiêu thức kết hợp Bấm chọn Analyze Descriptive Statistic Crosstabs. Chọn đưa hai tiêu thức cần phân tổ kết hợp vào các ô Row(s) và Column(s). Nếu phân tổ kết hợp từ ba tiêu thức trở lên thì đưa lần lượt các tiêu thức này vào ô Layer of bằng nút chọn Next. Tiêu thức phân tổ theo dòng Tiêu thức phân tổ theo cột Các thống kê mô tả riêng và kết hợp Tiêu thức phân tổ thứ 3 (nếu cần) Kết quả: gioi tinh nam nu 1 7 3 2 5 9 9 yeu cau boi thuong khach hang doi sua Total Total 8 5 5 18 Symmetric Measures Nominal by Nominal Nguyễn Văn Cang Phi Cramer's V Contingency Coefficient 12 Value .734 .734 .592 Approx. Sig. .008 .008 .008 Xử lý dữ liệu trên SPSS 4. Ước lượng Thống kê 4.1. Ước lượng Số trung bình của chọn ngẫu nhiên đơn thuần Bấm chọn Analyze Descriptive Statistic Explore. Ta được cửa sổ sau. Thực hiện các thao tác như trong hình. Chọn tiêutần thức Hiển thị cần lượng suấtước % theo cột Chỉ định độ tin cậy Chọn hiển thị kết quả ước lượng Chọn độ tin cậy Kết quả tuoi Mean 95% Confidence Interval for Mean Lower Bound Upper Bound 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Statistic 36.67 31.25 Std. Error 2.57 42.08 36.52 37.50 118.471 10.88 22 54 Có thể tiến hành theo cách khác như sau: Bấm chọn Analyze Compare Means One-Sample-TTest. Ta được cửa sổ sau. Thực hiện các thao tác như trong hình. Nguyễn Văn Cang 13 Xử lý dữ liệu trên SPSS Chọn tiêu thức Hiển thị tần cần ước lượng suất % theo Chọn 0 để ước lượng Kết quả tuoi t df 14.292 17 Test Value = 0 Sig. (2Mean tailed) Difference .000 36.67 95% Confidence Interval of the Difference Lower Upper 31.25 42.08 4.2. Ước lượng Tỉ lệ của chọn ngẫu nhiên đơn thuần Vì thực chất tỉ lệ là số trung bình của biến đếm (1,0) nên ta có thể ước lượng tỉ lệ thông qua ước lượng trung bình biến đếm. Trước hết, ta tiến hành như mục 2.2 để tạo biến đếm với giá trị 1 cho các giá trị đang quan tâm, giá trị 0 cho tất cả các giá trị còn lại. Sau đó, tiến hành như mục 4.1 trên biến đếm. Ví dụ: Ta cần ước lượng tỉ lệ sản phẩm có giá trị từ 5.8 đến 8.2 triệu đồng trong dữ liệu 18 đơn khiếu nại. Bấm chọn Transform Recode Into different variables. Chọn biến cần ước lượng Khai báo tên biến đếm Khai báo giá trị biến đếm Ta có thể khai báo giá trị biến đếm như sau: Nguyễn Văn Cang 14 Xử lý dữ liệu trên SPSS Old Value (*) Range: 5.8 through 8.2 (*) All other values New Value 1 0 Màn hình kết xuất biến đếm: Biến đếm kết xuất Biến gốc Bấm chọn Analyze Compare Means One-Sample-TTest. Biến đếm dùng để ước lượng Kết quả ước lượng: t Ti le sp tu 5.8 den 8.2 2.557 Test Value = 0 df Sig. (2tailed) 17 .020 Mean Difference .2778 95% Confidence Interval of the Difference Lower Upper 4.858E-02 .5070 5. Kiểm định tham số và sự khác biệt 5.1. Kiểm định giả thuyết về số trung bình một tổng thể - Với dữ liệu chéo đã có sẵn: Ví dụ kiểm định giả thuyết cho rằng tuổi trung bình của những người khiếu nại là 30 tuổi qua mẫu 18 đơn thư. Nguyễn Văn Cang 15 Xử lý dữ liệu trên SPSS Analyze Compare Means One-Sample T-Test. Chọn tiêu thức cần kiểm định Nhập µo Kết quả: One-Sample Test Test Value = 30 tuoi t df Sig. (2tailed) Mean Difference 2.599 17 .019 6.67 95% Confidence Interval of the Difference Lower Upper 1.25 12.08 Sig. (2-tailed) < 0.05 : Bác bỏ giả thuyết hai phía Chú ý: Sig.(1-tailed) = Sig.(2-tailed) / 2 - Với dữ liệu đã được sắp xếp rút gọn có tần số: Tuổi Tần số 23 5 25 8 27 12 28 10 31 4 Ta nhập dữ liệu này theo hai biến. Biến thứ nhất ‘Tuoi’ nhập các giá trị rút gọn của tiêu thức. Biến thứ hai ‘ts’ nhập tần số. Sau đó, chỉ định tần số cho dữ liệu bằng cách bấm chọn Data Weight Cases. Chỉ định có tần số Chọn biến tần số Sau đó, các thao tác kiểm định khác tiến hành bình thường như trên. 5.2. Kiểm định giả thuyết về sự bằng nhau giữa hai số trung bình của hai tổng thể, mẫu độc lập - Trường hợp so sánh giữa hai nhóm của cùng một tiêu thức nào đó trên cùng một dữ liệu chéo đã có. Nguyễn Văn Cang 16 Xử lý dữ liệu trên SPSS Ví dụ kiểm định giả thuyết về sự bằng nhau của giá trị sản phẩm trung bình giữa nam và nữ trong dữ liệu về 18 đơn thư khiếu nại. Bấm chọn: Analyze Compare Means Independent-Samples T-Test. Thao tác như trong hình. Sau đó, bấm chọn OK. Chọn tiêu thức cần kiểm định Chỉ định hai nhóm cần so sánh Chọn tiêu thức làm căn cứ phân nhóm - Trường hợp dữ liệu đã được sắp xếp rút gọn có tần số: Mẫu của tổng thể thứ nhất Tuổi Tần số 23 5 25 8 27 12 28 10 31 4 Mẫu của tổng thể thứ hai Tuổi Tần số 23 5 25 8 27 12 28 10 31 4 Ta nhập dữ liệu này theo ba biến. Biến thứ nhất ‘Tuoi’ nhập các giá trị rút gọn của Tuổi ở cả hai mẫu. Biến thứ hai ‘ts’ nhập Tần số tương ứng ở cả hai mẫu. Biến thứ ba ‘Mau’ nhập giá trị 1 cho mẫu thứ nhất, giá trị 2 cho mẫu thứ hai. Sau đó, chỉ định tần số cho dữ liệu này như ở mục 5.1. Các thao tác kiểm định khác tiến hành như trường hợp trên. Cần lưu ý là biến ‘Mau’ được dùng để phân nhóm. 5.3. Kiểm định giả thuyết về sự bằng nhau giữa hai số trung bình của hai tổng thể, mẫu cặp Nguyễn Văn Cang 17 Xử lý dữ liệu trên SPSS Dữ liệu mẫu cặp có dạng: Đơn vị mẫu 1 2 . . . n Mẫu 1 27 32 . . . 34 Mẫu 2 22 34 . . . 28 Ta nhập hai biến ‘mau1’ và ‘mau2’ như dữ liệu chéo thông thường. Tuy nhiên cần lưu ý hai biến này là cùng loại, trật tự dữ liệu phải được giữ nguyên. Sau đó bấm chọn: Analyze Compare Means Paired-Samples T-Test. Chọn cả hai biến Chọn cả hai biến cùng một lúc đưa vào ô Paired Variables. Bấm chọn OK ta được kết quả kiểm định. 5.4. Kiểm định giả thuyết về phương sai hai hay nhiều tổng thể: Kiểm định Levene Bấm chọn: Analyze Compare Means One-Way ANOVA Chọn biến cần kiểm định Nguyễn Văn Cang Chọn biến phân nhóm Chọn kiểm định 18 Xử lý dữ liệu trên SPSS Chọn kiểm định phương sai Kết quả: Test of Homogeneity of Variances Gia tri san pham theo Số lần khiếu nại Levene Statistic df1 df2 Sig. .076 2 15 .927 Sig > 0.05 : Chưa đủ cơ sở bác bỏ giả thuyết Phương sai ba loại Số lần khiếu nại bằng nhau. 6. Kiểm định phi tham số 6.1. Kiểm định giả thuyết về sự giống nhau của hai tổng thể, mẫu cặp Nhập liệu tương tự mục 5.3. Sau đó bấm chọn: Analyze Nonparametric Tests 2 Ralated Samples. Chọn loại kiểm định Chọn cả hai biến Chọn cả hai biến cùng một lúc (bấm chọn biến thứ nhất, nhấn Shift rồi bấm chọn biến thứ hai) đưa vào ô Test Pair(s) List. Bấm chọn loại phương pháp kiểm định. Cuối cùng bấm chọn OK ta được kết quả. Chú ý: Sig.(1-tailed) = Sig.(2-tailed) / 2 6.2. Kiểm định giả thuyết về sự giống nhau của hai tổng thể, mẫu độc lập Kiểm định hạng Mann-Whitney Trường hợp so sánh giữa hai nhóm của cùng một tiêu thức nào đó trên cùng một dữ liệu chéo đã có. Bấm chọn: Analyze Nonparametric Tests 2 Independent Samples. Nguyễn Văn Cang 19 Xử lý dữ liệu trên SPSS Chọn biến cần kiểm định Chọn loại kiểm định Chọn biến phân nhóm Chọn hai nhóm cần so sánh Thao tác như trong hình trên. Cuối cùng bấm chọn OK. Trường hợp dữ liệu đã được sắp xếp rút gọn có tần số: Các thao tác nhập liệu tương tự mục 5.2. Tuy nhiên, cần lưu ý, biến dùng để phân nhóm phải có kiểu dữ liệu Numeric. Các thao tác kiểm định khác tiến hành như trên. 6..3. Kiểm định giả thuyết về sự giống nhau của nhiều tổng thể, mẫu độc lập Kiểm định hạng Kruskal-Wallis Trường hợp so sánh giữa ba nhóm trở lên của cùng một tiêu thức nào đó trên cùng một dữ liệu chéo đã có. Bấm chọn: Analyze Nonparametric Tests K Independent Samples. Chọn loại kiểm định Chọn biến cần kiểm định Chọn biến phân nhóm Nguyễn Văn Cang 20 Xử lý dữ liệu trên SPSS Chọn các nhóm cần so sánh Thao tác như trong hình trên. Cuối cùng bấm chọn OK. Trường hợp dữ liệu đã được sắp xếp rút gọn có tần số: Các thao tác nhập liệu tương tự mục 5.2. Tuy nhiên, cần lưu ý, biến dùng để phân nhóm phải có kiểu dữ liệu Numeric và có từ 3 giá trị khác nhau trở lên. Các thao tác kiểm định khác tiến hành như trên. 6.4. Kiểm định giả thuyết về tương quan giữa hai tiêu thức định lượng Bấm chọn: Analyze Correlate Bivariate. Chọn loại kiểm định Hai tiêu thức cần kiểm định Thao tác như trong hình trên. Cuối cùng bấm chọn OK. 6.5. Kiểm định tương quan giữa hai tiêu thức định tính: Bấm chọn: Analyze Descriptive Statistics Crosstabs. Hai tiêu thức cần kiểm định Nguyễn Văn Cang 21 Xử lý dữ liệu trên SPSS Chọn kiểm định liên hệ biến thứ bậc Chọn kiểm định liên hệ biến danh định Thao tác như trong hình trên. Cuối cùng bấm chọn OK. 6.6. Kiểm định giả thuyết về phân phối tổng thể: Phương pháp kiểm định Khi bình phương. Ví dụ, có dữ liệu về thu nhập (triệu đồng) ở một thị trường như sau: Mức thu nhập Tần số thực tế (ni) Tần suất giả thuyết % (poi) Dưới 1 25 10 1-2 38 20 2-4 52 40 4 - 10 18 15 10 - 20 12 10 Trên 20 5 5 Tổng 150 100 Nhập dữ liệu theo hai biến: Tần số thực tế ‘tstt’ và Tần suất giả thuyết ‘tsuatgt’. Sau đó tạo thêm biến thứ ba ‘tsgt’ như mục 2 với: tsgt = 150*(tsuatgt/100). Và, chỉ định ‘tstt’ là tần số bằng cách bấm chọn: Data Weight Cases Chỉ định tần số Chọn biến tần số Sắp xếp ‘tstt’ theo thứ tự tăng dần: Data Sort cases Nguyễn Văn Cang 22 Xử lý dữ liệu trên SPSS Chọn biến sắp xếp Bấm chọn: Analyze Nonparametric Tests Chi-Square Test. Đưa ‘tstt’ vào ô kiểm định Nhập cột ‘tsgt’, từng số, từ trên xuống dưới Thao tác như trong hình trên. Cuối cùng bấm chọn OK. 6.7. Kiểm định giả thuyết về phân phối chuẩn: Phương pháp kiểm định Kolmogorov-Smirnov: Bấm chọn: Analyze Nonparametric Tests 1-Sample K-S... Chọn phân phối chuẩn Nguyễn Văn Cang Chọn tiêu thức cần kiểm định 23 Xử lý dữ liệu trên SPSS Kết quả: One-Sample Kolmogorov-Smirnov Test gia tri san pham N 18 Normal Mean 6.0222 Parameters Std. 3.0245 Deviation Most Extreme Absolute .113 Differences Positive .113 Negative -.081 Kolmogorov.481 Smirnov Z Asymp. Sig. (2.975 tailed) Asymp. Sig. (2-tailed) > 0.05 : Chưa đủ cơ sở bác bỏ giả thuyết về phân phối chuẩn của Giá trị sản phẩm. 7. Phân tích phương sai 7.1. Phân tích phương sai một chiều (One-Way Analysis) Trường hợp so sánh Số trung bình giữa các nhóm khác nhau trên cùng một tiêu thức nào đó của cùng một dữ liệu chéo. Bấm chọn: Analyze Compare Means One-Way ANOVA. Chọn tiêu thức phân nhóm Chọn tiêu thức cần so sánh Chọn so sánh bội (nếu cần) Thao tác như trong hình trên. Cuối cùng bấm chọn OK. Lưu ý: Tiêu thức phân nhóm phải có kiểu Numeric. Nếu cần, có thể đổi kiểu dữ liệu sang kiểu Numeric như được trình bày ở phần nhập liệu. Nếu bấm chọn so sánh bội, ta có của sổ: Nguyễn Văn Cang 24 Xử lý dữ liệu trên SPSS Chọn loại so sánh bội Nhập α Bấm chọn loại phương pháp so sánh bội. Nhập độ ý nghĩa α. Cuối cùng bấm chọn Continue để quay lại cửa sổ One-Way ANOVA. Ta thu được kết quả so sánh bội có dạng như sau: Student-Newman-Keuls ‘lsc’ N 1 2 4 3 Sig. 5 5 5 5 Subset for alpha = .05 1 2 29,0000 46,0000 69,6000 83,4000 ,078 ,146 Từ 2 cột cuối ta biết được sự bằng nhau của hai cặp nhóm ‘lsc’ sau : lsc1 lsc2 lsc4 lsc3 Trường hợp so sánh Số trung bình từ dữ liệu của một thiết kế ngẫu nhiên hoàn toàn. Ta nhập dữ liệu của thiết kế này theo 2 biến kiểu Numeric sau: - Biến ‘X’: Nhập toàn bộ dữ liệu (xij) của thiết kế; - Biến ‘T’: Nhập số thứ tự 1, 2,… t của t xử lý tương ứng với xij. Sau đó, các thao tác kiểm định khác được tiến hành tương tự như trên. 7.2. Phân tích phương sai hai chiều không tương tác (Two-Way Analysis without interaction) cho thiết kế khối ngẫu nhiên Từ dữ liệu thiết kế khối ngẫu nhiên, ta nhập 3 biến kiểu Numeric sau: - Biến ‘X’: Nhập toàn bộ dữ liệu (xij) của thiết kế; - Biến ‘t’: Nhập số thứ tự 1, 2,… t của t xử lý tương ứng với các xij. - Biến ‘b’: Nhập số thứ tự 1, 2,… b của b tác nhân ngoại lai tương ứng với xij; Nguyễn Văn Cang 25 Xử lý dữ liệu trên SPSS Sau khi nhập liệu xong, bấm chọn: Analyze General Linear Model Univariate. Trong cửa sổ Univariate. Chọn biến ‘X’ Chọn biến ‘t’ và ‘b’ làm yếu tố mô hình Nguyễn Văn Cang 26 Xử lý dữ liệu trên SPSS Trên cửa sổ Univariate chọn biến ‘x’ chuyển sang ô Dependent Variable, chọn biến ‘b’, ‘t’ chuyển sang ô Fixed Factor(s). Sau đó, bấm chọn ô Model để vào cửa sổ Univariate: Model. Chỉ định mô hình Chọn biến Chọn ‘b’ vàbiến ‘t’ ‘B’ và làm các‘T’ yếu làm cáchình tố mô Chọn Main effects Trong cửa sổ Univariate: Model, trước hết ta chỉ định mô hình bằng cách chọn Custom. Tiếp đến, chọn biến ‘t’ và ‘b’ trong ô Facstors & Covariantes chuyển sang ô Model. Sau đó, chọn Main effects. Chọn Continue để quay lại cửa sổ Univariate. Chú ý: Phải chọn ô Include intercept in model nếu không mô hình sẽ bị sai. Cuối cùng chọn OK. Ta được kết quả phân tích phương sai như trong phần in đậm ở bảng dưới: Dependent Variable: X Source Type III Sum of quares df Mean Square F Sig. ,000 ,000 Corrected Model Intercept 5455,50 57840,25 6 1 909,3 57840,3 14,25 906,51 B T Error 5392,75 62,75 574,25 3 3 9 1797,6 20,9 63,8 28,17 ,000 ,33 ,805 63870,00 16 6029,75 15 Total Corrected Total Phần in đậm trong bảng trên là những thông tin cần thiết của phương pháp phân tích phương sai cho mô hình thiết kế khối. Nguyễn Văn Cang 27 Xử lý dữ liệu trên SPSS Chú ý: Nếu muốn so sánh bội, trong cửa sổ Univariate ở trang trước, bấm chọn Post Hoc ta được cửa sổ sau: Chọn Chọnyếu yếutốtố sososánh sánhbội bội Chọn phương pháp so sánh bội Sau khi thao tác như hình trên. Bấm chọn ô Continue để quay lại cửa sổ Univariate. Chọn OK. Kết quả so sánh bội có dạng như sau: Student-Newman-Keuls ‘b’ N 1 2 3 4 Sig. 4 4 4 4 1 35,2500 Subset 2 3 50,2500 1,000 1,000 73,7500 81,2500 ,217 Từ cột Subset ta biết được chỉ có cặp Blocks 3 và 4 là bằng nhau: B1 B2 B3 B4 7.3. Phân tích phương sai ba chiều không tương tác (Three-Way Analysis without interaction) cho thiết kế vuông ngẫu nhiên Từ dữ liệu thiết kế vuông ngẫu nhiên, ta nhập 4 biến sau: - Biến ‘X’: Nhập toàn bộ dữ liệu (xij) của thiết kế; - Biến ‘r’: Nhập số thứ tự 1, 2,… t của các tác nhân ngoại lai theo dòng tương ứng với các xij; - Biến ‘c’: Nhập số thứ tự 1, 2,… t của các tác nhân ngoại lai theo cột tương ứng với các xij; - Biến ‘t’: Nhập số thứ tự 1, 2,… t của các xử lý tương ứng với các xij. Nguyễn Văn Cang 28 Xử lý dữ liệu trên SPSS Sau đó, bấm chọn: Analyze General Linear Model Univariate. Chọn biến ‘x’ Chọn biến ‘t’, ‘c’ và ‘r’ làm yếu tố mô hình Nguyễn Văn Cang 29 Xử lý dữ liệu trên SPSS Bấm chọn ô Model, ta vào cửa sổ: Chỉ định mô hình Chọn Chọnbiến biến‘t’, ‘B’ ‘c’vàvà‘T’ ‘r’làm làmcác yếu yếutốtốmô của hình mô Chọn Main effects Các thao tác trên hình tương tự mục 7.2. Ta được kết quả phân tích phương sai như trong phần in đậm ở bảng dưới: Dependent Variable: X Type III Source Sum of Squares Mean Square df F Sig. Corrected Model Intercept 5636,625 57840,250 9 1 626,292 9,559 57840,250 882,776 R C T Error 181,125 62,750 5392,750 393,125 3 3 3 6 60,375 ,921 ,485 20,917 ,319 ,812 1797,583 27,435 ,001 65,521 63870,000 16 6029,750 15 Total Corrected Total ,006 ,000 Nếu chọn so sánh bội giữa các Xử lý (Treatments), bấm chọn ô Post Hoc rồi thao tác như ở mục 7.1 ta được kết quả: Student-Newman-Keuls Nguyễn Văn Cang ‘t’ N 3 2 1 4 Sig. 4 4 4 4 1 35,2500 Subset 2 3 50,2500 1,000 30 1,000 73,7500 81,2500 ,238 Xử lý dữ liệu trên SPSS Từ cột Subset ta biết được chỉ có cặp xử lý 1 và 4 là bằng nhau: T3 T2 T1 T4 7.4. Phân tích phương sai hai chiều và tương tác (Two-Way Analysis with interaction) cho thiết kế thừa số ngẫu nhiên Từ dữ liệu thiết kế thừa số ngẫu nhiên, ta nhập 3 biến sau: - Biến ‘X’: Nhập toàn bộ dữ liệu (xijk) của thiết kế; - Biến ‘A’: Nhập số thứ tự 1, 2,… a của a tác nhân của yếu tố A tương ứng với xijk; - Biến ‘B’: Nhập số thứ tự 1, 2,… b của b tác nhân của yếu tố B tương ứng với xijk. Sau khi nhập liệu xong, bấm chọn: Analyze General Linear Model Univariate. Nguyễn Văn Cang 31 Xử lý dữ liệu trên SPSS Chọn biến ‘x’ Chọn biến ‘a’ và ‘b’ làm yếu tố mô hình Chỉ định mô hình Các thao tác trên cửa sổ Univariate tương tự mục 7.2. Trong cửa sổ Univariate: Model chỉ cần chỉ định mô hình là Full factorial. Ta được kết quả phân tích phương sai như trong phần in đậm ở bảng dưới: Dependent Variable: X Type III Sum of Squares df Mean Square Corrected Model 166,447 Intercept 7540,053 8 1 20,806 4,569 7540,053 1655,941 Source A B A*B Error 144,109 14,907 7,431 81,960 2 2 4 18 Total 7788,460 27 Corrected Total 248,407 26 72,054 7,453 1,858 4,553 F 15,825 1,637 ,408 Sig. ,004 ,000 ,000 ,222 ,800 Nếu muốn so sánh bội, bấm chọn ô Post Hoc rồi thao tác như ở mục 7.1 Nguyễn Văn Cang 32 Xử lý dữ liệu trên SPSS 8. Hồi qui 8.1. Hồi qui mối liên hệ giữa hai tiêu thức định lượng Dựa trên dữ liệu chéo, ta tiến hành hồi qui như sau: Bấm chọn : Analyze Regression Curve Estimation. Chọn tiêu thức phụ thuộc Chọn các mô hình mong muốn Chọn tiêu thức độc lập Chọn kiểm định độ phù hợp Chú ý: * Chỉ có các tiêu thức kiểu Mumeric mới hồi qui được; * Muốn biết dạng toán học của một mô hình cần chọn thì để trỏ chuột lên chữ của mô hình đó và ấn nút chuột phải; * Nếu chưa biết chắc mô hình cần hồi qui thì nên bấm chọn hồi qui thử trên nhiều mô hình cùng một lúc (chưa nên bấm chọn Display ANOVA table và Save). Dựa vào bảng kết quả hồi qui thử cho các mô hình, mô hình nào có hình dáng phù hợp và có Adjusted R Square lớn thì mới được chọn chính thức. Sau đó, bấm chọn Reset để hủy các thao tác hồi qui lần đầu, tiến hành trở lại đầy đủ các thao tác ở hình trên cho mô hình đã được lựa chọn. * Các kết quả dự đoán chỉ tính trên các giá trị hiện có của tiêu thức độc lập. Các kết quả dự đoán được kết xuất trên cửa sổ dữ liệu. Nếu muốn dự đoán bấm chọn ô Save, ta được cửa sổ: Nguyễn Văn Cang 33 Xử lý dữ liệu trên SPSS Chọn dự đoán điểm Chọn dự đoán khoảng Bấm chọn ô Continue để quay lại. 8.2. Hồi qui mối liên hệ tuyến tính giữa nhiều tiêu thức định lượng Dựa trên dữ liệu chéo, ta tiến hành hồi qui như sau: Bấm chọn : Analyze Regression Linear. Ta có cửa sổ sau: Chọn các tiêu thức độc lập Chọn tiêu thức phụ thuộc Chọn cách tiếp cận mô hình Chọn kiểm tra vi phạm các giả thiết Chú ý: - Chỉ có các tiêu thức kiểu Mumeric mới hồi qui được; - Có các cách tiếp cận mô hình hồi qui bội sau: * Enter: Đưa vào mô hình hồi qui tất cả các biến độc lập; *Backward: Loại trừ dần dần các biến độc lập không phù hợp; *Forward: Đưa dần các biến độc lập vào cho đến khi mô hình thu được vẫn còn bảo đảm ý nghĩa; * Stepwise: Kết hợp giữa Backward và Forward. Nguyễn Văn Cang 34 Xử lý dữ liệu trên SPSS Phát hiện đa cộng tuyến Phát hiện tự tương quan Thao tác như trong hình trên. Cuối cùng chọn OK. Nếu muốn dự đoán bấm chọn ô Save, ta có cửa sổ sau: Dự đoán phần dư Dự đoán điểm tiêu thức phụ thuộc Dự đoán khoảng tiêu thức phụ thuộc Sau khi thao tác như hình trên, bấm chọn Continue để quay lại cửa sổ Linear Regression. Chú ý: Nguyễn Văn Cang 35 Xử lý dữ liệu trên SPSS * Các kết quả dự đoán chỉ tính trên các giá trị hiện có của tiêu thức độc lập. Các kết quả dự đoán được kết xuất trên cửa sổ dữ liệu. * Nếu mô hình yêu cầu không có hệ số chặn (dùng trên dữ liệu biến đổi để khắc phục hiện tượng phương sai không đồng nhất), bấm chọn ô Options để vào cửa sổ sau: Chọn có hay không có hệ số chặn Sau khi thao tác như hình trên, bấm chọn Continue để quay lại cửa sổ Linear Regression. 9. Kiểm soát chất lượng bằng thống kê 9.1. Biểu đồ kiểm soát số trung bình và độ lệch chuẩn Nhập dữ liệu theo hai biến: Biến xij phản ảnh giá trị j của mẫu i; Biến “mau” phản ảnh thứ tự mẫu. Nguyễn Văn Cang 36 Xử lý dữ liệu trên SPSS Bấm chọn : Analyze Quality Control Control charts. Ta có cửa sổ sau: Chọn loại biểu đồ Chọn loại dữ liệu Chọn các khai báo Chọn biến kiểm soát Chọn biến các mẫu Chọn chỉ số năng lực Chọn biểu đồ trung bình Chọn biểu đồ Nguyễn Văn Cang 37 Xử lý dữ liệu trên SPSS Nhập các giới hạn Chọn chỉ số năng lực 9.2. Biểu đồ kiểm soát tỉ lệ Ta nhập dữ liệu theo ba biến như sau: Mẫu 1 1 2 2 … 20 20 Lỗi 1 0 1 0 … 1 0 Tần số 1 299 5 295 … 1 299 Trong đó, Lỗi =1: sản phẩm có lỗi, Lỗi =0: sản phẩm không có lỗi. Sau đó, chỉ định tần số cho dữ liệu bằng cách bấm chọn Data Weight Cases. Chọn tần số Nguyễn Văn Cang 38 Xử lý dữ liệu trên SPSS Bấm chọn : Analyze Quality Control Control charts. Ta có cửa sổ sau: Chọn loại biểu đồ Chọn loại dữ liệu Chọn các khai báo Chọn biến kiểm soát Chọn giá trị kiểm soát lỗi Chọn biến mẫu kiểm tra Chọn loại biểu đồ Chọn OK. Kết quả thu được như sau: Nguyễn Văn Cang 39 Xử lý dữ liệu trên SPSS Nguyễn Văn Cang 40 Xử lý dữ liệu trên SPSS