Uploaded by Thaoo Nguyenn

Xử lý dữ liệu SPSS (Nguồn: Sưu tầm)

advertisement
NGUYỄN VĂN CANG
Tham gia nhóm HI DUE Z để nhận được nhiều tài liệu
Kinh Tế bổ ích nhé :3
Nguyễn Văn Cang
1
Xử lý dữ liệu trên SPSS
1. Nhập liệu
1.1. Chuẩn bị dữ liệu
Dữ liệu chéo là dữ liệu phổ biến nhất dùng trong SPSS. Dạng tổng quát của dữ
liệu chéo như sau:
Đơn vị
tổng thể
1
2
3
…
n
Tiêu thức 1
Tiêu thức 2
x11
x21
x31
x12
x22
x32
…
Tiêu thức k
x1k
x2k
x3k
…
…
…
xn1
xn2
xnk
Trong bảng trên, dữ liệu của một đơn vị tổng thể được thể hiện trên một dòng.
Ví dụ: Có dữ liệu mẫu về 18 đơn thư khiếu nại của khách hàng được chọn ngẫu
nhiên.
Số
Giới
Gía trị
Số ngày
thứ Tuổi
tính Nơi
sản
Ngày
của
bảo
tự khách của mua phẩm
mua
hành
đơn hàng khách
còn lại
(tr.đ)
thư
hàng
1
72
22
Nữ
A
2,5
20/10/06
2
04/06/05
24
26
Nam
B
1,8
3
37
10/02/07
25
Nam
A
12,5
4
13
24/08/05
27
Nữ
B
4,5
5
12/04/05
58
26
B
2,8
Nữ
Nữ
6
64
16/05/07
26
D
6,4
Nam
22/08/06
7
45
25
F
10,2
Nữ
05/02/05
8
81
27
A
3,5
Nam
18/06/06
9
69
26
C
6,8
Nữ
04/8/06
10
21
48
C
5,5
Nam
02/04/07
11
12
26
A
4,7
Nam
08/06/07
12
48
25
A
8,2
Nam
15/03/07
13
57
26
C
9,1
Nữ
24/02/07
14
92
25
B
7,4
Nam
27/05/07
15
102
60
A
5,8
Nữ
15/01/07
16
34
27
B
4,4
Nữ
22/04/07
17
68
26
B
9,7
Nam
25/12/06
18
39
27
C
2,6
Kí hiệu: B.T: Bồi thường
Nguyễn Văn Cang
2
Loại
sự cố
Kêu
Bể
Rỉ
Nứt
Cháy
Hỏng
Kêu
Nứt
Hỏng
Rỉ
Bể
Kêu
Rỉ
Bể
Cháy
Nứt
Bể
Kêu
Yêu
cầu
của
khách
hàng
B.T
Đổi
Đổi
B.T
B.T
B.T
Sửa
Đổi
B.T
Đổi
Sửa
Đổi
Sửa
B.T
Sửa
B.T
B.T
Sửa
Xử lý dữ liệu trên SPSS
1.2. Khai báo nhập liệu
Kích hoạt biểu tượng SPSS trên Desktop hay Start  Program  SPSS. Ta
được màn hình gốc như sau:
Bấm
chọn
Data
View để
chuyển
qua màn
hình
nhập liệu
Bấm
chọn
Variable
View để
chuyển
qua màn
hình khai
báo nhập
liệu
Ta phải khai báo khuôn mẫu của dữ liệu trước khi nhập.
+ Chọn Variable View ở đáy màn hình để chuyển qua màn hình khai báo nhập
liệu như ở trang sau.
+ Khai báo lần lượt từng tiêu thức, mỗi tiêu thức một dòng (trên máy gọi là
một variable). Trong đó:
* Name: Đánh vào tên rút gọn của tiêu thức (tối đa 8 ký tự không có ký tự đặc
biệt). Tên này sẽ được hiển thị ở đầu vào và sử dụng trong quá trình xử lý trên máy
cho tiện.
* Type: Chọn kiểu dữ liệu cho tiêu thức như số, chuổi, ngày…
* Width: Xác định độ rộng (ký tự) cho dữ liệu.
Nguyễn Văn Cang
3
Xử lý dữ liệu trên SPSS
Nhập
giá trị
mã hóa
Nhập
giá trị
gốc
Nút chuyển
từng giá trị
đã mã hóa
vào ô kết
quả bên cạnh
Nhập giá trị
mã hóa
Missing
Nguyễn Văn Cang
4
Xử lý dữ liệu trên SPSS
* Decimals: Số chữ số thập phân của kiểu dữ liệu số.
* Label: Khai báo tên gốc của tiêu thức. Tên này dài hơn Name ở trên cho dể nhận
diện ở dữ liệu đầu ra.
* Values: Nếu nhập đầy đủ giá trị gốc thì chọn None. Với các tiêu thức định tính
(thuộc tính), để nhập liệu nhanh chóng, người ta thường mã hóa các giá trị của tiêu
thức bằng các số nguyên. Ví dụ, tiêu thức ‘Yêu cầu của khách hàng’ được mã hóa
như sau:
Giá trị gốc
(Value Label)
- Bồi thường
- Đổi
- Sửa
Giá trị mã hóa
(Value)
1
2
3
Ta khai báo từng Value và Value Label tương ứng rồi chọn add đưa vào ô
chứa. Chọn OK để kết thúc khai báo.
* Missing: Khai báo giá trị mã hóa đặc biệt cho những giá trị bị khuyết (không
có số liệu) nếu có của tiêu thức. Nên chọn những giá trị không có thực nhưng đúng
kiểu dữ liệu đã khai báo cho tiêu thức đó. Chẳng hạn, với tiêu thức ‘Tuổi’, -1 nghĩa là
không thu thập được, -2 nghĩa là chờ bổ sung. Tất cả các giá trị có mã khai báo ở ô
này sẽ không tham gia vào quá trình xử lý dữ liệu của máy.
Nếu chọn mặc định None thì khi có giá trị bị khuyết (nhập liệu cho tiêu thức
khác ở đơn vị tổng thể nào đó mà không nhập cho tiêu thức có mặc định none) máy
sẽ gán dấu phẩy hệ thống. Đây là mã system missing và nó cũng không tham gia vào
quá trình xử lý dữ liệu của máy.
* Column: Khai báo độ rộng cho cột nhập dữ liệu.
* Align: Chọn định vị trái, giữa hay phải cho cột dữ liệu.
* Measure: Chọn loại thang đo dữ liệu của tiêu thức: danh định (Nominal), thứ
bậc (Ordinal) và khoảng cách hay tỉ lệ (Scale).
+ Sau khi khai báo xong tất cả các tiêu thức, nếu chưa muốn nhập liệu ngay, ta
vào File  Save as để lưu. Nếu muốn nhập liệu ngay, bấm chọn Data View ở đáy
màn hình để chuyển qua màn hình nhập liệu:
Nguyễn Văn Cang
5
Xử lý dữ liệu trên SPSS
Bấm chọn nút
này để nhập
các giá trị mã
hóa
Bấm chọn ô
này để chuyển
qua màn hình
nhập liệu
Trên màn hình này, ta nhập dữ liệu của một đơn vị tổng thể trên một dòng màn
hình. Nhập dần dần cho đến đơn vị tổng thể cuối cùng. Vào File  Save as để lưu dữ
liệu.
1.3. Nhập liệu
1.3.1. Mã hóa dữ liệu định tính: Để việc nhập liệu được nhanh chóng và chính
xác, dữ liệu của các tiêu thức thuộc tính cần được mã hóa. Mỗi biểu hiện của tiêu
thức (biến) được mã hóa bằng một con số duy nhất. Các con số mã hóa thường được
dùng nhất là 0, 1, 2, …, 8, 9.
Ví dụ: Xin cho biết anh chị thuộc nghề nghiệp nào sau đây:
□ Công chức
Được mã hóa là 1
□ Doanh nhân
Được mã hóa là 2
□ Công nhân
Được mã hóa là 3
□ Nông dân
Được mã hóa là 4
□ Nghề khác
Được mã hóa là 5
Việc mã hóa cần được tiến hành tập trung, do một số ít người phụ trách để
tránh sự thiếu thống nhất.
Trật tự các cột biến cần được nhập theo đúng trật tự các câu hỏi trong bản câu
hỏi. Trật tự các dòng dữ liệu, mỗi dòng tương ứng với một bản câu hỏi điều tra, cần
được nhập theo đúng trật tự các bản câu hỏi điều tra để tiện việc tìm kiếm, tra cứu khi
cần.
Nguyễn Văn Cang
6
Xử lý dữ liệu trên SPSS
1.3.2. Nhập liệu với câu hỏi có thể chọn nhiều trả lời: Mỗi mục chọn của câu hỏi
cần được nhập thành một biến phụ có dạng biến thay phiên 9 (hay biến đếm có hai
giá trị 1 và 0). Để máy tính có thể đếm được trong quá trình xử lý, biến phụ này phải
được khai báo là biến số (định lượng). Nó thường được mã hóa giá trị “1” tương ứng
với mục đó được chọn, giá trị “0” tương ứng với mục đó không được chọn.
Ví dụ: Câu 12. Bạn đã dùng loại bút bi nào sau đây (chọn một hoặc nhiều):
□ Bến nghé
Được nhập theo biến có tên c12c1
□ Thiên long
Được nhập theo biến có tên c12c2
□ Loại khác
Được nhập theo biến có tên c12c3
Câu hỏi trên được nhập thành ba biến phụ định lượng dạng thay phiên. Biến
c12c1 có giá trị “1” tương ứng với Bến nghé được chọn, giá trị “0” tương ứng với
Bến nghé không được chọn. Biến c12c2 có giá trị “1” tương ứng với Thiên long được
chọn, giá trị “0” tương ứng với Thiên long không được chọn. Biến c12c3 có giá trị
“1” tương ứng với Loại khác được chọn, giá trị “0” tương ứng với Loại khác không
được chọn.
Mỗi biến phụ nói trên có thể được sử dụng để phân tích như một biến bình
thường. Tuy nhiên chúng thường được ghép thành biến ghép cho câu hỏi chính của
chúng.
2. Tạo biến mới từ biến đã có
2.1. Sử dụng Compute
Ví dụ, ta cần thiết lập biến mới có tên ‘lngtsp’ bằng cách lấy logarit cơ số tự
nhiên của biến có tên ‘gtsp’ đã có.
Bấm chọn Transform  Compute. Ta có cửa sổ:
Chọn biến cũ để tính
biến mới
Nguyễn Văn Cang
Chọn hàm hổ trợ
7
Xử lý dữ liệu trên SPSS
+ Trong ô Target variable: Khai báo tên rút gọn của biến mới (Name);
+ Trong ô Type&Lable: Khai báo kiểu dữ liệu (Type) và nhãn của biến mới
(Lable).
+ Trong ô Numeric Expression: Khai báo biểu thức tính giá trị biến mới từ các
biến cũ.
+ Nếu cần lọc dữ liệu, chọn ô If bên dưới để khai báo các điều kiện lọc.
Chọn OK để có kết quả của biến mới.
Chú ý: Các giá trị Missing của biến cũ sẽ được tự động gán giá trị khuyết hệ
thống System Missing (dấu phẩy hệ thống) cho biến mới.
2.2. Sử dụng Recode  Into different variables.
Bấm chọn Transform  Recode  Into different variables.
Nhập tên,
nhãn biến mới
Chọn Change để khẳng
định tên, nhãn biến mới
Chọn biến cũ
cần chuyển đổi
Sau khi khai báo như hình trên, bấm chọn ô Old and New Values để khai báo
các chuyển đổi từ biến cũ sang biến mới.
Ví dụ, ta cần phân tổ tiêu thức ‘Tuổi’ thành 3 tổ: dưới 30, từ 30 đến 40, 40 trở
lên. Ta khai báo như sau, ưu tiên tổ có giá trị cao khai báo trước:
Old Value
40 through highest
30 through
40
Lowest through 30
New Value
3
2
1
+ Trong ô Old value, chọn lựa khai báo từng tổ theo biến cũ. Trong ô New value
khai báo ‘giá trị mã hóa của tổ’ tương ứng với tổ đã khai báo ở Old value, như hướng
dẫn trong hình ở trang sau:
+ Chú ý: Việc khai báo phải được tiến hành dần từng tổ và phải được xác nhận
bằng nút Add, một lần cho một tổ; khai báo trước sẽ ưu tiên nhận giá trị mới trước.
+ Để sửa một khai báo trong ô Old  New: Chọn dòng muốn sửa trong ô này rồi
chọn ô Change;
+ Để gở bỏ một khai báo trong ô Old  New: Chọn dòng muốn gở bỏ trong ô
này rồi chọn ô Remove;
Nguyễn Văn Cang
8
Xử lý dữ liệu trên SPSS
+ Chọn Continue để quay lại, chọn OK để kết thúc.
Mã của tổ
tương ứng
Tổ chỉ gồm
một giá trị
TổMissing
có giới hạn
Missing
dưới
và trên
Tổ chỉ có
giới hạn trên
Xác nhận
từng tổ
Tổ chỉ có
giới hạn dưới
Tổ gồm tất
cả các giá
trị còn lại
Chọn kiểu
dữ liệu định
danh cho tổ
3. Thống kê mô tả
3.1. Sắp xếp các đơn vị tổng thể theo một tiêu thức nào đó
Bấm chọn Data  Sort case.
Chọn tiêu thức
cần sắp xếp
Chọn tiêu thức muốn sắp xếp đưa vào ô Sort by. Chọn OK.
3.2. Mô tả thống kê theo một tiêu thức
Bấm chọn Analyze  Descriptive Statistic  Frequency.
Nguyễn Văn Cang
9
Xử lý dữ liệu trên SPSS
Chọn các
thống kê
Chọn tiêu thức
cần mô tả
Chọn biểu đồ
Bảng phân
phối tần số
Khi bấm chọn ô Statistics ta có cửa sổ sau:
Tứ phân vị
Độ lệch chuẩn
đã hiệu chỉnh
̂
Quay lại
Phương sai đã
hiệu chỉnh ˆ 2
Khi bấm chọn ô Charts ta có cửa sổ sau:
Chọn
phân
phối đồ
Quay lại
Nguyễn Văn Cang
10
Xử lý dữ liệu trên SPSS
Màn hình kết quả như sau:
Bấm chọn mục cần xem
Bấm
chọn ô
này để
trở lại
màn
hình
kết
quả
Bấm
chọn ô
này để
trở lại
màn
hình
dữ liệu
Chú ý: Dữ liệu định tính không mô tả được bằng các số đo thống kê mô tả
(statistics) dù được mã hóa bằng các con số.
3.3. Mô tả một tiêu thức định lượng bằng biểu đồ cành và lá, hộp với ria,
phân phối đồ
Bấm chọn Analyze  Descriptive Statistic  Explore.
Tiêu thức
cần mô tả
Tiêu thức
phân nhóm
tiêu thức cần
mô tả ở trên
(nếu cần)
Chọn loại
biểu đồ
Nguyễn Văn Cang
11
Xử lý dữ liệu trên SPSS
Chọn đưa tiêu thức định lượng cần mô tả vào ô Dependent Lit. Nếu cần mô tả
tiêu thức này theo các phân nhóm khác nhau thì chọn đưa tiêu thức phân nhóm vào ô
Factor List. Bấm chọn loại biểu đồ mong muốn trong ô Plots. Sau đó chọn OK.
3.4. Mô tả thống kê theo hai (hay nhiều) tiêu thức kết hợp
Bấm chọn Analyze  Descriptive Statistic  Crosstabs.
Chọn đưa hai tiêu thức cần phân tổ kết hợp vào các ô Row(s) và Column(s).
Nếu phân tổ kết hợp từ ba tiêu thức trở lên thì đưa lần lượt các tiêu thức này vào ô
Layer of bằng nút chọn Next.
Tiêu thức phân
tổ theo dòng
Tiêu thức phân
tổ theo cột
Các thống kê mô tả
riêng và kết hợp
Tiêu thức phân tổ thứ
3 (nếu cần)
Kết quả:
gioi tinh
nam
nu
1
7
3
2
5
9
9
yeu cau boi thuong
khach hang doi
sua
Total
Total
8
5
5
18
Symmetric Measures
Nominal by
Nominal
Nguyễn Văn Cang
Phi
Cramer's V
Contingency
Coefficient
12
Value
.734
.734
.592
Approx. Sig.
.008
.008
.008
Xử lý dữ liệu trên SPSS
4. Ước lượng Thống kê
4.1. Ước lượng Số trung bình của chọn ngẫu nhiên đơn thuần
Bấm chọn Analyze  Descriptive Statistic  Explore. Ta được cửa sổ sau.
Thực hiện các thao tác như trong hình.
Chọn
tiêutần
thức
Hiển thị
cần
lượng
suấtước
% theo
cột
Chỉ định
độ tin cậy
Chọn hiển thị kết
quả ước lượng
Chọn độ
tin cậy
Kết quả
tuoi
Mean
95% Confidence Interval
for Mean
Lower
Bound
Upper
Bound
5% Trimmed Mean
Median
Variance
Std. Deviation
Minimum
Maximum
Statistic
36.67
31.25
Std. Error
2.57
42.08
36.52
37.50
118.471
10.88
22
54
Có thể tiến hành theo cách khác như sau:
Bấm chọn Analyze  Compare Means  One-Sample-TTest. Ta được cửa
sổ sau. Thực hiện các thao tác như trong hình.
Nguyễn Văn Cang
13
Xử lý dữ liệu trên SPSS
Chọn tiêu thức
Hiển thị tần
cần ước lượng
suất % theo
Chọn 0 để
ước lượng
Kết quả
tuoi
t
df
14.292
17
Test Value = 0
Sig. (2Mean
tailed) Difference
.000
36.67
95% Confidence
Interval of the
Difference
Lower
Upper
31.25
42.08
4.2. Ước lượng Tỉ lệ của chọn ngẫu nhiên đơn thuần
Vì thực chất tỉ lệ là số trung bình của biến đếm (1,0) nên ta có thể ước lượng tỉ
lệ thông qua ước lượng trung bình biến đếm.
Trước hết, ta tiến hành như mục 2.2 để tạo biến đếm với giá trị 1 cho các giá trị
đang quan tâm, giá trị 0 cho tất cả các giá trị còn lại. Sau đó, tiến hành như mục 4.1
trên biến đếm.
Ví dụ: Ta cần ước lượng tỉ lệ sản phẩm có giá trị từ 5.8 đến 8.2 triệu đồng
trong dữ liệu 18 đơn khiếu nại.
Bấm chọn Transform  Recode  Into different variables.
Chọn biến cần
ước lượng
Khai báo tên
biến đếm
Khai báo giá
trị biến đếm
Ta có thể khai báo giá trị biến đếm như sau:
Nguyễn Văn Cang
14
Xử lý dữ liệu trên SPSS
Old Value
(*) Range: 5.8 through 8.2
(*) All other values
New Value
1
0
Màn hình kết xuất biến đếm:
Biến đếm
kết xuất
Biến gốc
Bấm chọn Analyze  Compare Means  One-Sample-TTest.
Biến đếm dùng
để ước lượng
Kết quả ước lượng:
t
Ti le sp tu 5.8 den 8.2
2.557
Test Value = 0
df
Sig. (2tailed)
17
.020
Mean
Difference
.2778
95% Confidence
Interval of the
Difference
Lower
Upper
4.858E-02 .5070
5. Kiểm định tham số và sự khác biệt
5.1. Kiểm định giả thuyết về số trung bình một tổng thể
- Với dữ liệu chéo đã có sẵn:
Ví dụ kiểm định giả thuyết cho rằng tuổi trung bình của những người khiếu nại
là 30 tuổi qua mẫu 18 đơn thư.
Nguyễn Văn Cang
15
Xử lý dữ liệu trên SPSS
Analyze  Compare Means  One-Sample T-Test.
Chọn tiêu
thức cần
kiểm định
Nhập µo
Kết quả:
One-Sample Test
Test Value = 30
tuoi
t
df
Sig. (2tailed)
Mean
Difference
2.599
17
.019
6.67
95% Confidence
Interval of the
Difference
Lower
Upper
1.25
12.08
Sig. (2-tailed) < 0.05 : Bác bỏ giả thuyết hai phía
Chú ý:
Sig.(1-tailed) = Sig.(2-tailed) / 2
- Với dữ liệu đã được sắp xếp rút gọn có tần số:
Tuổi
Tần số
23
5
25
8
27
12
28
10
31
4
Ta nhập dữ liệu này theo hai biến. Biến thứ nhất ‘Tuoi’ nhập các giá trị rút gọn
của tiêu thức. Biến thứ hai ‘ts’ nhập tần số. Sau đó, chỉ định tần số cho dữ liệu bằng
cách bấm chọn Data  Weight Cases.
Chỉ định có
tần số
Chọn biến
tần số
Sau đó, các thao tác kiểm định khác tiến hành bình thường như trên.
5.2. Kiểm định giả thuyết về sự bằng nhau giữa hai số trung bình của hai
tổng thể, mẫu độc lập
- Trường hợp so sánh giữa hai nhóm của cùng một tiêu thức nào đó trên cùng
một dữ liệu chéo đã có.
Nguyễn Văn Cang
16
Xử lý dữ liệu trên SPSS
Ví dụ kiểm định giả thuyết về sự bằng nhau của giá trị sản phẩm trung bình
giữa nam và nữ trong dữ liệu về 18 đơn thư khiếu nại.
Bấm chọn:
Analyze  Compare Means  Independent-Samples T-Test.
Thao tác như trong hình. Sau đó, bấm chọn OK.
Chọn tiêu
thức cần
kiểm định
Chỉ định
hai nhóm
cần so sánh
Chọn tiêu thức
làm căn cứ
phân nhóm
- Trường hợp dữ liệu đã được sắp xếp rút gọn có tần số:
Mẫu của tổng thể thứ nhất
Tuổi
Tần số
23
5
25
8
27
12
28
10
31
4
Mẫu của tổng thể thứ hai
Tuổi
Tần số
23
5
25
8
27
12
28
10
31
4
Ta nhập dữ liệu này theo ba biến. Biến thứ nhất ‘Tuoi’ nhập các giá trị rút gọn
của Tuổi ở cả hai mẫu. Biến thứ hai ‘ts’ nhập Tần số tương ứng ở cả hai mẫu. Biến
thứ ba ‘Mau’ nhập giá trị 1 cho mẫu thứ nhất, giá trị 2 cho mẫu thứ hai. Sau đó, chỉ
định tần số cho dữ liệu này như ở mục 5.1.
Các thao tác kiểm định khác tiến hành như trường hợp trên. Cần lưu ý là biến
‘Mau’ được dùng để phân nhóm.
5.3. Kiểm định giả thuyết về sự bằng nhau giữa hai số trung bình của hai
tổng thể, mẫu cặp
Nguyễn Văn Cang
17
Xử lý dữ liệu trên SPSS
Dữ liệu mẫu cặp có dạng:
Đơn vị mẫu
1
2
.
.
.
n
Mẫu 1
27
32
.
.
.
34
Mẫu 2
22
34
.
.
.
28
Ta nhập hai biến ‘mau1’ và ‘mau2’ như dữ liệu chéo thông thường. Tuy nhiên
cần lưu ý hai biến này là cùng loại, trật tự dữ liệu phải được giữ nguyên. Sau đó bấm
chọn:
Analyze  Compare Means  Paired-Samples T-Test.
Chọn
cả hai
biến
Chọn cả hai biến cùng một lúc đưa vào ô Paired Variables. Bấm chọn OK ta
được kết quả kiểm định.
5.4. Kiểm định giả thuyết về phương sai hai hay nhiều tổng thể: Kiểm định
Levene
Bấm chọn:
Analyze  Compare Means  One-Way ANOVA
Chọn
biến
cần
kiểm
định
Nguyễn Văn Cang
Chọn
biến
phân
nhóm
Chọn
kiểm
định
18
Xử lý dữ liệu trên SPSS
Chọn
kiểm
định
phương
sai
Kết quả:
Test of Homogeneity of Variances
Gia tri san pham theo Số lần khiếu nại
Levene Statistic
df1
df2
Sig.
.076
2
15
.927
Sig > 0.05 : Chưa đủ cơ sở bác bỏ giả thuyết Phương sai ba loại Số lần khiếu
nại bằng nhau.
6. Kiểm định phi tham số
6.1. Kiểm định giả thuyết về sự giống nhau của hai tổng thể, mẫu cặp
Nhập liệu tương tự mục 5.3. Sau đó bấm chọn:
Analyze  Nonparametric Tests  2 Ralated Samples.
Chọn
loại
kiểm
định
Chọn
cả hai
biến
Chọn cả hai biến cùng một lúc (bấm chọn biến thứ nhất, nhấn Shift rồi bấm
chọn biến thứ hai) đưa vào ô Test Pair(s) List. Bấm chọn loại phương pháp kiểm
định. Cuối cùng bấm chọn OK ta được kết quả.
Chú ý:
Sig.(1-tailed) = Sig.(2-tailed) / 2
6.2. Kiểm định giả thuyết về sự giống nhau của hai tổng thể, mẫu độc lập
Kiểm định hạng Mann-Whitney
Trường hợp so sánh giữa hai nhóm của cùng một tiêu thức nào đó trên cùng
một dữ liệu chéo đã có. Bấm chọn:
Analyze  Nonparametric Tests  2 Independent Samples.
Nguyễn Văn Cang
19
Xử lý dữ liệu trên SPSS
Chọn
biến
cần
kiểm
định
Chọn
loại
kiểm
định
Chọn
biến
phân
nhóm
Chọn
hai
nhóm
cần so
sánh
Thao tác như trong hình trên. Cuối cùng bấm chọn OK.
Trường hợp dữ liệu đã được sắp xếp rút gọn có tần số: Các thao tác nhập liệu
tương tự mục 5.2. Tuy nhiên, cần lưu ý, biến dùng để phân nhóm phải có kiểu dữ liệu
Numeric. Các thao tác kiểm định khác tiến hành như trên.
6..3. Kiểm định giả thuyết về sự giống nhau của nhiều tổng thể, mẫu độc lập
Kiểm định hạng Kruskal-Wallis
Trường hợp so sánh giữa ba nhóm trở lên của cùng một tiêu thức nào đó
trên cùng một dữ liệu chéo đã có. Bấm chọn:
Analyze  Nonparametric Tests  K Independent Samples.
Chọn
loại
kiểm
định
Chọn
biến
cần
kiểm
định
Chọn
biến
phân
nhóm
Nguyễn Văn Cang
20
Xử lý dữ liệu trên SPSS
Chọn
các
nhóm
cần so
sánh
Thao tác như trong hình trên. Cuối cùng bấm chọn OK.
Trường hợp dữ liệu đã được sắp xếp rút gọn có tần số: Các thao tác nhập liệu
tương tự mục 5.2. Tuy nhiên, cần lưu ý, biến dùng để phân nhóm phải có kiểu dữ liệu
Numeric và có từ 3 giá trị khác nhau trở lên. Các thao tác kiểm định khác tiến hành
như trên.
6.4. Kiểm định giả thuyết về tương quan giữa hai tiêu thức định lượng
Bấm chọn: Analyze  Correlate  Bivariate.
Chọn loại
kiểm định
Hai tiêu
thức cần
kiểm định
Thao tác như trong hình trên. Cuối cùng bấm chọn OK.
6.5. Kiểm định tương quan giữa hai tiêu thức định tính:
Bấm chọn: Analyze  Descriptive Statistics  Crosstabs.
Hai tiêu
thức cần
kiểm định
Nguyễn Văn Cang
21
Xử lý dữ liệu trên SPSS
Chọn kiểm
định liên hệ
biến thứ bậc
Chọn kiểm
định liên hệ
biến danh định
Thao tác như trong hình trên. Cuối cùng bấm chọn OK.
6.6. Kiểm định giả thuyết về phân phối tổng thể: Phương pháp kiểm định Khi
bình phương.
Ví dụ, có dữ liệu về thu nhập (triệu đồng) ở một thị trường như sau:
Mức thu nhập Tần số thực tế (ni) Tần suất giả thuyết % (poi)
Dưới 1
25
10
1-2
38
20
2-4
52
40
4 - 10
18
15
10 - 20
12
10
Trên 20
5
5
Tổng
150
100
Nhập dữ liệu theo hai biến: Tần số thực tế ‘tstt’ và Tần suất giả thuyết
‘tsuatgt’. Sau đó tạo thêm biến thứ ba ‘tsgt’ như mục 2 với: tsgt = 150*(tsuatgt/100).
Và, chỉ định ‘tstt’ là tần số bằng cách bấm chọn: Data  Weight Cases
Chỉ định
tần số
Chọn biến
tần số
Sắp xếp ‘tstt’ theo thứ tự tăng dần: Data  Sort cases
Nguyễn Văn Cang
22
Xử lý dữ liệu trên SPSS
Chọn biến
sắp xếp
Bấm chọn: Analyze  Nonparametric Tests  Chi-Square Test.
Đưa ‘tstt’ vào
ô kiểm định
Nhập cột ‘tsgt’,
từng số, từ trên
xuống dưới
Thao tác như trong hình trên. Cuối cùng bấm chọn OK.
6.7. Kiểm định giả thuyết về phân phối chuẩn: Phương pháp kiểm định
Kolmogorov-Smirnov:
Bấm chọn: Analyze  Nonparametric Tests  1-Sample K-S...
Chọn phân
phối chuẩn
Nguyễn Văn Cang
Chọn tiêu thức
cần kiểm định
23
Xử lý dữ liệu trên SPSS
Kết quả:
One-Sample Kolmogorov-Smirnov Test
gia tri san pham
N
18
Normal
Mean
6.0222
Parameters
Std.
3.0245
Deviation
Most Extreme Absolute
.113
Differences
Positive
.113
Negative
-.081
Kolmogorov.481
Smirnov Z
Asymp. Sig. (2.975
tailed)
Asymp. Sig. (2-tailed) > 0.05 : Chưa đủ cơ sở bác bỏ giả thuyết về phân phối
chuẩn của Giá trị sản phẩm.
7. Phân tích phương sai
7.1. Phân tích phương sai một chiều (One-Way Analysis)
Trường hợp so sánh Số trung bình giữa các nhóm khác nhau trên cùng một
tiêu thức nào đó của cùng một dữ liệu chéo. Bấm chọn:
Analyze  Compare Means  One-Way ANOVA.
Chọn tiêu thức
phân nhóm
Chọn tiêu thức
cần so sánh
Chọn so sánh
bội (nếu cần)
Thao tác như trong hình trên. Cuối cùng bấm chọn OK.
Lưu ý: Tiêu thức phân nhóm phải có kiểu Numeric. Nếu cần, có thể đổi kiểu dữ
liệu sang kiểu Numeric như được trình bày ở phần nhập liệu.
Nếu bấm chọn so sánh bội, ta có của sổ:
Nguyễn Văn Cang
24
Xử lý dữ liệu trên SPSS
Chọn loại so
sánh bội
Nhập α
Bấm chọn loại phương pháp so sánh bội. Nhập độ ý nghĩa α. Cuối cùng bấm
chọn Continue để quay lại cửa sổ One-Way ANOVA.
Ta thu được kết quả so sánh bội có dạng như sau:
Student-Newman-Keuls
‘lsc’
N
1
2
4
3
Sig.
5
5
5
5
Subset for alpha = .05
1
2
29,0000
46,0000
69,6000
83,4000
,078
,146
Từ 2 cột cuối ta biết được sự bằng nhau của hai cặp nhóm ‘lsc’ sau :
lsc1
lsc2
lsc4
lsc3
Trường hợp so sánh Số trung bình từ dữ liệu của một thiết kế ngẫu nhiên
hoàn toàn.
Ta nhập dữ liệu của thiết kế này theo 2 biến kiểu Numeric sau:
- Biến ‘X’: Nhập toàn bộ dữ liệu (xij) của thiết kế;
- Biến ‘T’: Nhập số thứ tự 1, 2,… t của t xử lý tương ứng với xij.
Sau đó, các thao tác kiểm định khác được tiến hành tương tự như trên.
7.2. Phân tích phương sai hai chiều không tương tác (Two-Way Analysis
without interaction) cho thiết kế khối ngẫu nhiên
Từ dữ liệu thiết kế khối ngẫu nhiên, ta nhập 3 biến kiểu Numeric sau:
- Biến ‘X’: Nhập toàn bộ dữ liệu (xij) của thiết kế;
- Biến ‘t’: Nhập số thứ tự 1, 2,… t của t xử lý tương ứng với các xij.
- Biến ‘b’: Nhập số thứ tự 1, 2,… b của b tác nhân ngoại lai tương ứng với xij;
Nguyễn Văn Cang
25
Xử lý dữ liệu trên SPSS
Sau khi nhập liệu xong, bấm chọn:
Analyze  General Linear Model  Univariate.
Trong cửa sổ Univariate.
Chọn biến ‘X’
Chọn biến ‘t’
và ‘b’ làm yếu
tố mô hình
Nguyễn Văn Cang
26
Xử lý dữ liệu trên SPSS
Trên cửa sổ Univariate chọn biến ‘x’ chuyển sang ô Dependent Variable, chọn
biến ‘b’, ‘t’ chuyển sang ô Fixed Factor(s). Sau đó, bấm chọn ô Model để vào cửa sổ
Univariate: Model.
Chỉ định
mô hình
Chọn biến
Chọn
‘b’ vàbiến
‘t’
‘B’
và
làm các‘T’
yếu
làm
cáchình
tố mô
Chọn Main
effects
Trong cửa sổ Univariate: Model, trước hết ta chỉ định mô hình bằng cách chọn
Custom. Tiếp đến, chọn biến ‘t’ và ‘b’ trong ô Facstors & Covariantes chuyển sang
ô Model. Sau đó, chọn Main effects. Chọn Continue để quay lại cửa sổ Univariate.
Chú ý: Phải chọn ô Include intercept in model nếu không mô hình sẽ bị sai.
Cuối cùng chọn OK. Ta được kết quả phân tích phương sai như trong phần in
đậm ở bảng dưới:
Dependent Variable: X
Source
Type III
Sum of quares
df
Mean
Square
F
Sig.
,000
,000
Corrected Model
Intercept
5455,50
57840,25
6
1
909,3
57840,3
14,25
906,51
B
T
Error
5392,75
62,75
574,25
3
3
9
1797,6
20,9
63,8
28,17 ,000
,33 ,805
63870,00
16
6029,75
15
Total
Corrected
Total
Phần in đậm trong bảng trên là những thông tin cần thiết của phương pháp
phân tích phương sai cho mô hình thiết kế khối.
Nguyễn Văn Cang
27
Xử lý dữ liệu trên SPSS
Chú ý: Nếu muốn so sánh bội, trong cửa sổ Univariate ở trang trước, bấm
chọn Post Hoc ta được cửa sổ sau:
Chọn
Chọnyếu
yếutốtố
sososánh
sánhbội
bội
Chọn phương
pháp so sánh bội
Sau khi thao tác như hình trên. Bấm chọn ô Continue để quay lại cửa sổ
Univariate. Chọn OK.
Kết quả so sánh bội có dạng như sau:
Student-Newman-Keuls
‘b’
N
1
2
3
4
Sig.
4
4
4
4
1
35,2500
Subset
2
3
50,2500
1,000
1,000
73,7500
81,2500
,217
Từ cột Subset ta biết được chỉ có cặp Blocks 3 và 4 là bằng nhau:
B1
B2
B3
B4
7.3. Phân tích phương sai ba chiều không tương tác (Three-Way Analysis
without interaction) cho thiết kế vuông ngẫu nhiên
Từ dữ liệu thiết kế vuông ngẫu nhiên, ta nhập 4 biến sau:
- Biến ‘X’: Nhập toàn bộ dữ liệu (xij) của thiết kế;
- Biến ‘r’: Nhập số thứ tự 1, 2,… t của các tác nhân ngoại lai theo dòng tương
ứng với các xij;
- Biến ‘c’: Nhập số thứ tự 1, 2,… t của các tác nhân ngoại lai theo cột tương
ứng với các xij;
- Biến ‘t’: Nhập số thứ tự 1, 2,… t của các xử lý tương ứng với các xij.
Nguyễn Văn Cang
28
Xử lý dữ liệu trên SPSS
Sau đó, bấm chọn: Analyze  General Linear Model  Univariate.
Chọn biến ‘x’
Chọn biến
‘t’, ‘c’ và
‘r’ làm yếu
tố mô hình
Nguyễn Văn Cang
29
Xử lý dữ liệu trên SPSS
Bấm chọn ô Model, ta vào cửa sổ:
Chỉ định
mô hình
Chọn
Chọnbiến
biến‘t’,
‘B’
‘c’vàvà‘T’
‘r’làm
làmcác
yếu
yếutốtốmô
của
hình
mô
Chọn Main effects
Các thao tác trên hình tương tự mục 7.2.
Ta được kết quả phân tích phương sai như trong phần in đậm ở bảng dưới:
Dependent Variable: X
Type III
Source
Sum of Squares
Mean
Square
df
F
Sig.
Corrected Model
Intercept
5636,625
57840,250
9
1
626,292
9,559
57840,250 882,776
R
C
T
Error
181,125
62,750
5392,750
393,125
3
3
3
6
60,375
,921 ,485
20,917
,319 ,812
1797,583 27,435 ,001
65,521
63870,000
16
6029,750
15
Total
Corrected
Total
,006
,000
Nếu chọn so sánh bội giữa các Xử lý (Treatments), bấm chọn ô Post Hoc rồi
thao tác như ở mục 7.1 ta được kết quả:
Student-Newman-Keuls
Nguyễn Văn Cang
‘t’
N
3
2
1
4
Sig.
4
4
4
4
1
35,2500
Subset
2
3
50,2500
1,000
30
1,000
73,7500
81,2500
,238
Xử lý dữ liệu trên SPSS
Từ cột Subset ta biết được chỉ có cặp xử lý 1 và 4 là bằng nhau:
T3
T2
T1
T4
7.4. Phân tích phương sai hai chiều và tương tác (Two-Way Analysis with
interaction) cho thiết kế thừa số ngẫu nhiên
Từ dữ liệu thiết kế thừa số ngẫu nhiên, ta nhập 3 biến sau:
- Biến ‘X’: Nhập toàn bộ dữ liệu (xijk) của thiết kế;
- Biến ‘A’: Nhập số thứ tự 1, 2,… a của a tác nhân của yếu tố A tương ứng với
xijk;
- Biến ‘B’: Nhập số thứ tự 1, 2,… b của b tác nhân của yếu tố B tương ứng với
xijk.
Sau khi nhập liệu xong, bấm chọn:
Analyze  General Linear Model  Univariate.
Nguyễn Văn Cang
31
Xử lý dữ liệu trên SPSS
Chọn biến ‘x’
Chọn biến ‘a’
và ‘b’ làm yếu
tố mô hình
Chỉ định
mô hình
Các thao tác trên cửa sổ Univariate tương tự mục 7.2. Trong cửa sổ
Univariate: Model chỉ cần chỉ định mô hình là Full factorial.
Ta được kết quả phân tích phương sai như trong phần in đậm ở bảng dưới:
Dependent Variable: X
Type III
Sum of
Squares
df
Mean
Square
Corrected Model 166,447
Intercept
7540,053
8
1
20,806
4,569
7540,053 1655,941
Source
A
B
A*B
Error
144,109
14,907
7,431
81,960
2
2
4
18
Total
7788,460
27
Corrected
Total
248,407
26
72,054
7,453
1,858
4,553
F
15,825
1,637
,408
Sig.
,004
,000
,000
,222
,800
Nếu muốn so sánh bội, bấm chọn ô Post Hoc rồi thao tác như ở mục 7.1
Nguyễn Văn Cang
32
Xử lý dữ liệu trên SPSS
8. Hồi qui
8.1. Hồi qui mối liên hệ giữa hai tiêu thức định lượng
Dựa trên dữ liệu chéo, ta tiến hành hồi qui như sau:
Bấm chọn : Analyze  Regression  Curve Estimation.
Chọn tiêu thức
phụ thuộc
Chọn các
mô hình
mong muốn
Chọn
tiêu
thức
độc lập
Chọn kiểm định
độ phù hợp
Chú ý:
* Chỉ có các tiêu thức kiểu Mumeric mới hồi qui được;
* Muốn biết dạng toán học của một mô hình cần chọn thì để trỏ chuột lên chữ
của mô hình đó và ấn nút chuột phải;
* Nếu chưa biết chắc mô hình cần hồi qui thì nên bấm chọn hồi qui thử trên
nhiều mô hình cùng một lúc (chưa nên bấm chọn Display ANOVA table và Save).
Dựa vào bảng kết quả hồi qui thử cho các mô hình, mô hình nào có hình dáng phù
hợp và có Adjusted R Square lớn thì mới được chọn chính thức. Sau đó, bấm chọn
Reset để hủy các thao tác hồi qui lần đầu, tiến hành trở lại đầy đủ các thao tác ở
hình trên cho mô hình đã được lựa chọn.
* Các kết quả dự đoán chỉ tính trên các giá trị hiện có của tiêu thức độc lập.
Các kết quả dự đoán được kết xuất trên cửa sổ dữ liệu.
Nếu muốn dự đoán bấm chọn ô Save, ta được cửa sổ:
Nguyễn Văn Cang
33
Xử lý dữ liệu trên SPSS
Chọn dự
đoán điểm
Chọn dự
đoán khoảng
Bấm chọn ô Continue để quay lại.
8.2. Hồi qui mối liên hệ tuyến tính giữa nhiều tiêu thức định lượng
Dựa trên dữ liệu chéo, ta tiến hành hồi qui như sau:
Bấm chọn : Analyze  Regression  Linear. Ta có cửa sổ sau:
Chọn
các tiêu
thức
độc lập
Chọn tiêu thức
phụ thuộc
Chọn
cách
tiếp cận
mô hình
Chọn kiểm
tra vi phạm
các giả thiết
Chú ý:
- Chỉ có các tiêu thức kiểu Mumeric mới hồi qui được;
- Có các cách tiếp cận mô hình hồi qui bội sau:
* Enter: Đưa vào mô hình hồi qui tất cả các biến độc lập;
*Backward: Loại trừ dần dần các biến độc lập không phù hợp;
*Forward: Đưa dần các biến độc lập vào cho đến khi mô hình thu được vẫn
còn bảo đảm ý nghĩa;
* Stepwise: Kết hợp giữa Backward và Forward.
Nguyễn Văn Cang
34
Xử lý dữ liệu trên SPSS
Phát hiện
đa cộng
tuyến
Phát hiện
tự tương
quan
Thao tác như trong hình trên. Cuối cùng chọn OK.
Nếu muốn dự đoán bấm chọn ô Save, ta có cửa sổ sau:
Dự đoán
phần dư
Dự đoán điểm tiêu
thức phụ thuộc
Dự đoán khoảng
tiêu thức phụ thuộc
Sau khi thao tác như hình trên, bấm chọn Continue để quay lại cửa sổ Linear
Regression.
Chú ý:
Nguyễn Văn Cang
35
Xử lý dữ liệu trên SPSS
* Các kết quả dự đoán chỉ tính trên các giá trị hiện có của tiêu thức độc lập.
Các kết quả dự đoán được kết xuất trên cửa sổ dữ liệu.
* Nếu mô hình yêu cầu không có hệ số chặn (dùng trên dữ liệu biến đổi để
khắc phục hiện tượng phương sai không đồng nhất), bấm chọn ô Options để vào cửa
sổ sau:
Chọn có hay không
có hệ số chặn
Sau khi thao tác như hình trên, bấm chọn Continue để quay lại cửa sổ Linear
Regression.
9. Kiểm soát chất lượng bằng thống kê
9.1. Biểu đồ kiểm soát số trung bình và độ lệch chuẩn
Nhập dữ liệu theo hai biến: Biến xij phản ảnh giá trị j của mẫu i; Biến “mau”
phản ảnh thứ tự mẫu.
Nguyễn Văn Cang
36
Xử lý dữ liệu trên SPSS
Bấm chọn : Analyze  Quality Control  Control charts. Ta có cửa sổ sau:
Chọn loại
biểu đồ
Chọn loại
dữ liệu
Chọn các
khai báo
Chọn biến
kiểm soát
Chọn biến
các mẫu
Chọn chỉ số
năng lực
Chọn biểu đồ
trung bình
Chọn biểu
đồ 
Nguyễn Văn Cang
37
Xử lý dữ liệu trên SPSS
Nhập các
giới hạn
Chọn chỉ
số năng
lực
9.2. Biểu đồ kiểm soát tỉ lệ
Ta nhập dữ liệu theo ba biến như sau:
Mẫu
1
1
2
2
…
20
20
Lỗi
1
0
1
0
…
1
0
Tần số
1
299
5
295
…
1
299
Trong đó, Lỗi =1: sản phẩm có lỗi, Lỗi =0: sản phẩm không có lỗi.
Sau đó, chỉ định tần số cho dữ liệu bằng cách bấm chọn Data  Weight
Cases.
Chọn tần
số
Nguyễn Văn Cang
38
Xử lý dữ liệu trên SPSS
Bấm chọn : Analyze  Quality Control  Control charts. Ta có cửa sổ sau:
Chọn loại
biểu đồ
Chọn loại
dữ liệu
Chọn các
khai báo
Chọn biến
kiểm soát
Chọn giá
trị kiểm
soát lỗi
Chọn biến
mẫu kiểm
tra
Chọn loại
biểu đồ
Chọn OK. Kết quả thu được như sau:
Nguyễn Văn Cang
39
Xử lý dữ liệu trên SPSS
Nguyễn Văn Cang
40
Xử lý dữ liệu trên SPSS
Download