THỐNG KÊ ỨNG DỤNG TRONG KINH TẾ VÀ KINH DOANH Anderson Sweeney Williams Slides by John Loucks St. Edward’s University © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Slide 1 Chương 3, Phần A Thống kê mô tả: Các đại lượng số Đo lường vị trí Đo lường độ phân tán © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Slide 2 Đại lượng đo lường vị trí Trung bình Trung vị Mode Phân vị Tứ phân vị Nếu các tính toán cho dữ liệu từ một mẫu , gọi là thống kê mẫu. Nếu các tính toán cho dữ liệu từ tổng thể, gọi là tham số tổng thể. Thống kê mẫu được gọi là ước lượng điểm của tham số tổng thể tương ứng © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Slide 3 Trung bình (Mean) Đại lượng quan trọng nhất để đo lường vị trí là trung bình . Trung bình là đại lượng đo lường vị trí trung tâm. Trung bình của tập dữ liệu là trung bình của tất các các giá trị dữ liệu Trung bình mẫu x là ước lượng điểm của trung bình tổng thể m. © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Slide 4 Trung bình mẫu x x x Tổng các giá trị của n quan sát i n Số lượng quan sát trong mẫu © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Slide 5 Trunh bình m m x Tổng các giá trị của N quan sát i N Sô lượng quan sát trong tổng thể © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Slide 6 Trung bình mẫu Ví dụ: Apartment Rents 70 căn hộ được lấy mẫu ngẫu nhiêntại một làng đại học nhỏ. Giá thuê hàng tháng của những căn hộ này được liệt kê dưới đây: 445 440 465 450 600 570 510 615 440 450 470 485 515 575 430 440 525 490 580 450 490 590 525 450 472 470 445 435 435 425 450 475 490 525 600 600 445 460 475 500 535 435 460 575 435 500 549 475 445 600 445 460 480 500 550 435 440 450 465 570 500 480 430 © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 615 450 480 465 480 510 440 Slide 7 Trung bình mẫu Ví dụ: Apartment Rents xi 34.356 x n 70 445 440 465 450 600 570 510 615 440 450 470 485 515 575 430 440 525 490 580 450 490 590 525 450 472 470 445 435 435 425 450 475 490 525 600 600 445 460 475 500 535 435 490,80 460 575 435 500 549 475 445 600 445 460 480 500 550 435 440 450 465 570 500 480 430 © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 615 450 480 465 480 510 440 Slide 8 Trung vị (Median) Trung vị của dữ liệu là giá trị đứng ở vị trí giữa khi các giá trị của dữ liệu được xếp theo thứ tự tăng dần Khi tập dữ liệu có những giá trị bất thường, trung vị là thước đo ưu tiên cho vị trí trung tâm Trung vị thường được dùng làm thước đo vị trí cho dữ liệu về thu nhập vá giá trị tài sản hàng năm Một vài giá trị thu nhập hoặc tài sản rất lớn có thể ảnh hưởng đến trung bình. © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Slide 9 Trung vị Với số lượng quan sát lẻ: 26 18 27 12 14 27 12 14 18 19 27 27 26 19 7 Quan sát Được xếp tăng dần Trung vị là giá trị ở giữa. Trung vị = 19 © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Slide 10 Trung vị Với số lượng quan sát chẵn: 26 18 27 12 14 27 30 19 12 18 19 27 27 30 14 26 8 quan sát Được xếp tăng dần Trung vị là trung bình của 2 giá trị đứng ở giữa. Trung vị = (19 + 26)/2 = 22,5 © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Slide 11 Trung vị Ví dụ: Apartment Rents Trung bình 2 giá trị ở vị trí 35 và 36: Trung vị = (475 + 475)/2 = 475 425 440 450 465 480 510 575 430 440 450 470 485 515 575 430 440 450 470 490 525 580 435 445 450 472 490 525 590 435 445 450 475 490 525 600 435 445 460 475 500 535 600 435 445 460 475 500 549 600 435 445 460 480 500 550 600 440 450 465 480 500 570 615 440 450 465 480 510 570 615 Lưu ý: Dữ liệu đã được xếp tăng dần © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Slide 12 Trimmed Mean Một đại lượng khác, thỉnh thoảng đượcdùng khi xuất hiện những giá trị ngoại lệ đó là trimmed mean. Nó được tính bằng cách loại đi phần trăm những giá trị nhỏ nhất và giá trị lớn nhất của tập dữ liệu sau đó tính trung bình cho những giá trị còn lại. Ví dụ, the 5% trimmed mean có nghĩa là bỏ đi 5% giá trị nhỏ nhất và 5% giá trị lớn nhất của dữ liệu sau đó tính trung bình các giá trị còn lại. © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Slide 13 Mốt (Mode) Mode của tập dữ liệu là giá trị có tần số xuất hiện lớn nhất. Tần số lớn nhất có thể ở 2 hai nhiều giá trị khác nhau. Nếu dữ liệu có 2 mode, dữ liệu là bimodal. Nếu dữ liệu có nhiều hơn 2 mode, dữ liệu là multimodal. Lưu ý: Nếu dữ liệu có hai hay nhiều mode , thì hàm MODE trong excel sẽ chỉ xác định được 1 mode. © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Slide 14 Mốt (Mode) Ví dụ: Apartment Rents 450 xuất hiện nhiều nhất (7 lần) Mode = 450 425 440 450 465 480 510 575 430 440 450 470 485 515 575 430 440 450 470 490 525 580 435 445 450 472 490 525 590 435 445 450 475 490 525 600 435 445 460 475 500 535 600 435 445 460 475 500 549 600 435 445 460 480 500 550 600 440 450 465 480 500 570 615 440 450 465 480 510 570 615 Lưu ý: Dữ liệu được xếp tăng dần. © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Slide 15 Phân vị Phân vị cung cấp thông tin về cách thức dữ liệu được trải ra trong một khoảng từ giá trị nhỏ nhất đến giá trị lớn nhất. Các trường Cao đẳng và đại học thường xuyên báo cáo kết quả kiểm tra đầu vào dưới dạng phân vị. Phân vị thứ p của tập dữ liệu là một giá trị mà ít nhất p phần trăm các quan sát có giá trị nhỏ hơn hoặc bằng giá trị này và ít nhất có (100 - p) phần trăm các quan sát có giá trị lớn hơn hoặc bằng giá trị này. © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Slide 16 Phân vị Xếp dữ liệu theo thứ tự tăng dần. Tính chỉ số i, vị trí của phân vị thứ p. i = (p/100)n Nếu i không phải là số nguyên, làm tròn nó. Phân vị thứ p là giá trị ở vị trí i. Nếu i là một số nguyên, phân vị thứ p là trung bình của hai giá trị ở vị trí i và i+1. © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Slide 17 Phân vị thứ 80 Ví dụ: Apartment Rents i = (p/100)n = (80/100)70 = 56 Trung bình giá trị ở 2 vị trí 56 và 57: Phân vị 80 = (535 + 549)/2 = 542 425 440 450 465 480 510 575 430 440 450 470 485 515 575 430 440 450 470 490 525 580 435 445 450 472 490 525 590 435 445 450 475 490 525 600 435 445 460 475 500 535 600 435 445 460 475 500 549 600 435 445 460 480 500 550 600 440 450 465 480 500 570 615 440 450 465 480 510 570 615 Lưu ý: Dữ liệu được xếp tăng dần. © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Slide 18 Phân vị 80 Ví dụ: Apartment Rents “Ít nhất 80% quan sát nhỏ hơn hoặc bằng 542.” “Ít nhất 20% quan sát lớn hơn hoặc bằng 542.” 56/70 = 0,8 hoặc 80% 425 440 450 465 480 510 575 430 440 450 470 485 515 575 430 440 450 470 490 525 580 435 445 450 472 490 525 590 14/70 = 0,2 hoặc 20% 435 445 450 475 490 525 600 435 445 460 475 500 535 600 435 445 460 475 500 549 600 435 445 460 480 500 550 600 440 450 465 480 500 570 615 © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 440 450 465 480 510 570 615 Slide 19 Tứ phân vị Tứ phân vị là một phân vị đặc biệt Tứ phân vị thứ nhất = phân vị thứ 25 Tứ phân vị thứ hai = Phân vị thứ 50 = Trung vị Tứ phân vị = Phân vị thứ 75 © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Slide 20 Tứ phân vị thứ 3 Ví dụ: Apartment Rents Tứ phân vị thứ 3 = Phân vị thứ 75 i = (p/100)n = (75/100)70 = 52,5 = 53 Tứ phân vị thứ 3 = 525 425 440 450 465 480 510 575 430 440 450 470 485 515 575 430 440 450 470 490 525 580 435 445 450 472 490 525 590 435 445 450 475 490 525 600 435 445 460 475 500 535 600 435 445 460 475 500 549 600 435 445 460 480 500 550 600 440 450 465 480 500 570 615 440 450 465 480 510 570 615 Lưu ý: Dữ liệu được xếp tăng dần. © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Slide 21 Đo lường độ phân tán Chúng ta thường mong muốn xem xét các đại lượng đo lường sự phân tán (biến thiên), cũng như là đo lường vị trí. Ví dụ, trong việc chọn lưa nhà cung cấp dịch vụ giao hàng A hoặc B, chúng ta không chỉ xem xét thời gian giao hàng trung bình, mà còn xem xét biến thiên thời gian giao hàng của mỗi nhà cung cấp. © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Slide 22 Đo lường độ phân tán Khoảng biến thiên (Range) Độ trải giữa (Interquartile Range) Phương sai (Variance) Độ lệch chuẩn (Deviation) Hệ số biến thiên (Coefficient of Variation) © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Slide 23 Khoảng biến thiên (Range) Khoảng biến thiên của một tập dữ liệu là chênh lệch giữa giá trị lớn nhất và giá trị nhỏ nhất. Nó là đại lượng đơn giản nhất để đo lường độ phân tán. Nó rất nhạy với giá trị dữ liệu nhỏ nhất và lớn nhất. © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Slide 24 Khoảng biến thiên (Range) Ví dụ: Apartment Rents Khoảng biến thiên = giá trị lớn nhất – giá trị nhỏ nhất Range = 615 - 425 = 190 425 440 450 465 480 510 575 430 440 450 470 485 515 575 430 440 450 470 490 525 580 435 445 450 472 490 525 590 435 445 450 475 490 525 600 435 445 460 475 500 535 600 435 445 460 475 500 549 600 435 445 460 480 500 550 600 440 450 465 480 500 570 615 440 450 465 480 510 570 615 Lưu ý: Dữ liệu được xếp tăng dần © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Slide 25 Độ trải giữa (Interquartile Range) Độ trải giữa của tập dữ liệu là chênh lệch giữa tứ phân vị thứ ba và tứ phân vị thứ nhất. Nó là khoảng biến thiên của 50% dữ liệu ở giữa của dãy số. Nó không bị ảnh hưởng bởi giá trị ngoại lệ. © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Slide 26 Độ trải giữa (Interquartile Range) Ví dụ: Apartment Rents Tứ phân vị thứ ba (Q3) = 525 Tứ phân vị thứ nhất (Q1) = 445 Độ trải giữa = Q3 - Q1 = 525 - 445 = 80 425 440 450 465 480 510 575 430 440 450 470 485 515 575 430 440 450 470 490 525 580 435 445 450 472 490 525 590 435 445 450 475 490 525 600 435 445 460 475 500 535 600 435 445 460 475 500 549 600 435 445 460 480 500 550 600 440 450 465 480 500 570 615 440 450 465 480 510 570 615 Lưu ý: Dữ liệu được xếp tăng dần. © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Slide 27 Phương sai (Variance) Phương sai là một đại lượng đo lường phân tán mà sử dụng tất cả dữ liệu. Nó dựa trên chênh lệch giữa giá trị của mỗi quan sát (xi) và trung bình ( x dùng cho mẫu , m cho tổng thể). Phương sai rất hữu ích trong việc so sánh độ phân tán của hai hay nhiều biến. © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Slide 28 Phương sai (Variance) Phương sai là trung bình của bình phương sai lệch giữa mỗi giá trị dữ liệu với trung bình. Phương sai được tính như sau: 2 ( xi x ) s n 1 Mẫu 2 ( xi m ) N 2 2 Tổng thể © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Slide 29 Độ lệch chuẩn (Standard Deviation) Độ lệch chuẩn của tập dữ liệu là căn bậc hai của phương sai Nó được đo bằng đơn vị giống với dữ liệu, nên sẽ dễ dàng giải thích hơn so với phương sai. © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Slide 30 Độ lệch chuẩn (Standard Deviation) Độ lệch chuẩn được tính như sau: s s2 2 Mẫu Tổng thể © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Slide 31 Hệ số biến thiên (Coefficient of Variation) Hệ số biến thiên là chỉ số cho biết độ lệch chuẩn lớn bằng bao nhiêu lần so với trung bình. Hệ số biến thiên được tính như sau: s 100 % x 100 % m Mẫu Tổng thể © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Slide 32 Phương sai, độ lệch chuẩn, hệ số biến thiên của mẫu Ví dụ: Apartment Rents • Phương sai s2 2 ( x x ) i n1 2.996, 16 • Độ lệch chuẩn s s 2 2996, 16 54,74 • Hệ số biến thiên 54,74 s 100 % 100 % x 490, 80 Độ lệch chuẩn là khoảng 11% trung bình 11, 15% © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Slide 33 Kết thúc Chương 3, Phần A © 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Slide 34