CHƯƠNG 1. TỔNG QUAN VỀ THỐNG KÊ HỌC 1.1. Danh sách các sinh viên được cho trong bảng sau: Tên sinh viên Nguyễn Lê Thùy Bùi Thị Trâm Đặng Thị Ngọc Trần Thị Ngọc Phan Nhân Hoàng Nhân Lục Thị An Anh Ánh Ánh Bảo Bảo Biên Năm sinh Giới tính Quê quán Điểm thi môn TK 1984 1985 1982 1981 1985 1986 1979 Nữ Nữ Nữ Nữ Nam Nam Nữ Lâm Đồng Huế Bắc Ninh Hà Nội Lâm Đồng Quảng Nam Hà Nội 8 7 7 5 6 6 6 a. Có bao nhiêu phần tử trong tập dữ liệu? b. Có bao nhiêu biến trong tập dữ liệu? c. Bao nhiêu biến định tính, bao nhiêu biến định lượng? d. Các loại thang đo được dùng tương ứng với từng biến? 1.2. Hãy xác định loại dữ liệu trong các ví dụ sau: a. Lương khởi điểm của sinh viên vừa tốt nghiệp b. Tên các công ty sinh viên vừa tốt nghiệp vào làm việc c. Mã số sinh viên 1.3. Hãy xác định các biến sau thuộc loại định lượng hay định tính và thang đo của chúng a. Tuổi b. Giới tính c. Nhãn hiệu điện thoại di động d. Số học sinh yêu thích môn học thống kê e. Doanh số hàng năm f. Kích cỡ nước ngọt (nhỏ, trung, lớn) g. Phân loại sinh viên (trung bình, khá, giỏi) h. Phương thức thanh toán học phí (tiền mặt, thẻ tín dụng) 1.4. Các cổ động viên bóng đá thường xuyên được hỏi ý kiến về môn thể thao yêu thích của họ. Người ta chọn 100 cổ động viên và hỏi các câu sau: a. Một năm bạn xem bao nhiêu trận đấu? b. Bạn đánh giá mức độ hấp dẫn của các trận đấu: tuyệt vời, tốt, trung bình, kém, rất kém? c. Trung bình bạn chi hết bao nhiêu tiền để mua đồ ăn và thức uống cho từng trận? d. Đánh giá chất lượng các mặt sân: tốt, trung bình, kém? Yêu cầu: xác định loại dữ liệu thu thập và thang đo? 1.5. Sở văn hóa thông tin Lâm Đồng thu thập thông tin từ du khách đến Đà Lạt. Các câu hỏi sau nằm trong 16 câu hỏi của một bảng câu hỏi được phát cho khách du lịch khi họ đi máy bay tới Đà Lạt trong 6 tháng năm 2011. 1. Chuyến du lịch tới Đà Lạt này là chuyến thứ mấy của bạn? a. 1 b. 2 c. 3 d. Nhiều hơn 3 2. Lý do chính cho chuyến du lịch này? (có 10 loại câu trả lời bao gồm: công tác, nghỉ dưỡng, trăng mật…) 3. Nơi bạn sẽ ở? (có 11 loại câu trả lời bao gồm: khách sạn, nhà nghỉ nhà người quan, lều trại…) 4. Tổng số ngày bạn ở Đà Lạt? Yêu cầu: a. Tổng thể nghiên cứu là gì? b. Bảng câu hỏi có phải là một cách tốt để thu thập thông tin trong trường hợp trên hay không? c. Dữ liệu thu thập từ các câu hỏi trên là dữ liệu định tính hay định lượng? 1.6. Tạp chí Condé Nast Traveler thực hiện một cuộc khảo sát hàng năm người đọc để xác định nơi lưu trú tốt nhất trên toàn thế giới. Tên nơi lưu trú Quốc gia Giá phòng Số lượng phòng Điểm đánh giá chung Graveteye Manor Villa d’Este Hotel Prem Hotel d’Europe Palace Luzern Royal Crescent Hotel Hotel Sacher Duc de Bourgogne Anh Ý Đức Pháp Thụy Sỹ Anh Áo Bỉ $$ $$$$ $ $$ $$ $$$ $$$ $ 18 166 54 47 326 45 120 10 83,6 86,3 77,8 76,8 80,9 73,7 85,5 76,9 Pháp $$ 22 90,6 Villa Gallici Nguồn: Condé Nast Traveler, tháng 2 năm 2000 a. b. c. d. e. f. g. h. Có bao nhiêu phần tử trong tập dữ liệu này? Có bao nhiêu biến trong tập dữ liệu này? Biến nào là định tính và biến nào là định lượng? Thang đo của từng biến này là gì? Số phòng trung bình của 9 khách sạn này là bao nhiêu? Hãy tính điểm đánh giá chung toàn bộ Phần trăm khách sạn nằm ở nước Anh? Phần trăm khách sạn có giá phòng ở mức $$? CHƯƠNG 2. TÓM TẮT VÀ TRÌNH BÀY DỮ LIỆU BẰNG BẢNG VÀ ĐỒ THỊ 2.1. Cuộc khảo sát nghiên cứu 3 loại sản phẩm A, B, C. Trong số 120 khách hàng được hỏi có 60 người chọn A, 24 người chọn B, 36 người chọn C. Thiết lập bảng phân phối tần số và tần suất? 2.2. Một phần của bảng phân phối tần suất được cho như sau: Tổ Tần suất A B C D 0,22 0,18 0,40 a. Tần suất của tổ D? b. Tổng kích cỡ mẫu là 200. Hỏi tần số của tổ D? 2.3.Trong một cuộc điều tra có 58 câu trả lời Có, 42 câu trả lời Không, 20 câu trả lời Không ý kiến. a. Sử dụng đồ thị hình tròn (Pie chart), bao nhiêu độ trong hình tròn biểu thị câu trả lời Có? b. Sử dụng đồ thị hình tròn (Pie chart), bao nhiêu độ trong hình tròn biểu thị câu trả lời Không? c. Vẽ đồ thị hình tròn. d. Vẽ đồ thị hình thanh. 2.4.Theo thứ tự chữ cái, sáu cái tên phổ biến nhất tại Hoa Kỳ là Brown, Davis, Johnson, Jones, Smith và Williams (The World Almanac, 2006). Giả sử một mẫu 50 người với tên được liệt kê sau đây: Brown Smith Davis Johnson Williams Williams Johnson Jones Davis Williams Jones Smith Smith Davis Johnson Smith Jones Jones Williams Smith Brown Smith Johnson Jones Smith Smith Williams Williams Johnson Williams Johnson Williams Smith Brown Smith Davis Brown Smith Johnson Brown Johnson Brown Jones Davis Smith Jones Johnson Brown Johnson Davis Tóm tắt dữ liệu bằng cách xây dựng a. Phân phối tần số và phân phối tần suất phần trăm b. Biểu đồ thanh c. Biểu đồ tròn d. Dựa vào dữ liệu, ba cái tên phổ biến nhất là gì? 2.5. Một công ty cung cấp dịch vụ cho thuê DVD hơn 50.000 tựa đề qua mail, trước khi đặt hàng, khách hàng có thể xem mô tả của đĩa DVD, và nếu muốn sẽ có một bản tóm tắt đánh giá. Công ty sử dụng một hệ thống đánh giá năm sao với các mô tả sau đây: 1 sao – Ghét; 2 sao – Không thích; 3 sao – Thích; 4 sao – Thực sự thích; 5 sao – Rất thích. Có 18 nhà phê bình, cung cấp xếp hạng cho bộ phim Batman Begins (Netflix.com, 01/03/2006) như sau: 4, 2, 5, 2, 4, 3, 3, 4, 4, 3, 4, 4, 4, 2, 4, 4, 5, 4 a. Nguồn dữ liệu trên là định tính hay định lượng? b. Xây dựng phân phối tần số và tần suất của đữ liệu c. Xây dựng biểu đồ thanh d. Nhận xét về đánh giá của các nhà phê bình phim Batman Begins 2.6.Cho các dữ liệu sau 14 19 24 19 16 20 24 20 21 22 24 18 17 23 26 22 23 25 25 19 18 16 15 24 21 16 19 21 23 20 22 22 16 16 16 12 25 19 24 20 a. Xây dựng phân phối tần số với các nhóm là 12-14; 15-17; 18-20; 21-23; 24-26 b. Xây dựng phần phối tần suất và tần suất phần trăm 2.7.Hãy xem xét phân phối tần số sau Tổ Tần số 10-19 20-29 30-39 40-49 15 22 26 17 Hãy xây dựng phân phối tần số tích lũy và phân phối tần suất tích lũy. 2.8. Số sản phẩm bị bác bỏ của một nhà máy được ghi nhận trong thời gian 25 ngày vừa qua như sau: 21 8 17 22 19 18 19 14 17 11 6 21 19 9 12 16 16 10 29 24 6 21 20 25 25 Xây dựng bảng phân phối tần số cho các dữ liệu này? Số lớp bằng 5. 2.9. Nhân viên của một bác sĩ nghiên cứu thời gian chờ của bệnh nhân đến văn phòng với yêu cầu dịch vụ khẩn cấp. Các dữ liệu sau là thời gian chờ đợi tính bằng phút được thu thập trong khoảng thời gian một tháng: 2; 5; 10; 12; 4; 4; 5; 17; 11; 8; 9; 9; 12; 21; 6; 8; 7; 13; 18; 3 Với phân nhóm 0-4; 5-9 và tiếp theo như vậy a. Cho biết phân phối tần số, tần suất, tần số tích lũy, tần suất tích lũy? b. Tỷ lệ bệnh nhân chờ dịch vụ khẩn ít hơn 9 phút? 2.10. Hãy xây dựng biểu đồ nhánh lá với dữ liệu sau: 70 76 72 75 75 68 64 65 58 57 83 78 80 85 82 72 Hãy xây dựng biểu đồ nhánh lá với dữ liệu sau: 2.11. 11,3 9,3 9,6 8,1 7,5 7,5 8,3 8,4 10,5 6,3 10,0 8,8 Hãy xây dựng biểu đồ nhánh lá với dữ liệu sau: 2.12. 1161 1221 2.13. 10,4 7,7 1206 1378 1478 1623 1300 1426 1604 1557 1725 1730 1361 1706 1422 1689 Các giá trị đơn hàng được ghi nhận như sau: 75 66 77 66 64 73 91 65 59 86 61 86 61 58 70 77 80 58 94 78 62 79 83 54 52 45 82 48 67 75 a. Xây dựng đồ thị nhánh và lá cho các dữ liệu này b. Xây dựng bảng phân phối tần số, tần suất cho dữ liệu này với số lớp bằng 6. c. Tỷ lệ đơn đặt hàng có giá trị nhỏ hơn hay bằng 70? Lớn hơn 70? CHƯƠNG 3. TRÌNH BÀY DỮ LIỆU BẰNG ĐẠI LƯỢNG SỐ 3.1. Một mẫu có giá trị như sau: 15, 12, 16, 20, 18. Tính giá trị trung bình và số trung vị? 3.2. Tiền lương của công nhân trong một phân xưởng được cho như sau: 26, 26, 28, 29, 30, 31, 32, 109. Tính tiền lương trung bình, số trung vị, yếu vị? 3.3. Có 14 quần tây được bán ra trong ngày với kích cỡ vòng bụng như sau (cm): 78, 85, 90, 85, 82, 70, 85, 75, 85, 80, 77, 100, 85, 70 a. Tính số trung bình, trung vị, yếu vị b. Nếu bạn quản lý cửa hàng trên thì bạn chú trọng số liệu nào nhất? 3.4. Một mẫu với các dữ liệu sau: 15, 20, 25, 27, 30, 35, 28, 25, 34 a. Xác định khoảng biến thiên? b. Tính số phân vị thứ 20, 25, 60, 75 c. Tính khoảng trải giữa? 3.5. Hàng triệu người Mỹ làm việc trong văn phòng tại nhà của họ. Sau đây là một mẫu dữ liệu về tuổi của các cá nhân làm việc ở nhà: 18 40 54 36 20 42 46 25 25 27 48 33 53 28 27 40 26 45 37 25 a. Tính trung bình và mode. b. Độ tuổi trung vị của tổng thể những người trưởng thành là 36 tuổi. Sử dụng độ tuổi trung vị của dữ liệu trên để bình luận về việc liệu những người làm việc tại nhà có xu hướng trẻ hơn hoặc già hơn tổng thể những người trưởng thành. c. Tính tứ phân vị thứ nhất và thứ ba. d. Tính và giải thích phân vị thứ 32. 3.6. Xem xét một mẫu với các giá trị dữ liệu là 10, 20, 12, 17 và 16. Tính khoảng biến thiên và độ trải giữa. 3.7. Điểm của một người chơi bóng gỗ trong sáu lượt chơi là 182, 168, 184, 190, 170 và 174. Sử dụng các dữ liệu này như một mẫu, tính toán các thống kê mô tả sau đây. a. Khoảng biến thiên b. Phương sai c. Độ lệch chuẩn d. Hệ số biến thiên 3.8. Thời gian sau đây đã được ghi lại của những người chạy một phần tư dặm và một dặm của một nhóm điền kinh trường đại học (thời gian được tính bằng phút): Thời gian chạy một phần tư dặm Thời gian chạy một dặm 0,92 0,98 1,04 0,90 0,99 4,52 4,35 4,60 4,70 4,50 Sau khi xem thời gian chạy của mẫu này, một trong những huấn luyện viên nhận xét rằng những người chạy một phần tư dặm có thời gian ổn định hơn. Sử dụng độ lệch chuẩn và hệ số biến thiên để tóm tắt sự phân tán trong dữ liệu. Sử dụng hệ số biến thiên để chỉ ra rằng tuyên bố của huấn luyện viên có đúng không? 3.9.Xem xét một mẫu với các giá trị dữ liệu 10, 20, 12, 17 và 16. Tính giá trị z cho các quan sát này. 3.10. Xem xét một mẫu với trung bình là 500 và độ lệch chuẩn là 100. Giá trị z tính cho các giá trị dữ liệu sau đây: 520, 650, 500, 450 và 280. 3.11. Một mẫu có giá trị trung bình bằng 30 và độ lệch chuẩn bằng 5. Dùng định lý Chebyshev để xác định phần trăm dữ liệu nằm trong các dải sau: a. 20 đến 40 b. 15 đến 45 c. 22 đến 38 d. 18 đến 42 e. 12 đến 48 3.12. Giả sử dữ liệu có phân phối hình chuông với trung bình là 30 và độ lệch chuẩn là 5. Sử dụng quy tắc thực nghiệm để xác định tỷ lệ dữ liệu trong mỗi dãy sau đây: a. 20 đến 40 b. 15 đến 45 c. 25 đến 35 3.13. Khảo sát mẫu 500 đơn hàng chúng ta có giá trị trung bình bằng 69 và độ lệch chuẩn bằng 7. a. Tính các giá trị trong khoảng giới hạn (𝑥̅ − 𝑠; 𝑥̅ + 𝑠); (𝑥̅ − 2𝑠; 𝑥̅ + 2𝑠); (𝑥̅ − 3𝑠; 𝑥̅ + 3𝑠) b. Nếu giá trị đơn đặt hàng có phân phối hình chuông, có khoảng bao nhiêu đơn hàng có giá trị nằm trong các khoảng giới hạn nói trên? 3.14. Tiền lương của 1.000 nhân viên trong công ty có giá trị trung bình là 25.600 và độ lệch chuẩn là 2.200. Giả sử tiền lương của nhân viên tuân theo phân phối hình chuông. a. Có bao nhiêu người nhận tiền lương trong khoảng 23.400 và 27.800? b. Có bao nhiêu người nhận tiền lương trong khoảng 21.200 và 30.000? c. Có bao nhiêu người nhận tiền lương trong khoảng 19.000 và 32.200? 3.15. Năm quan sát thu thập cho hai biến theo bảng sau xi yi 4 50 6 50 11 40 3 60 16 30 Xây dựng một biểu đồ phân tán với x trên trục hoành. Biểu đồ phân tán xây dựng trong câu a cho thấy gì về mỗi liên hệ giữa hai biến? Tính toán và giải thích hiệp phương sai mẫu. Tính toán và giải thích hệ số tương quan mẫu. 3.16. Một ban nghiên cứu giao thông về tốc độ và số dặm đi được của xe ô tô cỡ trung, kết quả cho trong bảng dữ liệu sau: a. b. c. d. Tốc độ Số dặm 30 28 50 25 40 25 55 23 30 30 25 32 60 21 25 35 50 26 55 25 Tính toán và giải thích hệ số tương quan mẫu. Cho các dữ liệu và trọng số tương ứng 3.17. Xi Wi 3,5 4,2 2,8 3,7 5 3 2 4 a. Tính trung bình trọng số? b. Tính trung bình không có trọng số, xem xét sự khác biệt giữa hai kết quả? 3.18. Cho mẫu với bảng phân phối tần số tương ứng như sau Lớp Tần số 5-9 10-14 15-19 20-24 3 6 9 4 a. Tính trung bình mẫu? b. Tính phương sai mẫu và độ lệch chuẩn mẫu? 3.19. Một cuộc khảo sát của các thuê bao tạp chí Fortune đã hỏi câu sau: “Bạn đã đọc bao nhiêu số trong bốn số phát hành gần nhất?” Giả sử rằng bảng phân phối tần số sau đây tổng hợp 500 câu trả lời. Số lượng đã đọc Tần số 0 1 2 3 4 15 10 40 85 350 Tổng 500 a. Số phát hành đã đọc trung bình của một thuê bao tạp chí Fortune là bao nhiêu? b. Độ lệch chuẩn về số phát hành đã đọc là bao nhiêu? CHƯƠNG 4. QUY LUẬT PHÂN PHỐI XÁC SUẤT 4.1. Quan sát một công nhân làm ra một sản phẩm a. Định nghĩa biến ngẫu nhiên mô tả thời gian (phút) mà công nhân đó làm ra sản phẩm b. Các giá trị mà biến ngẫu nhiên trên có thể nhận là gì? c. Biến ngẫu nhiên trên là liên tục hay rời rạc? 4.2. Bảng sau là các phép thử và các biến ngẫu nhiên có liên quan. Trong mỗi trường hợp, cho biết các giá trị mà biến ngẫu nhiên có thể nhận và cho biết đó là biến ngẫu nhiên rời rạc hay liên tục? Phép thử Biến ngẫu nhiên (x) Thực hiện bài kiểm tra gồm 20 câu hỏi Số câu trả lời đúng Quan sát xe ô tô đi qua một trạm kiểm soát Số xe đi qua trạm kiểm soát trong vòng 1 giờ Kiểm tra 50 bản khai thu nhập cá nhân Quan sát giờ làm việc của một nhân viên Cân một gói hàng Số lượng bản khai có lỗi Số giờ làm việc không hiệu quả trong ngày làm việc Khối lượng (kg) của một gói hàng 4.3.Cho biến ngẫu nhiên rời rạc x có phân phối xác suất như sau: x f (x) 30 0,2 40 50 60 0,25 0,3 0,25 a. Xác suất để x nhận giá trị nhỏ hơn 40? b. Xác suất để x nhỏ hơn hay bằng 50? c. Xác suất để x lớn hơn 40? 4.4.Số lượng tivi bán được ở cửa hàng trong 100 ngày vừa qua thống kê như sau: Số tivi bán trong ngày Tần số 0 5 1 2 3 4 25 35 20 15 Hỏi xác suất 1 ngày bán được ít nhất 2 tivi? 4.5. Dữ liệu sau thu thập bằng cách đếm số phòng mổ được sử dụng tại bệnh viện đa khoa Tampa trong 20 ngày. Có 3 ngày chỉ có 1 phòng mổ được sử dụng, 5 ngày có 2 phòng được sử dụng, 8 ngày 3 phòng được sử dụng, 4 ngày cả 4 phòng mổ đều được sử dụng. a. Sử dụng tần số trên, xây dựng phân phối xác suất cho số phòng mổ được sử dụng trong một ngày bất kỳ. b. Kiểm tra xem phân phối xác suất của bạn có thỏa mãn điều kiện của phân phối xác suất của biến ngẫu nhiên rời rạc chưa? 4.6.Cho bảng phân phối xác suất của biến x: x f(x) 0 0,05 1 0,15 2 0,35 3 0,25 4 0,2 a. Tính giá trị kỳ vọng b. Tính phương sai c. Độ lệch chuẩn? 4.7.Lượng xe hơi bán trong ngày ký hiệu là x với phân phối xác suất tương ứng như sau: x f(x) 0 0,1 1 0,2 2 0,4 3 0,3 a. Tính lượng xe hơi trung bình bán được trong một ngày? b. Tính xác suất một ngày bán được ít nhất 2 chiếc xe hơi? c. Tính xác suất f(x ≥ 2,4)? 4.8. Trung tâm dịch vụ cấp cứu nhận được từ 0 đến 5 cuộc gọi hàng ngày. Phân phối xác suất của số cuộc gọi trong ngày như sau: Số cuộc gọi 0 1 2 3 4 5 Xác suất 0,10 0,15 0,30 0,20 0,15 0,10 a. Số cuộc gọi kỳ vọng trong ngày là bao nhiêu? b. Phương sai của số cuộc gọi là bao nhiêu? Tính độ lệch chuẩn tương ứng? 4.9.Cho thử nghiệm nhị thức với n = 10 và p = 0,2 a. Tính f(0) ? b. Tính f(2) ? c. Tính P(x ≤ 2) ? d. Tính P(x ≥ 1) ? e. Tính E(x) f. Tính Var và σ? 4.10. Khi một máy mới hoạt động tốt, chỉ có 3% sản phẩm là phế phẩm. Giả sử ta chọn ngẫu nhiên 2 sản phẩm sản xuất với máy trên và quan tâm đến số phế phẩm tìm được. a. Phát biểu các điều kiện để phép thử trên là dãy phép thử nhị thức. b. Vẽ đồ thị hình cây c. Có bao nhiêu trường hợp dẫn đến có đúng 1 phế phẩm được tìm thấy? d. Tính các xác suất không có phế phẩm, có đúng 1 phế phẩm và đúng 2 phế phẩm? 4.11. Theo điều tra thì có 40% số dân tại thành phố có ít nhất tủ lạnh hay máy giặt. Nếu ta phỏng vấn 15 người một cách ngẫu nhiên thì: a. Xác suất có 3 người có tủ lạnh hay máy giặt? b. Xác suất có 12 người sẽ không có tủ lạnh hay máy giặt? c. Xác suất có ít nhất 3 người có tủ lạnh hay máy giặt? 4.12. Xét hàm xác suất Poisson với µ = 3 a. Viết hàm xác suất Poisson tương ứng. b. Tính f(2). c. Tính f(1). d. Tính P(x≥2). 4.13. Trung bình có 48 cuộc gọi đến trong một giờ tại quầy đặt chỗ của Regional Airways. a. Tính xác suất nhận được 3 cuộc gọi trong 5 phút. b. Tính xác suất nhận được đúng 10 cuộc gọi trong 15 phút. 4.14. 4.15. 4.16. 4.17. c. Giả sự hiện không có cuộc gọi nào phải chờ máy. Nếu nhân viên mất 5 phút để hoàn thành cuộc gọi hiện tại, bạn kỳ vọng có bao nhiêu người gọi đến phải chờ đợi tại thời điểm này ? Xác suất không có người nào phải đợi là bao nhiêu ? d. Nếu không có cuộc gọi nào đang được xử lý, xác suất các nhân viên có 3 phút làm việc cá nhân mà không bị gián đoạn bởi một cuộc gọi là bao nhiêu ? Cho biến x có phân phối đồng nhất trong khoảng 10 và 15 a. Vẽ đồ thị thể hiện phân phối mật độ xác suất b. Tính P (x < 12)? c. Tính P (12 ≤ x ≤13)? d. Tính giá trị kỳ vọng của x? e. Tính phương sai và độ lệch chuẩn? Một biến ngẫu nhiên có phân phối chuẩn với TB = 50 và ĐLC = 5 a. Vẽ đường cong chuẩn của hàm mật độ xác suất. Ghi trên thục hoành các giá trị 35, 40, 45, 50, 55, 60, 65. b. Xác định để biến ngẫu nhiên nhận giá trị giữa 45 và 55 là bao nhiêu? c. Xác định để biến ngẫu nhiên nhận giá trị giữa 40 và 60 là bao nhiêu? Với biến x tuân theo phân phối chuẩn với giá trị trung bình bằng 60 và độ lệch chuẩn bằng 8. Tính xác suất P (60 < x < 70). Nếu z tuân theo phân phối chuẩn chuẩn hóa, hãy tính những xác suất sau: a. P (0 ≤ z ≤ 1)? b. P (0 ≤ z ≤ 1,5)? c. P (0 < z < 2)? d. P (0 < z < 3)? e. P (-1 ≤ z ≤ 0)? f. P (-1 < z < 1)? g. P (-1,5 < z < 0)? h. P (-2 < z < 0)? i. P ( 0 ≤ z ≤ 0,83)? j. P ( - 1,57 ≤ z ≤ 0 )? k. P (z > 0,44) ? l. P (z ≥ - 0,23)? 4.18. Cho z tuân theo phân phối chuẩn hóa, tính z trong các trường hợp sau a. Diện tích giữa 0 và z là 0,4222? b. Diện tích giữa 0 và z là 0,2324? c. Diện tích bên trái z là 0,6331 ? d. Diện tích bên phải z là 0,2 ? 4.19. Giá cổ phiếu bình quân của các công ty trong danh sách S&P 500 là 30 USD và ĐLC là 8,20USD. Giả sử giá cổ phiếu có phân phối chuẩn. a. Xác suất để một công ty có giá cổ phiếu ít nhất 40 USD là bao nhiêu ? b. Xác suất để một công ty có giá cổ phiếu không cao hơn 20 USD là bao nhiêu ? c. Giá cổ phiếu phải cao bao nhiêu để một công ty được đứng trong 10% cao nhất ? 4.20. Cho một phân phối nhị thức có p = 0,20 và n = 100. a. Giá trị trung bình và độ lệch chuẩn bằng bao nhiêu ? b. Trong trường hợp này, các xác suất nhị thức có thể được xấp xỉ bởi phân phối xác suất chuẩn hay không ? Giải thích c. Xác suất có đúng 24 lần thành công là bao nhiêu ? d. Xác suất có từ 18 đến 22 lần thành công là bao nhiêu ? e. Xác suất có ít hơn hoặc bằng 15 lần thành công là bao nhiêu ? 4.21. Tỷ lệ thất nghiệp là 5,8%. Giả sử chọn ngẫu nhiên 100 người a. Số lượng người thất nghiệp kỳ vọng là bao nhiêu ? b. Phương sai và độ lệch chuẩn của số người thất nghiệp là bao nhiêu ? c. Xác suất có đúng sáu người thất nghiệp là bao nhiêu ? d. Xác suất có ít nhất bốn người thất nghiệp là bao nhiêu ? 4.22. Cho biến ngẫu nhiên x có phân phối đều trong khoảng từ 1,0 đến 1,5. a. Vẽ đồ thị hàm mật độ xác suất. b. Tính P (x = 1,25) c. Tính P (1,0 ≤ x ≤ 1,25) d. Tính P(1,20 < x < 1,5) 1 −𝑥 Xét hàm mật độ xác suất mũ như sau f(x) = 8 𝑒 8 khi x ≥ 0, hãy tính 4.23. a. b. c. d. P (x ≤ 6) P (x ≤ 4) P (x ≥ 6) P (4 ≤ x ≤ 6) CHƯƠNG 5. LẤY MẪU VÀ PHÂN PHỐI MẪU 5.1. Dữ liệu sau thu được từ một mẫu ngẫu nhiên: 3, 5, 6, 8, 9 a. Hãy tính ước lượng điểm của giá trị trung bình tổng thể b. Hãy tính ước lượng điểm của độ lệch chuẩn tổng thể 5.2. Một bảng câu hỏi khảo sát của một mẫu gồm 150 cá nhân thu được 75 câu trả lời Có, 55 câu trả lời Không và 20 Không ý kiến. a. Ước lượng điểm của tỷ lệ người trả lời Có trong tổng thể là bao nhiêu ? b. Ước lượng điểm của tỷ lệ người trả lời Không trong tổng thể là bao nhiêu ? 5.3.Một tổng thể có giá trị trung bình bằng 120 và độ lệch chuẩn bằng 20. Chúng ta chọn mẫu có kích cỡ 100 và giá trị trung bình mẫu được sử dụng để ước lượng giá trị trung bình tổng thể. a. Hãy tính xác suất để giá trị trung bình mẫu sẽ nằm trong khoảng ±2 của giá trị trung bình tổng thể. b. Hãy tính xác suất để giá trị trung bình mẫu sẽ nằm trong khoảng ±4 của giá trị trung bình tổng thể. 5.4. Giả sử lấy một mẫu ngẫu nhiên với kích cỡ 100 từ tổng thể với độ lệch chuẩn bằng 20. Hãy tính độ lệch chuẩn của giá trị trung bình trong các trường hợp sau: a. Kích cỡ tổng thể là vô hạn b. Kích cỡ tổng thể bằng 100.000 c. Kích cỡ tổng thể bằng 10.000 d. Kích cỡ tổng thể bằng 1.000 5.5. Một tổng thể lớn có giá trị trung bình bằng 150 và độ lệch chuẩn bằng 30. Hãy tính xác suất để cho một giá trị trung bình của mẫu nằm trong khoảng ±5 của giá trị trung bình tổng thể với các kích cỡ mẫu như sau: a. n = 30 b. n = 100 c. n = 200 d. Nhận định ưu điểm của trường hợp mẫu lớn 5.6.Một mẫu có kích cỡ 100 được lấy từ tổng thể tuân theo phân phối chuẩn với µ = 500 và σ = 100. Hãy tính: a. P (x > 520) b. P (x < 470) c. P (x > 600) 5.7. Một nhà máy sản xuất sô-cô-la nhận thấy rằng trọng lượng của từng thanh sô-cô-la loại 32g tuân theo phân phối chuẩn với giá trị trung bình là 32,2g và độ lệch chuẩn bằng 0,3g. a. Hãy tính xác suất để một khách hàng mua một thanh sô-cô-la ngẫu nhiên có trọng lượng nhỏ hơn 32g. b. Hãy tính xác suất để một khách hàng mua một bao sô-cô-la gồm 4 thanh có trọng lượng trung bình của 4 thanh nhỏ hơn 32g. 5.8. Một công ty gia công thiết bị với chiều dài lô hàng là 117cm và độ lệch chuẩn bằng 2,1cm. a. Tính xác suất để một thiết bị được chọn ngẫu nhiên sẽ có chiều dài lớn hơn 120cm. b. Tính xác suất để nếu chọn ngẫu nhiên 3 thiết bị thì chiều dài trung bình lớn hơn 120cm. 5.9. Một công ty khảo sát 200 người trong thành phố cho thấy có 90 người yêu thích sản phẩm của mình, 60 người không thích và 50 người trả lời là không có ý kiến. a. Ước lượng điểm của tỷ lệ số người yêu thích sản phẩm? b. Ước lượng điểm của tỷ lệ số người không thích sản phẩm? 5.10. Một mẫu ngẫu nhiên với kích cỡ 100 được lấy từ tổng thể với tỷ lệ bằng 0,3. Hãy tính: a. Giá trị kỳ vọng của tỷ lệ mẫu? b. Độ lệch chuẩn của tỷ lệ mẫu? 5.11. Một tổng thể có tỷ lệ tổng thể bằng 0,3. Một mẫu ngẫu nhiên có kích cỡ 150 và tỷ lệ mẫu 𝑝̅ sẽ được sử dụng để ước lượng tỷ lệ tổng thể. a. Hãy tính xác suất để tỷ lệ của mẫu nằm trong khoảng ±0,03 của tỷ lệ tổng thể. b. Hãy tính xác suất để tỷ lệ của mẫu nằm trong khoảng ±0,05 của tỷ lệ tổng thể. 5.12. Với tỷ lệ tổng thể bằng 0,60, hãy tính sai số chuẩn của tỷ lệ mẫu đối với kích cỡ mẫu bằng 100, 200, 300 và 500. Bạn có nhận định gì về độ lớn của sai số chuẩn của tỷ lệ tổng thể khi kích cỡ mẫu tăng lên? 5.13. Theo thống kê toàn ngành du lịch thì tỷ lệ người thích du lịch sinh thái là 30% trong tổng số khách du lịch. Nếu chúng ta chọn ngẫu nhiên 1011 khách du lịch, hãy tính xác suất để tỷ lệ người thích du lịch sinh thái trong mẫu ≥ 32%? CHƯƠNG 6. ƯỚC LƯỢNG THAM SỐ TỔNG THỂ 6.1. Một mẫu ngẫu nhiên đơn giản có 40 phần tử với trung bình của mẫu bằng 32 và độ lệch chuẩn bằng 5. a. Xác định khoảng tin cậy 90% cho trung bình tổng thể? b. Như câu a nhưng khoảng tin cậy 95%? c. Như câu a nhưng khoảng tin cậy 99%? 6.2. Trong một khảo sát cho thấy số giờ xem tivi trung bình của một hộ là 15,75 giờ/tuần. Giả sử chúng ta khảo sát 200 hộ và có độ lệch chuẩn của mẫu là 5,45 giờ. Hãy tính ước lượng khoảng với độ tin cậy 95% cho thời gian xem tivi trung bình của một hộ trong tuần? 6.3. Để ra quyết định về mở rộng sản xuất, công ty A muốn biết một thanh thiếu niên trung bình mua hàng bao nhiêu đĩa nhạc trong năm. Công ty điều tra 250 thanh thiếu niên và có được giá trị trung bình của mẫu là 4,26. Hãy ước lượng với độ tin cậy 99% cho số lượng đĩa nhạc trung bình một thanh thiếu niên mua hàng năm? Giả sử độ lệch chuản của tổng thể đã biết là 3. 6.4. Để tính thu nhập bình quân của các hộ trong vùng, công ty A đã điều tra 100 hộ dân. a. Nếu độ lệch chuẩn của thu nhập tổng thể các hộ dân đã biết bằng 6$, hãy tính sai số chuẩn của giá trị trung bình? b. Với độ tin cậy 95%, hãy tính dự trữ sai số? c. Nếu thu nhập trung bình của 100 hộ dân là 65$, hãy tính ước lượng khoảng cho thu nhập trung bình của toàn hộ dân trong vùng với độ tin cậy bằng 95%? 6.5. Trong khi chọn ra 80 sinh viên từ một trường đại học, trưởng khoa đã kết luận rằng thời gian học ở nhà trung bình của một sinh viên là 15,2 giờ với độ lệch chuẩn của mẫu là 3 giờ. Hãy tính ước lượng thời gian học ở nhà trung bình của sinh viên trường đại học với độ tin cậy 99%? 6.6. Với phân phối t có 10 độ tự do, hãy tính xác suất (diện tích) trong từng vùng: a. Bên trái của 1,812 b. Bên phải của -1,372 c. Bên phải của 2,764 d. Bên trái của -1,812 e. Giữa – 2,228 và 2,228 f. Giữa – 1,372 và 1,812 6.7. Tìm giá trị t trong những trường hợp sau: a. Diện tích đuôi trên bằng 0,05 với 16 độ tự do b. Diện tích đuôi dưới bằng 0,1 với 20 độ tự do c. Diện tích đuôi trên bằng 0,01 với 5 độ tự do d. 90% diện tích nằm trong khoảng ±t với 12 độ tự do e. 95% diện tích nằm trong khoảng ±t với 26 độ tự do 6.8. Cho một mẫu được lấy từ tổng thể có phân phối chuẩn: 10, 6, 12, 11, 13, 9, 8, 5 a. Hãy tính ước lượng điểm của trung bình tổng thể? b. Hãy tính ước lượng điểm của độ lệch tổng thể? c. Hãy tính ước lượng khoảng của trung bình tổng thể với độ tin cậy 99%? 6.9. Sản xuất giấy theo dây chuyền tự động: chiều dài trung bình 29,7cm; độ lệch tiêu chuẩn của chiều dài là 0,05cm. Chọn mẫu gồm 100 tờ để kiểm tra chiều dài. Trong lần kiểm tra gần nhất, chiều dài trung bình tính được từ mẫu là 29,698. Xác định khoảng ước lượng với độ tin cậy 95% cho chiều dài giấy trung bình của tổng thể. 6.10. Đo trọng lượng của 25 bé trai 8 tuổi ở 1 ngôi làng, sau khi tính toán tập dữ liệu mẫu, ta có số liệu sau: 𝑥̅ =26,06kg và s = 1,61kg. Hãy ước lượng trọng lượng trung bình của trẻ em 8 tuổi ở đây với độ tin cậy 90%. 6.11. Phải chọn kích cỡ mẫu bằng bao nhiêu để có được ước lượng khoảng với độ tin cậy 95% và dự trữ sai số bằng 6 với giả định độ lệch chuẩn của tổng thể bằng 30. 6.12. Khoảng biến thiên của một tập dữ liệu bằng 24 a. Hãy xác định giá trị cho độ lệch chuẩn của tổng thể b. Với độ tin cậy 95% hãy xác định kích cỡ mẫu để dự trữ sai số bằng 3? c. Với độ tin cậy 95% hãy xác định kích cỡ mẫu để dự trữ sai số bằng 4? 6.13. Để nghiên cứu chi tiêu trung bình của một học sinh, một mẫu ngẫu nhiên được ghi nhận như sau (ngàn đồng): 60 70 66 66 62 60 72 65 73 70 72 57 57 64 58 Hãy tính ước lượng khoảng với độ tin cậy 95% cho chi tiêu trung bình của học sinh? Giả định chi tiêu của học sinh tuân theo phân phối bình thường. 6.14. Lấy mẫu ngẫu nhiên 300 người thì 100 người thích đi du lịch biển trong kỳ nghỉ hè. a. Hỏi ước lượng điểm của tỷ lệ tổng thể những người thích đi du lịch biển trong kỳ nghỉ hè? b. Hãy tính sai số chuẩn của tỷ lệ tổng thể? c. Hãy tính ước lượng khoảng cho tỷ lệ tổng thể với độ tin cậy 95%? 6.15. Công ty tiếp thị thể thao của thành phố A dự định tổ chức một trận đấu cầu giao hữu với tỉnh bạn. Công ty biết rằng theo thống kê mới nhất thì dân số thành phố là 500.000 người. Công ty muốn ước lượng tỷ lệ số người sẽ tham dự trận đấu. Hỏi công ty phải chọn mẫu kích cỡ bao nhiêu để biết được tỷ lệ này với sai số dự trữ không quá 0,03% và độ tin cậy 99%? 6.16. Trong một điều tra ở trường đại học với mẫu 1200 sinh viên thì có 290 sinh viên đi làm them vào dịp cuối tuần. a. Hãy ước lượng điểm của tỷ lệ sinh viên đi làm thêm cuối tuần cho toàn thể sinh viên trong trường đại học? b. Với độ tin cậy 95%, hãy tính dự trữ sai số tương ứng với ước lượng này? CHƯƠNG 7. KIỂM ĐỊNH GIẢ THUYẾT VỀ THAM SỐ TỔNG THỂ 7.1. Nhà quản lý một cửa hàng thiết bị điện tử đang xem xét một kế hoạch tiếp thị để tăng sản lượng bán ra của cửa hàng. Hiện tại, số tivi bán được trung bình trong một ngày là 6 tivi. Để tiến hành thu thập dữ liệu trước khi tiến hành kế hoạch, một nhóm các nhân viên bán hàng sẽ được bán thử nghiệm theo kế hoạch dự kiến trong vòng 2 tuần. a. Hãy xây dựng giả thuyết không và giả thuyết đối phù hợp cho nghiên cứu này? b. Cho ý kiến khi H0 bị bác bỏ? c. Cho ý kiến khi H0 không bị bác bỏ? 7.2. Công ty nước giải khát tuyên bố loại chai nước ngọt có gaz được bán trên thị trường có dung tích mỗi chai là 330ml. Hiệp hội người tiêu dùng muốn kiểm tra tính đúng đắn của tuyên bố trên bằng cách kiểm tra mẫu xem giá trị trung bình dung tích trong một chai có đáp ứng tiêu chuẩn phát biểu trên hay không. a. Hãy xây dựng giả thuyết không và giải thuyết đối cho nghiên cứu trên? b. Kết luận của hiệp hội người tiêu dùng khi bác bỏ hay không bác bỏ H0? 7.3. Cho các giả thuyết: H0: µ ≥ 11 H1: µ < 11 Một mẫu có kích cỡ n = 40 có trung bình mẫu bằng 9,65 và độ lệch chuẩn bằng 3. a. Tính giá trị tới hạn z với độ tin cậy 95%? Quy tắc bác bỏ? b. Tính giá trị thống kê kiểm định z? Kết luận của bạn? 7.4. Cho các giả thuyết: H0: µ ≤ 16 H1: µ > 16 Một mẫu có 50 phần tử với trung bình mẫu bằng 17 và độ lệch chuẩn của mẫu bằng 8. a. Với α = 0,02, tính giá trị tới hạn z và nêu quy tắc bác bỏ? b. Tính giá trị thống kê kiểm định z? c. Tính giá trị p-value d. Kết luận? 7.5. Cho các giả thuyết: H0: µ ≥ 30 H1: µ < 30 Lấy mẫu 120 phần tử với độ lệch chuẩn bằng 13, độ tinh cậy 95%, hãy tính giá trị thống kê kiểm định và kết luận cho các trường hợp sau: a. x = 26 b. x = 27 c. x = 28 d. x = 29 7.6. Một cửa hàng ăn uống nghĩ rằng việc trang bị lại cửa hàng sẽ đem lại lợi nhuận cao hơn. Sau khi phân tích các bài toán tài chính, quản lý cửa hàng quyết định rằng điềun ày chỉ đem lại hiệu quả kinh tế nếu hóa đơn trung bình của khách hàng lớn hơn 70$. Trước khi quyết định đầu tư, nhà quản lý lấy mẫu ngẫu nhiên 200 hóa đơn và giá trị trung bình một hóa đơn là 74$ với độ lệch chuẩn của mẫu là 30$. Hãy quyết định giúp nhà quản lý có nên đầu tư hay không với độ tin cậy 95%? 7.7. Cho các giả thuyết: H0: µ ≤ 12 H1: µ > 12 Lấy mẫu 12 phần tử với trung bình mẫu bằng 13 và độ lệch chuẩn của mẫu bằng 2,5. Tổng thể được giả định tuân theo phân phối chuẩn. a. Với α = 0,05, hãy xác định quy tắc bác bỏ? b. Tính giá trị thống kê kiểm định t? c. Kết luận? 7.8. Cho các giả thuyết: H0: µ ≥ 20 H1: µ < 20 Mẫu kích cỡ 15 và độ lệch chuẩn bằng 7. Hãy tính giá trị thống kê kiểm định t và kết luận trong các trường hợp sau với mức ý nghĩa 0,05: a. x = 16 b. x = 19 c. x = 19,5 d. x = 21 7.9. Cho các giả thuyết: H0: p ≤ 0,4 H1: p > 0,4 Lấy mẫu 150 phần tử với tỷ lệ mẫu p = 0,45. a. Với α = 0,05, hãy xác định quy tắc bác bỏ? b. Tính giá trị thống kê kiểm định z? Kết luận? 7.10. Cho các giả thuyết: H0: p = 0,3 H1: p ≠ 0,3 Lấy mẫu 350 phần tử với tỷ lệ mẫu p = 0,28. a. Với α = 0,02, hãy xác định quy tắc bác bỏ? b. Tính giá trị thống kê kiểm định z? c. Tính giá trị p? d. Kết luận? 7.11. Cho các giả thuyết: H0: p ≥ 0,8 H1: p < 0,8 Mẫu kích cỡ 250. Với mức ý nghĩa 0,05, hãy tính giá trị p và thống kê kiểm định z tương ứng cho các trường hợp sau: a. p = 0,72 b. p = 0,75 c. p = 0,77 d. p = 0,83 7.12. 10 người uống bia thì chỉ có 1 người thích bia A. Sau chiến dịch quảng cáo, khảo sát một mẫu ngẫu nhiên 200 người uống bia thì thấy có 26 người thích bia A. Thông tin này có đủ để kết luận là có sự gia tăng tỷ lệ những người thích uống bia A không? Chọn độ tin cậy cho bài toán kiểm định là 90%. 7.13. Trong một đợt vận động tranh cử, ứng viên A tuyên bố là mình đã đạt được ít nhất 70% số cử tri ủng hộ. Để kiểm định tính xác thực của tuyên bố này, một tạp chí đã cử người đi điều tra phỏng vấn 200 người và thu được kết quả 68% số cử tri ủng hộ ứng viên A. Hãy dùng giá trị thống kê kiểm định và giá trị p để rút ra kết luận về tính đúng đắn của tuyên bố của ứng viên A với độ tin cậy 95%? 7.14. Một công ty tuyên bố rằng sản phẩm của họ chiếm 25% thị trường. Thăm dò ngẫu nhiên 300 người cho thấy 22% sử dụng sản phẩm công ty. Với mức ý nghĩa 0,05 hãy kiểm định các giả thuyết H0: p = 0,25 và H1: p ±0,25. Hãy xác định giá trị p? 7.15. Theo quy định kỹ thuật, các tủ lạnh phải giữ được độ lạnh đã cài đặt với mức độ dao động của nhiệt độ là ít nhất thông qua độ lệch chuẩn không quá 4 độ C. Một mẫu 16 tủ lạnh trong kho được chọn ngẫu nhiên và qua kiểm tra thấy rằng phương sai mẫu này là s2=24. Chọn a = 0,05, thực hiện kiểm định phù hợp cho biết độ lệch chuẩn theo yêu cầu kỹ thuật có bị vượt quá không. 7.16. Một hãng viễn thông tiến hành kiểm định có hay không có sự khác biệt trong thu nhập trung bình của khách hàng nam và nữ. Họ chọn ngẫu nhiên 200 khách nam và 100 khách nữ. Trên hai mẫu ngẫu nhiên khách hàng, công ty thu thập được thu nhập trung bình của khách hàng nam là 43.390$ và khách hàng nữ bằng 42.400$, độ lệch chuẩn thu nhập của mẫu khách nam bằng 7.300$ và của mẫu khách nữ bằng 8.200$. Thực hiện bài toán kiểm định với độ tin cậy 95%. 7.17. Để so sánh độ bền của hai loại sơn phản quang dùng để vẽ kí hiệu hướng dẫn giao thông, người ta kẻ 12 lằn sơn mỗi loại trên một đoạn đường có nhiều xe lưu thông, sau một thời gian người ta dùng máy đo cường độ phản chiếu của các lằn sơn (chỉ số càng cao thì cường độ phản chiếu càng lớn) và ghi lại được số liệu sau đây: Sơn A Sơn B 12,5 11,7 9,9 9,6 10,3 9,6 9,4 11,3 8,7 11,5 10,6 9,7 9,4 11,6 9,7 10,4 6,9 7,3 8,4 7,2 7,0 8,2 12,7 9,2 Người ta cho rằng loại sơn A bền hơn loại sơn B, hãy kiểm định thông tin với độ tin cậy 90%. 7.18. Để thiết kế một phần mềm thử nghiệm nhằm so sánh tốc độ xử lý của hai phần mềm thống kê, người ta chọn ra một bộ dữ liệu, đặt ra 10 yêu cầu cần xử lý trên hai bộ dữ liệu này sau đó ghi lại thời gian xử lý từng lệnh của từng phần mề, ta có bảng dữ liệu sau: Câu hỏi đặt ra là phần mềm mới có xử lý nhanh hơn phần mềm cũ hay không. Kiểm định thông tin này với độ tin cậy là 95%.