เอกสารประกอบการสอนรายวิชา 100302 ่ ศรี อ.ดร. พ ัชริน สง ภาควิชาพืชศาสตร์และทร ัพยากรการเกษตร คณะเกษตรศาสตร์ มหาวิทยาล ัยขอนแก่น บทที่ 4 ้ งต้น การวางแผนการทดลองเบือ - การแสวงหาคาตอบตามทีไ ่ ด้ วางแผนไว ้ เพือ ่ ค ้นหาความจริงใหม่ๆ ห รื อ ท ด ส อ บ ผ ล ที่ ไ ด ท ้ า มาแล ้วว่าเป็ นจริงหรือไม่ • ความหมายคล ้ายกัน • แต่การทดลองเป็ นระเบียบวิธวี จิ ัยประเภท หนึง่ ในหลายประเภท – การวิจัยเชงิ ประวัตศ ิ าสตร์ – การวิจัยเชงิ พรรณนา – การวิจ ัยเชงิ ทดลอง สถิตก ิ ับการวิจ ัย วิธก ี ารทางวิทยาศาสตร์ การแสวงหาความรูใ้ หม่ ั จากปัญหาทีช ่ ดเจน มีระบบและมีจด ุ มุง ่ หมายทีแ ่ น่นอน การวิจ ัย การเก็บข้อมูล 1 สถิต ิ การวิเคราะข้อมูล 2 การแปลผลการทดลอง 3 • • วิจัยเป็ นการแสวงหาความรู ้ใหม่โดยวิธก ี ารทาง วิทยาศาสตร์ สถิตเิ ป็ นกระบวนการแสวงหาความรู ้ใหม่ ที่ เกีย ่ วกับ – – – – – การวางแผนการทดลอง การเก็บข ้อมูล การวิเคราะห์ข ้อมูล การแปรผลข ้อมูล ซงึ่ จะทาให ้ผลการทดลอง หรือ ื่ ถือ ผลการวิจัยมีความน่าเชอ ื่ ถือ ถ ้าหาก ผลการทดลองไม่น่าเชอ › การทดลองขาดการวางแผนการทดลองทีด ่ ี › และขาดการเก็บข ้อมูลทีด ่ ี ขาดความสมบูรณ์ในการวิเคราะห์ข ้อมูลทางสถิต ิ นักวิจัยทางานทดลอง เพือ ่ ให ้ได ้ความรู ้ใหม่ๆ ้ ้เป็ นประโยชน์ และนาความรู ้นั น ้ ไปใชให ่ การพัฒนาพันธุพ ั ว์ การ เชน ์ ช ื และ สต จัดการดินและน้ าเพือ ่ เพิม ่ ผลผลิต หล ักการวางแผนการทดลอง ่ นประกอบในงานทดลอง สว ทรีตเมนต์ (treatment) คือ สงิ่ หรือวิธก ี ารที่ นามาทดลองเปรียบเทียบกัน หน่วยทดลอง (experimental unit) คือ กลุ่ ม หรื อ วั ต ถุ ท ดลองที่ ไ ด ร้ ั บ ทรี ต เมนต์ใ ดทรี ต เมนต์หนึง่ 1. ทรีตเมนต์ (treatment) คือ สงิ่ ทดลอง วิธก ี าร หรือ ่ ทีน ่ ามาทดลองเปรียบเทียบก ัน เชน • วิธก ี ารกาจ ัดแมลง • พ ันธุพ ์ ช ื ทีน ่ ามาทดลองเปรียบเทียบ ้ ๋ ยในอ การใชป ุ ัตราต่างๆ 2. หน่วยทดลอง (experiment unit) คือ กลุม ่ ของว ัตถุทดลองทีไ่ ด้ร ับทรีตเมนต์ ใดทรีตเมนต์หนึง่ ่ เชน การทดสอบการเปรียบเทียบปุ๋ยสูตร ต่างๆ กับต ้นหน ้าวัวในกระถาง การทดสอบการเปรียบเทียบปุ๋ยสูตรต่างๆ กับต ้นหน ้าวัวในกระถาง › ปุ๋ยสูตรต่างๆ เป็ น tmt › กระถาง ต ้นหน ้าวัวเป็ นหน่วยทดลอง การทดลองเปรียบเทียบสูตรอาหารหมู การทดลองเปรียบเทียบสูตรอาหารหมู › อาหารสูตรต่างๆ เป็ น tmt › หมูในคอกคือ หน่วยการทดลอง หล ักการวางแผนการทดลอง ความคลาดเคลือ ่ นของการทดลอง (Experimental error) ความแตกต่ า งระหว่ า งหน่ ว ยทดลองที่ ได ้รับอิทธิพลของทรีตเมนต์เดียวกัน 1. ความแตกต่างทีม ่ อ ี ยูใ่ นว ัตถุทดลองก่อนการ ทดลอง (inherent variability) 1. ความแตกต่างทีม ่ อ ี ยูใ่ นว ัตถุทดลองก่อนการ ทดลอง (inherent variability) ่ การทดลองสูตรอาหารต่างๆ ก ับการเลีย ้ งสุกร เชน ปัญหา พ ันธุกรรมสุกร 2. ความแตกต่างเนือ ่ งมาจากสงิ่ ภายนอก (extraneous variability) 2. ความแตกต่างเนือ ่ งมาจากสงิ่ ภายนอก (extraneous variability) ่ อิทธิพลของสภาพแวดล้อม การทดลองในสภาพ เชน แปลง ิ ธิภาพดี การทดลองทีม ่ ป ี ระสท › ต้องมีความคลาดเคลือ ่ นของการทดลองน้อย ทีส ่ ด ุ เท่าทีจ ่ ะทาได้ • การลดความคลาดเคลื่อ นของ การทดลองอ น ั เนือ ่ งมาจากความ แตกต่างของว ัตถุทดลอง • ท าได้โ ดยการเลือ กว ต ั ถุ ท ดลอง ให้ม ค ี วามสม่า เสมอ หรือ เลือ กใช ้ แผนการทดลองทีเ่ หมาะสม โดยทดลองอย่างละม ัดระว ัง พิถพ ี ถ ิ ันในการดูแลงานทดลอง มีความแม่นยาในการใชเ้ ทคนิคในการเก็ บข้อมูล มีความรอบคอบในการบ ันทึกข้อมูล การทาซา้ (replication) คือ การทีใ่ ห้ทรีตเมนต์หนึง่ ๆ ก ับหน่วยทดลอง อย่างน้อย 2 หน่วยทดลอง ่ • เชน การทดสอบเปรียบเทียบปุ๋ยสองระด ับ ได้แก่ 25 กก./ไร่ ก ับ 50 กก./ไร่ •ปลูกทดสอบทงหมด ั้ 8 แปลง •ทรีตเมนต์ละ 4 แปลง (4 ซา้ ) ้ นนเป การทาซา ั้ ็ นสงิ่ ทีจ ่ าเป็นมากใน การทางานทดลอง เพราะซ ้า น น ั้ มีบ ทบาทส าค ญ ั ใน การทดลองหลายประการ คือ 1.ทาให้ประมาณค่าความคลาดเคลือ ่ น ของการทดลองได้ ความคลาดเคลือ ่ นของการทดลอง คือความแตกต่างก ัน ของหน่วยทดลองทีไ่ ด้ร ับอิทธิพลของ tmt เดียวก ัน ด ังนนอย่ ั้ างน้อยต้องมี 2 หน่วยทดลองทีไ่ ด้ร ับอิทธิพลของ tmt เดียวก ัน จึงจะประมาณหาค่าความคลาดเคลือ ่ นของ การทดลองได้ ้ 2. ทาให้การทดลองมีความเทีย ่ งตรงมากขึน โดยทาให้ standard error ของ treatment mean ลดลง ซงึ่ แสดงให้เห็น ได้จากสูตร สู ตร SE = 2 S /r เมื่อ SE = standard error ของ treatment mean S2 = experimental error และ r = จำนวนซ้ำของกำรทดลอง 3. เป็นการควบคุมความคลาดเคลือ ่ น ของการทดลองได้ การทดลองหนึง่ ๆ จะมีจานวนซา้ ้ อยูก เท่าใด ขึน ่ ับปัจจ ัยหลายประการ ได้แก่ ึ ษา 1. ความแปรปรวนของล ักษณะทีศ ่ ก - ถ ้าความแปรปรวนมาก ควรมีซ้ามาก - แปรปรวนน ้อย ซ้าน ้อย 2. จานวนทรีตเมนต์ - Tmt น ้อย ซ้ามาก เนือ ่ งจากต ้องให ้มี df ของ error ไม่ควรน ้อยกว่า 9 และในชว่ งทีเ่ หมาะสม ควรจะเป็ น 10-12 3. • • ขนาดของความแตกต่า ง หมายถึงความ แตกต่างระหว่างค่าเฉลีย ่ ของทรีตเมนต์ ถ ้าขนาดความแตกต่างของ tmt มีมาก ไม่ต ้อง ทาซ้ามาก เช่ น การทดสอบวิธ ี ก าจั ด วั ช พื ช กั บ ผลผลิต ของ ข ้าวโพดสองการทดลอง • 1 เปรียบเทียบวิธก ี ารกาจัดด ้วยมือ กับไม่ดายหญ ้า • 2 เปรียบเทียบวิธก ี ารกาจัดวัชพืชด ้วยมือกับสารเคมี 5 สาร • การทดลองทีห ่ นึง่ ควรมีซ้าน ้อยกว่า ่ (randomization) การสุม หมายถึง การจัดให ้ทรีตเมนต์มโี อกาสทีจ ่ ะถูกกาหนด ให ้กับหน่วยทดลองใดเท่าๆ กัน เพื่อทีจ่ ะทาให ้ทรีตเมนต์อยู่ในหน่ วยทดลองใด โดย ไม่ลาเอียง (bias) ่ จะทาให ้ประมาณค่าความคลาดเคลือ การสุม ่ นของการ ทดลองได ้อย่างถูกต ้อง ท าให ้การหาค่า เฉลี่ย อิท ธิพ ลของทรีต เมนต์ม ีค วาม ถูกต ้อง ท าให ้การเปรีย บเทีย บทรีต เมนต์อ ยู่ บ นพื้น ฐานของ ความยุตธิ รรม ขนตอนและส ั้ งิ่ ทีค ่ วรพิจารณาใน การวางแผนทาการทดลอง ึ ษาปัญหาและวิเคราะห์ปญ 1. ขนศ ั้ ก ั หา 2. ขนต ั้ งว ั้ ัตถุประสงค์ของการทดลอง 3. ขนการเลื ั้ อกทรีตเมนต์ 4. ขนการเลื ั้ อกว ัตถุทดลอง 5. ขนการเลื ั้ อกขนาดการทดลอง 6. ข น ั้ ก า ร เลือ ก เท ค นิค ห รื อ วิธ ี ก า ร ทดลองทีเ่ หมาะสม 7. ขนการเลื ั้ อกแผนการทดลอง ึ ษา และ 8. ข น ั้ การเลือ กล ก ั ษณะทีศ ่ ก ล ักษณะประกอบอืน ่ ๆ ่ การปลูกข ้าวโพดมีปัญหาเรือ เชน ่ งโรคทาให ้ โตไม่ด ี การปลูกข ้าวมีปัญหาเรือ ่ งดิน ้ การป้ องกันการชะชางของดิ น การจะตอบค าถามเหล่า นี้ ไ ด ้จะต ้องมีก าร ทดลองเพือ ่ แก ้ปั ญหา ั ชดเจนและเจาะจงว่ าจะตอบคาถามอะไร หรือทดสอบ สมมุตฐ ิ านอะไร ้ ับประชากรกลุม ทีส ่ าค ัญต้องระบุวา ่ จะใชก ่ ป้าหมาย ประชากรใด ่ งานทดลองหนึง่ มีว ัตถุประสงค์เพือ เชน ่ หาอ ัตราปุ๋ยที่ เหมาะสมต่อการปลูกข้าวนาปร ังในเขตชลประทานภาค กลาง ด ังนนงานทดลองนี ั้ ใ้ ชไ้ ด้ก ับเฉพาะทีท ่ ดลองเท่านน ั้ ต ้องพิจ ารณาว่า tmt ที่เ ลือ กนั ้น สามารถท าให ้บรรลุ วัตถุประสงค์ของการทดลองหรือสามารถตอบคาถามทีต ่ ั ง้ ่ เอาไว ้ได ้ เชน ปั ญหา ข ้าวผลผลิตต่า นั กวิจัยจึงตัง้ สมมุตฐ ิ านสองอัน ดังนี้ วัชพืช? หากเป็ นวัชพืชหามีวธิ ก ี ารกาจัดอย่างไร 1. tmt ควรเป็ น กาจัดวัชพืช กับ ไม่กาจัด ่ ใชแรงงานคนกั ้ 2. tmt ควรมีหลายวิธ ี เชน บสารเคมี •ว ัตถุทดลองควรมีความสมา ่ เสมอหรือมีความ แปรปรวนน้อย เพราะจะทาให้ความคลาดเคลือ ่ นของ การทดลองน้อยด้วย เล็กใหญ่ ขึน ้ กับ tmt ซา้ และขนาดของหน่วย ทดลอง จานวน tmt ขึน ้ กับ วัตถุประสงค์ของการทดลอง ด ้วย จานวนซ้า ขึน ้ กับ ึ ษา › ความแปรปรวนของลักษณะทีศ ่ ก › จานวน tmt › ขนาดของความแตกต่างของ tmt ควรควบคุมอิทธิพลจากภายนอกเพียงพอให ้ tmt แสดงอิทธิพลได ้ในสภาพทีเ่ หมือนกัน 7. ขัน ้ เลือกแผนการทดลอง ึ ษา 8. เลือกลักษณะทีศ ่ ก ้ นกรณีทห ใชใ ี่ น่วยทดลองมีความ สมา ่ เสมอเหมือนก ัน สามารถทีจ ่ ะควบคุมสภาพแวดล้อมให้ หน่วยทดลองมีความเหมือนก ันได้ งานทดลองในห้องปฏิบ ัติการ ่ (randomization) การสุม ่ ทรีตเมนต์สาหร ับหน่วยทดลอง คือการสุม ่ แบบสมบูรณ์ เป็นล ักษณะของการสุม ทุ ก ๆ หน่ ว ยทดลองมีโ อกาสที่จ ะได้ร บ ั ทรีต เมนต์ใดทรีตเมนต์หนึง่ อย่างยุตธ ิ รรม •สมมติวา ่ งานทดลองหนึง่ • ต้องการเปรีย บเทีย บทรีตเมนต์ 4 ทรีทเมนต์ คือ A B C และ D • แต่ละทรีตเมนต์ม ี 5 ซา้ ้ งหมด ขนที ั้ ่ 1 กาหนดหน่วยทดลองทีต ่ อ ้ งใชท ั้ ซงึ่ จะเท่าก ับ ้ (5) จานวนทรีตเมนต์ (4) คูณด้วยจานวนซา ขนที ั้ ่ 2 การให้เบอร์ของหน่วยทดลอง เพือ ่ การ สะดวก ในการ ่ จะให้เบอร์ของหน่วยทดลองตงแต่ สุม ั้ 1 ถึง n คือจานวนหน่วยทดลองทงหมด ั้ จากต ัวอย่าง จะได้ เบอร์หน่วยทดลองตงแต่ ั้ 1 ถึง 20 ด ังนี้ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 ่ จ ัดหน่วยทดลองให้ได้ร ับทรีต ขนที ั้ ่ 3 สุม เมนต์ตา่ ง ๆ โดยวิธ ี จ ับฉลาก หรือใชต้ ารางเลขสุม่ • • • • • ่ โดยการจ ับฉลาก 1. การสุม ทาฉลากทีเ่ หมือน ๆ ก ันจานวน 20 ใบ เขียน ทรีต เมนต์ลงบนฉลาก ทรีตเมนต์ละ 5 ใบตามจานวน ซา้ เขียน A B C และ D ลงบนฉลากอย่างละ 5 แผ่น ม้วนฉลากให้เหมือนก ัน โดยไม่ให้เห็นต ัวอ ักษรท รีตเมนต์ทเี่ ขียนอยูภ ่ ายใน ่ ลากลงในกล่องเขย่าให้ปนก ันดีแล้วค่อย ๆ ใสฉ ่ ลากกล ับคืน ้ มาทีละแผ่น โดยไม่ใสฉ จ ับฉลากขึน แผ่นแรกได้ อก ั ษ รใ ด ก็ จะ เ ป็ น ท รีต เ ม น ต์ ส าหร ับหน่ว ยทดลองที่ 1 แผ่น ที่ 2 ได้อ ักษรใดก็ เป็นทรีตเมนต์สาหร ับ ้ นครบ หน่วยทดลองที่ 2 ทาเช่น นีจ 20 แผ่นด ังตาราง แผนผ ังการทดลอง (lay out) • คือ แผนผ งั ทีแ ่ สดงต าแหน่ง ของหน่ว ย ทดลองในการทดลอง • แต่ละหน่วยทดลองมีการระบุทรีตเมนต์ ั ่ ไว้อย่างชดเจน ทีไ่ ด้ร ับจากการสุม • อานวยความสะดวกให้ก ับผูท ้ ดลอง ใน การให้ท รีตเมนต์ก ับหน่ว ยทดลองต่าง ๆ ได้อย่างถูกต้อง 1 C 2 B 3 C 4 A 5 C 6 B 7 B 8 D 9 A 10 C 11 D 12 A 13 C 14 B 15 A 16 D 17 B 18 D 19 A 20 D ต ัวอย่าง • น ักวิชาการเกษตรทาการทดลองหาสูตรดินผสมที่ เหมาะสมสาหร ับการปลูกกุหลาบ • คด ั เลือ กกิง ่ ตอนกุ ห ลาบที่ม อ ี ายุ แ ละขนาดกิ่ง ที่ เท่าก ัน •นามาปลูกในกระถางทีบ ่ รรจุสต ู รดิน A B C และ D (ทา 4 ซา้ ) • หล ังจากปลูกได้ 60 ว ัน ว ัดความสูงของต้นกุหลาบ หน่วยทดลองได้ด ังนี้ 1 A 58 2 B 31 3 C 31 4 A 82 5 C 65 6 D 108 7 B 53 8 D 99 9 A 89 10 C 33 11 D 126 12 B 44 13 C 43 14 B 22 15 A 72 16 D 147 ตารางแจกแจงข้อมูล หล ง ั จากที่ว ด ั ข้อ มู ล จากหน่ ว ย ทดลองแต่ ล ะหน่ ว ยแล้ว เพื่อ ความ สะดวกในการวิเ คราะห์ข อ ้ มูล ควรน า ต ัวเลขข้อมูลจ ัดเรียงในตาราง ความสูง (เซ็นติเมตร) A B C D 58 31 65 108 89 22 43 126 72 53 33 99 82 44 31 147 ผลรวม Yi. = 301 150 172 480 ค่าเฉลีย ่ = 75.25 37.50 43 120 • จากตารางจะเห็ นได้วา ่ การเรียงต ัวเลขจะเอา ้ ก่อนหล ังก็ได้ เลขไหนขึน • แต่ต อ ้ งเป็ นต วั เลขทีไ่ ด้จ ากหน่ว ยทดลองที่ ได้ร ับอิทธิพลทรีตเมนต์เดียวก ันไว้ดว้ ยก ัน • ห รื อ จ ด ั แ บ่ ง ข้อ มู ล ต า ม ท รีต เ ม นต์น ่น ั เอง ล ักษณะการจ ัดข้อมูลตามทรีตเมนต์อย่างเดียว ้ ่า มี เรีย กข้อ มูล นีว คือแจกแจงตา มทรีตเมนต์เพียงอย่างเดียว ั ้ ทนข้อมูล สญล ักษณ์ทใี่ ชแ •ถ้าให้ Yij คือข้อมูลทีไ่ ด้จากหน่วยทดลอง ที่ j ในทรีตเมนต์ท ี่ i เมือ ่ i = 1, 2,…….t และ j = 1, 2,…..r โดย t คือจานวนทรีตเมนต์ r คือจานวนซา้ ด ังนนข้ ั้ อมูลในตาราง ั สามารถเขียนเป็นสญล ักษณ์ได้ด ังนี้ A B C D Y11 Y21 Y31 Y41 Y12 Y22 Y32 Y42 Y13 Y23 Y33 Y43 Y14 Y24 Y34 Y44 ผลรวม Yi. Y1. Y2. Y3. Y4. Y.. = Grand total ค่ ำเฉลีย่ Yi Y1. Y2. Y3. Y4. Y.. = Grand mean สูตรดิน ผสม การวิเคราะห์ขอ ้ มูล • ก า ร วิ เ ค ร า ะ ห์ ข ้ อ มู ล ที่ ไ ด้ จ า ก ้ ผนการทดลอง ึ ษา โดยใชแ การศก แบบ CRD • มี รู ป แ บ บ ต า ร า ง ก า ร วิ เ ค ร า ะ ห์ ข้อมูล ในรูปของการวิเคราะห์ความ แปรปรวน (Analysis of Variance : ANOVA) สูตรทีใ่ ชใ้ นการคานวณด ังนี้ Source of variation (SOV) Treatment Degree of freedom Sum of Square (S.S.) Mean Squares (M.S.) (t-1) iY2i. – (Y..)2 Treatment S.S. Error t(r-1) Total S.S. – treatment S.S Error S.S. Total N-1 ijY2ij–(Y..) 2 r tr t-1 t (r- 1) tr t = จานวนทรีตเมนต์, r = จานวนซา้ N = จานวนหน่วยทดลองทงหมด ั้ = tr ขนตอนวิ ั้ ธก ี ารคานวณและทดสอบทางสถิต ิ 1. การคานวณค่า degree of freedom (df) 2. คานวณค่า Correction factor (C.F.) 3. คานวณค่า Sum of Squares (S.S.) 4. คานวณค่า Mean Squares (M.S.) 5. คานวณค่า F- Value 6. นาค่าทีค ่ านวณได้ไปใสใ่ นตารางวิเคราะห์ความ แปรปรวน (ANOVA) 7. คานวณค่า Coefficient of variation (C.V.) 8. การทดสอบทางสถิต ิ 1 ขนตอนวิ ั้ ธก ี ารคานวณและทดสอบทางสถิต ิ 1. การคานวณค่า degree of freedom (df) • ค่า df ของ Total คานวณจาก tr-1 = (4 x 4)-1 = 15 • ค่า df ของ Treatment คานวณจาก t-1 = 4-1 = 3 • ค่า df ของ Error คานวณจาก t(r-1) = 4(4-1) = 12 2 2. คานวณค่า Correction factor (C.F.) C.F. = (Y..)2 tr = (1103)2 (4)(4) = 76038.06 3 3. คานวณค่า Sum of Squares (S.S.) Total S.S. = ijY2ij – C.F. = (582 + 312 + 652 +……..+ 1472) –76,038.06 = 96,457 –76,038.06 = 20,418.94 นา้ หน ัก (กร ัม) A B C D 58 31 65 108 89 22 43 126 72 53 33 99 82 44 31 147 ผลรวม Yi. = 301 150 172 480 ค่าเฉลีย ่ = 75.25 37.50 43 120 Treatment S.S. = iY2i. – C.F. r = (3012 + 1502 + 1722 + 4802) –76,038.06 4 = 93,271.25 –76,038.06 = 17,233.19 นา้ หน ัก (กร ัม) A B C D 58 31 65 108 89 22 43 126 72 53 33 99 82 44 31 147 ผลรวม Yi. = 301 150 172 480 ค่าเฉลีย ่ = 75.25 37.50 43 120 Error S.S. = Total S.S. – Treatment S.S. = 20,418.94 – 17,233.19 = 3,185.75 4 4. คานวณค่า Mean Squares (M.S.) Treatment M.S. = Treatment S.S. t-1 = 17,233.19 3 = 5,744 . 39 Error M.S. = Error S.S. t(r-1) = 3,185.75 12 = 265 . 48 5 5. คานวณค่า F- Value F = Treatment M.S. Error M.S. = 5,744.39 265.48 = 21.64 6 6. นาค่าทีค ่ านวณได้ไปใสใ่ นตาราง วิเคราะห์ความแปรปรวน (ANOVA) ตารางวิเคราะห์ความแปรปรวน (ANOVA) SOV df S.S. M.S. F Treatment 3 17,233.19 5,744.39 21.64 Error 12 3,185.75 265.48 Total 15 20,418.94 7 7. คานวณค่า Coefficient of variation (C.V.) C.V. = Error M.S. x 100 Y.. = 265.48 x 100 68.94 = 23 . 64 % • ค่า C.V. เป็ นต ัวเลขด ัชนีบ อกความ เทีย ่ งตรงของงานทดลอง • ถ้าหากงานทดลองใดมี C.V. สูง แสดงว่า งานทดลองนน ั้ มีค วามคลาดเคลือ ่ น หรือ มี ความแปรปรวนสูง • ด ังนนงานทดลองที ั้ ด ่ ี C.V. น้อย ควรจะมีคา ่ 8 8. การทดสอบทางสถิต ิ • การทดสอบทางสถิตเิ พือ ่ ทดสอบว่าอิทธิพล TMT ที่ ึ ษาแตกต่างก ันหรือไม่ ศก • โดยการเปิ ดตาราง F ที่ df ของ Treatment และ ื่ มน df ของ Error และจะต้องกาหนดระด ับความเชอ ่ั ้ ดสอบ ทีใ่ ชท ถ้าค่า F ทีไ่ ด้จากการคานวณสูงกว่าค่า F ทีไ่ ด้ จากการเปิ ดตารางที่ P = 0.05 แสดงว่า TMT ทีน ่ ามาเปรียบเทียบมีความแตกต่างก ันอย่างมี ื่ มน น ัยสาค ัญทางสถิตท ิ รี่ ะด ับความเชอ ่ ั 95 % ึ่ จะใสเ่ ครือ ซง ่ งหมาย * ไว้ เหนือค่า F ในตาราง ANOVA ถ้าค่า F ทีไ่ ด้จากการคานวณสูงกว่าค่า F ทีไ่ ด้ จากการเปิ ดตารางที่ P = 0.01 แสดงว่า TMT ทีน ่ ามาเปรียบเทียบมีความ แตกต่างก ันอย่างมีนย ั สาค ัญทางสถิตท ิ รี่ ะด ับ ื่ มน ความเชอ ่ ั 99 % ึ่ จะใสเ่ ครือ ซง ่ งหมาย ** ไว้ เหนือค่า F ใน ตาราง ANOVA df ของ Treatment df ของ Error F ทีค ่ าณวณได้ ตำรำงวิเครำะห์ ควำมแปรปรวน (ANOVA) SOV df S.S. M.S. F Treatment 3 17,233.19 5,744.39 21.64** Error 12 3,185.75 265.48 Total 15 20,418.94 CV (%) = 23 . 64 % ึ ษา การทดสอบความแตกต่างระหว่าง TMT ทีศ ่ ก ้ า โดยใชค ่ F นนเป ั้ ็ นการทดสอบความแตกต่าง ึ ษาว่ามีความแตกต่างก ัน ของ TMT ทงกลุ ั้ ม ่ ทีศ ่ ก หรือไม่ แต่ไ ม่ส ามารถบอกได้ว ่า ค่า เฉลีย ่ ของทรีต เมนต์ ใดแตกต่างจากทรีตเมนต์ใดบ้าง ในทางปฏิบ ต ั ม ิ ก ั จะต้อ งเปรีย บเทีย บค่ า เฉลี่ ย ระหว่าง TMT ้ ากทีส นิยมใชม ่ ด ุ ในการทดลองทางการเกษตร คือ 1. Least significant difference (LSD) 2. Duncan’s multiple range test (DMRT) การเปรียบเทียบค่าเฉลีย ่ ด้วยวิธ ี LSD 1. คำนวนค่ ำ LSD LSD = t 2Error M.S. r เมื่อ t คือ ค่ ำ t จำกตำรำง t (two-tailed) ที่ df ของ Error และ P = จำกตำรำงจะเปรียบเทียบค่ ำเฉลีย่ ของทรีตเมนต์ ที่ ระดับควำมเชื่อมั่น 99 % (P = 0.01) LSD0.01 = 3.052 x 265.48 4 = 35. 19 • 2. ค านวนแตกต่า งระหว่ า งค่า เฉลีย ่ ของคูท ่ รีตเมนต์ทต ี่ อ ้ งการเปรียบเทียบ ค่าความแตกต่างระหว่าง A ก ับ B = 75.25 – 37.50 = 37.75 ค่าความแตกต่างระหว่าง A ก ับ C = 75.25 – 43.00 = 32.25 ค่าความแตกต่างระหว่าง A ก ับ D = 75.25 – 120.0 = -44.75 ค่าความแตกต่างระหว่าง B ก ับ C = 37.50 – 43.00 = -5.5 ค่าความแตกต่างระหว่าง B ก ับ D = 37.50 – 120.00 = -82. 5 ค่าความแตกต่างระหว่าง C ก ับ D = 43.00 – 120.00 = -77 •เมือ ่ A, B, C, และ D คือทรีตเมนต์ สูตรดิน 4 สูตร • จานวนคูท ่ เี่ ปรียบเทียบก ันได้สง ู สุด = t(t-1) /2 คู่ ึ ษา •เมือ ่ t คือจานวนทรีตเมนต์ทศ ี่ ก 3. นาค่าความแตกต่างระหว่างคูข ่ อง TMT ทีต ่ อ ้ งการเปรียบเทียบมาเทียบค่า LSD ทีค ่ านวณได้ • หากค่าความแตกต่างระหว่างคูข ่ องทรีตเมนต์ ทีต ่ อ ้ งการเปรียบเทียบน้อยกว่าค่า LSD ก็ แสดง ว่าทรีตเมนต์คน ู่ นไม่ ั้ มค ี วามแตกต่างทางสถิต ิ • แต่ถา้ ความแตกต่า งระหว่างค่า เฉลีย ่ ของคู่ท รีตเมนต์ทต ี่ อ ้ งการเปรียบเทียบมีคา ่ มากกว่าค่า LSD ก็ แสดงว่าอิทธิพลของทรีตเมนต์คูน ่ น ั้ มีความแตกต่างก ันทางสถิต ิ TMT เปรียบเทียบ A ก ับ B A ก ับ C A ก ับ D B ก ับ C B ก ับ D C ก ับ D ค่าต่าง ระหว่างคู่ ค่า LSD 37.75 32.25 44.75 5.5 82.5 77.0 35.19 35.19 35.19 35.19 35.19 35.19 ข้อสรุป TMT เปรียบเทียบ A ก ับ B A ก ับ C A ก ับ D B ก ับ C B ก ับ D C ก ับ D ค่าต่าง ระหว่างคู่ ค่า LSD ข้อสรุป 37.75 32.25 44.75 5.5 82.5 77.0 35.19 35.19 35.19 35.19 35.19 35.19 แตกต่าง TMT เปรียบเทียบ A ก ับ B A ก ับ C A ก ับ D B ก ับ C B ก ับ D C ก ับ D ค่าต่าง ระหว่างคู่ ค่า LSD ข้อสรุป 37.75 32.25 44.75 5.5 82.5 77.0 35.19 35.19 35.19 35.19 35.19 35.19 แตกต่าง ไม่แตกต่าง TMT เปรียบเทียบ A ก ับ B A ก ับ C A ก ับ D B ก ับ C B ก ับ D C ก ับ D ค่าต่าง ระหว่างคู่ ค่า LSD ข้อสรุป 37.75 32.25 44.75 5.50 82.50 77.0 35.19 35.19 35.19 35.19 35.19 35.19 แตกต่าง ไม่แตกต่าง แตกต่าง ไม่แตกต่าง แตกต่าง แตกต่าง 4. แสดงผลการทดสอบทางสถิต ิ TMTเปรียบเทียบ ค่าต่างระหว่างคู่ ค่า LSD ข้อสรุป A ก ับ B 37.75 35.19 แตกต่าง A ก ับ C 32.25 35.19 ไม่แตกต่าง A ก ับ D 44.75 35.19 B ก ับ C 5.50 B ก ับ D 82.50 35.19 แตกต่าง C ก ับ D 77.0 35.19 แตกต่าง แตกต่าง 35.19 ไม่แตกต่าง TMTเปรียบเทียบ ค่าต่างระหว่างคู่ ค่า LSD ข้อสรุป A ก ับ B 37.75 35.19 แตกต่าง A ก ับ C 32.25 35.19 ไม่แตกต่าง A ก ับ D 44.75 35.19 แตกต่าง B ก ับ C 5.50 35.19 ไม่แตกต่าง B ก ับ D 82.50 35.19 แตกต่าง C ก ับ D 77.0 35.19 แตกต่าง นา้ หน ักเฉลีย ่ (กร ัม) นา้ หน ักเฉลีย ่ (กร ัม) D 120.0 A 75.25 C 43.00 B 37.50 นา้ หน ักเฉลีย ่ (กร ัม) นา้ หน ักเฉลีย ่ (กร ัม) D 120.0a A 75.25b C 43.00bc B 37.50c ต ัวอ ักษรเหมือนก ันเพียงต ัวเดียวถือว่าไม่ตา่ งก ัน ตารางสรุป สูตรดิน ความสูงเฉลีย ่ (กร ัม) A 75.25b B 37.50c C 43.00bc D 120.0a ต ัวอ ักษรเหมือนก ันเพียงต ัวเดียวถือว่าไม่ตา่ งก ัน • การเปรีย บเทีย บค่า เฉลีย ่ โดยวิธ ี LSD นนเป ั้ ็ นวิธท ี งี่ า่ ย และสะดวกในการใช ้ ้ อ ้ ับการ • ข้อจาก ัดในการใชค ื เหมาะทีใ่ ชก ึ ษาทีม เปรียบเทียบในการศก ่ ี TMT ไม่ มากน ัก การเปรียบเทียบค่าเฉลีย ่ ด้วยวิธ ี DMRT การเปรียบเทียบค่าเฉลีย ่ ด้วยวิธ ี DMRT ั อ ้ นมากกว่า LSD • ซบซ • แต่การใช ้ DMRT จะใชไ้ ด้ดแ ี ม้ม ี TMT ที่ ึ ษาเป็นจานวนมาก (ข้อจาก ัดของวิธ ี LSD) ศก • การใช ้ DMRT ในการเปรียบเทียบนนมี ั้ คา ่ วิก ฤติใ นการเปรีย บเทีย บมากกว่า 1 ค่า (วิธ ี LSD ทีม ่ ค ี า่ วิกฤติเพียงค่าเดียว) ขนตอนการค ั้ านวณ 1. เรียงลาด ับค่าเฉลีย ่ ของ TMT จาก น้อยไปหามาก หรือจากมากไปหาน้อย TMT D A C B นา้ หน ักเฉลีย ่ (g) 120.0 75.25 43.00 37.50 ลาด ับที่ 1 2 3 4 2. คานวณค่า standard error ของค่าเฉลีย ่ (Syi.) Syi. = Error M.S. / r = 265.48 / 4 = 8.15 3. คานวณค่า shortest significant ranges สาหร ับใชเ้ ปรียบเทียบค่าเฉลีย ่ ทีไ่ ด้ ื่ มน เรียงล าด ับไว้ ทีร่ ะด ับความเชอ ่ ั ทีต ่ อ ้ งการ จากสูตร Rp = rpSyi. • ค่า rp คือ significant studentized range ซงึ่ ื่ มน ได้จากการเปิ ดตาราง ทีร่ ะด ับความเชอ ่ ั ทีต ่ อ ้ งการ ้ อ • ค่า df ทีใ่ ชค ื df ของ error, p = 2, 3,4,……t เมือ ่ t คือ จานวนทรีตเมนต์ได้คา ่ rp และคานวณค่า Rp ได้ด ังตาราง 4.32 4.55 4.68 P rp (0.01) จากตาราง Rp (จากการคานวณ) 2 4.32 3 4.55 4 4.68 (8.15 x 4.23) = 34.47 (8.15 x 4.55) = 37.08 (8.15 x 4.68) = 38.14 4. ทดสอบความแตกต่า งระหว่า งค่า เฉลีย ่ ของ TMT ทีไ่ ด้ร ับจากการลาด ับทีไ่ ว้ทล ี ะคู่ ลาด ับที่ เปรียบเทียบ TMT ที่ เปรียบเทียบ ผลต่างของ ค่าเฉลีย ่ ค่า P ค่า Rp 1 ก ับ 2 D ก ับA 44.75 2 34.47 1 ก ับ 3 D ก ับ C 77.00 3 37.08 1 ก ับ 4 D ก ับ B 82.50 4 38.14 2 ก ับ 3 A ก ับ C 32.25 2 34.47 2 ก ับ 4 A ก ับ B 37.75 3 37.08 3 ก ับ 4 C ก ับB 5.50 2 34.47 ข้อสรุป ลาด ับที่ เปรียบเทียบ TMT ที่ เปรียบเทียบ ผลต่างของ ค่าเฉลีย ่ ค่า P ค่า Rp ข้อสรุป 1 ก ับ 2 D ก ับA 44.75 2 34.47 แตกต่าง 1 ก ับ 3 D ก ับ C 77.00 3 37.08 1 ก ับ 4 D ก ับ B 82.50 4 38.14 2 ก ับ 3 A ก ับ C 32.25 2 34.47 2 ก ับ 4 A ก ับ B 37.75 3 37.08 3 ก ับ 4 C ก ับB 5.50 2 34.47 ลาด ับที่ เปรียบเทียบ TMT ที่ เปรียบเทียบ ผลต่างของ ค่าเฉลีย ่ ค่า P ค่า Rp ข้อสรุป 1 ก ับ 2 D ก ับA 44.75 2 34.47 แตกต่าง 1 ก ับ 3 D ก ับ C 77.00 3 37.08 แตกต่าง 1 ก ับ 4 D ก ับ B 82.50 4 38.14 2 ก ับ 3 A ก ับ C 32.25 2 34.47 2 ก ับ 4 A ก ับ B 37.75 3 37.08 3 ก ับ 4 C ก ับB 5.50 2 34.47 ลาด ับที่ เปรียบเทียบ TMT ที่ เปรียบเทียบ ผลต่างของ ค่าเฉลีย ่ ค่า P ค่า Rp ข้อสรุป 1 ก ับ 2 D ก ับA 44.75 2 34.47 แตกต่าง 1 ก ับ 3 D ก ับ C 77.00 3 37.08 แตกต่าง 1 ก ับ 4 D ก ับ B 82.50 4 38.14 แตกต่าง 2 ก ับ 3 A ก ับ C 32.25 2 34.47 ไม่แตกต่าง 2 ก ับ 4 A ก ับ B 37.75 3 37.08 แตกต่าง 3 ก ับ 4 C ก ับB 5.50 2 34.47 ไม่แตกต่าง 5. แสดงผลการทดสอบทางสถิต ิ นิย มเขีย นต วั อ ก ั ษรก าก บ ั ไว้เ หนื อ ต ัวเลขค่าเฉลีย ่ ของแต่ละทรีตเมนต์ ค่าเฉลีย ่ ของทรีตเมนต์ทไี่ ม่แตกต่าง ก ันจะถูกกาก ับด้วยต ัวอ ักษรทีเ่ หมือนก ัน ลาด ับที่ เปรียบเทียบ TMT ทีเ่ ปรียบเทียบ ผลต่างของ ค่าเฉลีย ่ ค่า P ค่า Rp ข้อสรุป 1 ก ับ 2 D ก ับA 44.75 2 34.47 แตกต่าง 1 ก ับ 3 D ก ับ C 77.00 3 37.08 แตกต่าง 1 ก ับ 4 D ก ับ B 82.50 4 38.14 แตกต่าง 2 ก ับ 3 A ก ับ C 32.25 2 34.47 ไม่แตกต่าง 2 ก ับ 4 A ก ับ B 37.75 3 37.08 แตกต่าง 3 ก ับ 4 C ก ับB 5.50 2 34.47 ไม่แตกต่าง ทรีตเมนต์ลาด ับที่ นา้ หน ักเฉลีย ่ (กร ัม) 1 D 2 A 3 C 4 B นา้ หน ักเฉลีย ่ (กร ัม) 120.00 75.25 43.00 37.50 ทรีตเมนต์ ลาด ับที่ นา้ หน ักเฉลีย ่ (กร ัม) 1 2 3 4 D A C B นา้ หน ักเฉลีย ่ (กร ัม) 120.00a 75.25b 43.00bc 37.50c ั พันธ์ - การวิเคราะห์คา่ สหสม - การสร ้างสมการทานายอย่างง่าย Dr. Patcharin Songsri Dept. Plant Sci. & Agric Resources, Fact. Agriculture, Khon Kaen University Chapter Goals After completing this chapter, you should be able to: • Calculate and interpret the simple correlation between two variables • Determine whether the correlation is significant • Calculate and interpret the simple linear regression equation for a set of data • Understand the assumptions behind regression analysis • Determine whether a regression model is significant Pearson correlation coefficient (r) measures the degree of linear association between two intervally scaled variables Two pieces of information: › The strength of the relationship › The direction of the relationship Positive correlation: › high values of one variable associated with high values of the other Example: › Higher STAT scores are associated with better grades in the first year of college Negative correlation: › high values of one variable associated with low values of the other Example: › reduced in fruit number is related with Increased in fruit size Correlation › A measure of association between two numerical variables. Example (positive correlation) › Typically, in the summer as the temperature increases people are thirstier. Positive Correlation Negative Correlation Examples of Approximate r Values y y y x r = -1 r = -0.6 y x x r=0 y r = +0.3 x r = +1 x r value Interpretation 1 perfect positive linear relationship 0 no linear relationship -1 perfect negative linear relationship r value (+,-) Interpretation 1.0 - 0.7 strong association 0.6 - 0.5 moderate association > 0.4 weak association Pearson’s Sample Correlation Coefficient, r measures the direction and the strength of the linear association between two numerical paired variables. Calculating the Correlation Coefficient (r) xy r 2 2 [ x ][ y ] n ( X i X )( Y i Y ) i 1 r n n [ ( X i X ) ][ (Y i Y ) ] i 1 2 i 1 2 Nitrogen Grain yield rate (kg/ha) (kg/ha) (Y) 0 50 100 150 1000 2500 3500 4500 200 4000 Deviation from means X Square of deviation Y (Xi - Ẍ)2 (Yi - Ῡ)2 Product of deviates ((Xi - Ẍ))(Yi - Ῡ) -100.00 -2100.00 10000.00 4410000.00 210000.00 -50.00 -600.00 2500.00 360000.00 30000.00 0.00 400.00 0.00 160000.00 0.00 50.00 1400.00 2500.00 1960000.00 70000.00 100.00 900 10000.00 810000.00 90000.00 Sum 500 15500 0 0 25000 Mean 100 3100 7700000 400000 Compute the Correlation Coefficient (r) xy r 2 2 [ x ][ y ] n ( X i X )( Y i Y ) i 1 r n n [ ( X i X ) ][ (Y i Y ) ] 2 i 1 r 2 i 1 400,000 ( 25,000 )( 7,700,000 0 . 9117 ) r =0.91* Correlation does not imply a causal relationship between variables Causal inferences are made based on underlying knowledge and theories Correlations can be affected by outliers (which is why scatter plots are useful) Underlying relationship is assumed to be linear The Correlation Coefficient • The strength of a linear relationship is measured by the correlation coefficient • The sample correlation coefficient is given the symbol “r” Fundamental Rule of Correlation • Correlation DOES NOT imply causation – Just because two variables are highly correlated does not mean that the explanatory variable “causes” the Response Cautions • The correlation coefficient (r) only gives us an indication about the strength of a linear relationship. • Two variables may have a strong curvilinear relationship, but they could have a “weak” value for ‘r’ Regression › Specific statistical methods for finding the “line of best fit” for one response (dependent) numerical variable based on one or more explanatory (independent) variables. Regression › Includes using statistical methods to assess the "goodness of fit" of the model. (ex. Correlation Coefficient) To describe (or model) To predict (or estimate) To control (or administer) Statistical method for finding › the “line of best fit” › for one response (dependent) numerical variable › based on one explanatory (independent) variable. Draw a scatter plot of the data. Visually, consider the strength of the linear relationship. Draw a scatter plot of the data. Visually, consider the strength of the linear relationship. If the relationship appears relatively strong, find the correlation coefficient as a numerical verification. Draw a scatter plot of the data. Visually, consider the strength of the linear relationship. If the relationship appears relatively strong, find the correlation coefficient as a numerical verification. If the correlation is still relatively strong, then find the simple linear regression line. The coefficient of determination is the portion of the total variation in the dependent variable that is explained by variation in the independent variable The coefficient of determination is also called R-squared and is denoted as R2 R 2 SSR SST where 0R 1 2 (continued) Coefficient of determination R 2 SSR SST sum of squares explained by regression total sum of squares Note: In the single independent variable case, the coefficient of determination is R r 2 2 where: R2 = Coefficient of determination r = Simple correlation coefficient y R2 = 1 R2 = 1 x 100% of the variation in y is explained by variation in x y R2 = +1 Perfect linear relationship between x and y: x y 0 < R2 < 1 x Weaker linear relationship between x and y: Some but not all of the variation in y is explained by variation in x y x R2 = 0 y No linear relationship between x and y: R2 = 0 x The value of Y does not depend on x. (None of the variation in y is explained by variation in x) Temperature (F) Water Consumption (ounces) 75 83 85 85 92 97 99 16 20 25 27 32 48 48 Interpreting the result: y = bx + c › The value of b is the slope › The value of c is the y-intercept › r is the correlation coefficient › r2 is the coefficient of determination Write down the equation of the line in slope intercept form. Press Y= and enter the equation under Y1. (Clear all other equations.) Press GRAPH and the line will be graphed through the data points. Regression Equation: y=1.5*x - 96.9 Water Consumption = 1.5*Temperature - 96.9 Slope = 1.5 (ounces)/(degrees F) › for each 1 degree F increase in temperature, you expect an increase of 1.5 ounces of water drank. y-intercept = -96.9 › For this example, when the temperature is 0 degrees F, then a person would drink about -97 ounces of water. › That does not make any sense! › Our model is not applicable for x=0. • Predict the amount of water a person would drink when the temperature is 95 degrees F. • Solution: Substitute the value of x=95 (degrees F) into the regression equation and solve for y (water consumption). If x=95, y=1.5*95 - 96.9 = 45.6 ounces. Coefficient of Determination – r2 General Interpretation: The coefficient of determination tells the percent of the variation in the response variable that is explained (determined) by the model and the explanatory variable. Example: r2 =92.7%. Interpretation: › Almost 93% of the variability in the amount of water consumed is explained by outside temperature using this model. › Note: Therefore 7% of the variation in the amount of water consumed is not explained by this model using temperature. Relationship between water use efficiency (WUE) (g/kg) and root dry weight (g/plant) under 2/3 AW Source: Songsri et al., 2009. Agricultural water management. 96; 790 –798. The step–by–step procedure for simple linear regression Step 1 Compute the means X and Y, the corrected sum of squares, and the corrected sum of cross products X y 2 n (X i X ) 2 i 1 X n Y x 2 n (Y i Y ) 2 i 1 Y n xy n (X i 1 i X )( Y i Y ) Nitrogen Grain yield rate (kg/ha) (kg/ha) (Y) 0 50 100 150 1000 2500 3500 4500 200 4000 Deviation from means X Square of deviation Y (Xi - Ẍ)2 (Yi - Ῡ)2 Product of deviates ((Xi - Ẍ))(Yi - Ῡ) -100.00 -2100.00 10000.00 4410000.00 210000.00 -50.00 -600.00 2500.00 360000.00 30000.00 0.00 400.00 0.00 160000.00 0.00 50.00 1400.00 2500.00 1960000.00 70000.00 100.00 900 10000.00 810000.00 90000.00 Sum 500 15500 0 0 25000 Mean 100 3100 7700000 400000 Step 2 Compute the estimates of the regression parameters a and b a b Y bX xy x b 2 400,000 16 25,000 a 3,100 - (16)(100) 1, 500 Step 3 Compute r and R2 xy r 2 2 [ x ][ y ] n ( X i X )( Y i Y ) i 1 r n n [ ( X i X ) ][ (Y i Y ) ] 2 i 1 r i 1 400,000 ( 25,000 )( 7,700,000 R 2 2 ( 0 . 9117 ) 0 . 83 2 0 . 9117 )