סיכום למבחן בפסיכולוגיה ניסויית

‫סיכומים למבחן בניסויית‪ :‬שיעורים ‪ +‬ספר ‪ +‬תרגולים‬ ‫מקרא‪:‬‬ ‫כותרת‬ ‫שיעור (לכל מצגת צבע שונה)‬ ‫כותרת באפור ‪ -‬מהשיעורים‬ ‫כותרת בצבע ‪ -‬מהספר (בצבע של כותרת השיעור)‬ ‫מבוא לפסיכולוגיה ניסויית‬ ‫עקרונות החקירה המדעית‪:‬‬ ‫‪ .1‬אמפיריות‪ :‬חקירה מדעית בפסיכולוגיה אפשרית רק ע"י איסוף נתונים‪.‬‬ ‫‪ .2‬אובייקטיביות‪ :‬חקירה מדעית לא תלויה בשיפוטים ערכיים‪ ,‬בראייה סובייקטיבית של החוקר או באמונתו‪ .‬נדרשת חוסר תלות בין המחקר‬ ‫ומסקנותיו לזהות החוקר‪( .‬חוקר לא אובייקטיבי יבצע מחקר מוטה גם אם לא במודע‪ ,‬כנ"ל לגבי גופים)‪.‬‬ ‫‪ .3‬בחינות‪ :‬חקירה מדעית היא אמפירית בלבד‪ ,‬כל מה שלא ניתן לבחינה אינו מתחום עניינו של המדע‪.‬‬ ‫חקירה היפותטית דדוקטיבית‪:‬‬ ‫‪‬‬ ‫‪‬‬ ‫‪‬‬ ‫‪‬‬ ‫‪‬‬ ‫חקירה מדעית תמיד מוכוונת תיאוריה ( ‪ :)Theory Governed‬יוצאת מתוך הנחה תיאורטית כלשהי‪.‬‬ ‫מהתיאוריה נגזרות השערות אמפיריות‪ :‬שכל אחת מהן יכולה להתברר כנכונה )‪ (T‬או שגויה )‪.(F‬‬ ‫כל ההשערות האמפיריות נבחנות באמצעות ניסוי‪ ,‬איסוף מכוון של נתונים וניתוח שלהם‪.‬‬ ‫תוצאות הניסוי נבחנות לאור ההשערות‪ :‬לאחר איסוף הנתונים משווים את מה שהתיאוריה ניבאה למה שיצא בפועל‪.‬‬ ‫הפרכת או אישוש התאוריה‪ :‬ולא הוכחה‪/‬אימות שלה‪ .‬דווקא תוצאות מפריכות תורמות יותר להתקדמות המדע‪.‬‬ ‫הערכת תיאוריה‪:‬‬ ‫‪ .1‬יכולת תיאורית‪ :‬תיאוריה טובה אמורה לתאר כמה שיותר תופעות מתוך עולם התוכן שאליו היא מתייחסת‪.‬‬ ‫‪ .2‬יכולת הסברית‪ :‬תיאוריה טובה אמורה להסביר את עולם התופעות שאליו היא מתייחסת באופן מדויק‪ .‬הסבר טוב מוביל לניבוי טוב ובכך‬ ‫להבנה טובה של עולם התופעות שאנו חוקרים‪ .‬הסבר ← ניבוי וניבוי ← הבנה‪.‬‬ ‫‪ .3‬הנחות יסוד‪ :‬צריכות להתאים לאקסיומות של תיאוריות שכנות מתחומי ידע אחרים‪.‬‬ ‫‪ .4‬אפשרות הפרכה – עיקרון ההפרכה של פופר‪:‬‬ ‫ מדע מאופיין בתהליך מתמשך של הפרכת תיאוריות והחלפתן בטובות יותר (לרוב שינויים קלים – החלפת משתנה‪ ,‬הכנסת משתנה‬‫נוסף ועוד)‪ .‬התיאוריה מופרכת במובן שהמבנה שלה מתגלה כלא מדויק ולכן מוחלף במבנה הסברי טוב יותר‪ .‬לדוג'‪ ,‬תיאורית הדיסוננס‬ ‫החברתי של פסטינגר נכונה רק במקרה של חופש בחירה (רוזנברג) ‪ -‬התוספת לתיאוריה‪.‬‬ ‫ לא ניתן לאמת תיאוריה (רק באינסוף ניסויים = לא אפשרי)‪ ,‬ולכן התקדמות מדעית משמעותית מושגת ע"י נסיונות הפרכה‪.‬‬‫ מכאן נובע‪ :‬תיאוריה שאינה מאפשרת הפרכה (תאוריה חזקה כמו בריאת העולם) אינה תאוריה מדעית! תיאוריה מדעית טובה מאפשרת‬‫הפרכה מהירה ויעילה‪.‬‬ ‫*ראינו את הסרט על תקשורת מתווכת באוטיזם‪ ,‬החוקר המשיך להאמין בתאוריה גם אחרי שהופרכה‪.‬‬ ‫‪ .5‬פרסימוניות (חסכונות)‪ ,‬עקרון התער של אוקהאם‪ :‬תיאוריה מדעית טובה תניח מינימום הנחות משתי סיבות‪( :‬א) תאוריה פרסימונית‬ ‫מאפשרת הפרכה פשוטה יותר ומהירה יותר (לכן תאוריות נפוחות ומורכבות הן בעייתיות)‪( .‬ב) תיאוריה פשוטה (מעט הנחות) קרוב לוודאי‬ ‫נכונה יותר כי ההסתברות לחיתוך של פחות מאורעות גבוהה יותר‪ .‬לסיכום ‪ >-‬תאוריה שמכסה כמה שיותר תופעות עם כמה שפחות הנחות‪.‬‬ ‫תיאוריה בעלת ‪ N-1‬הנחות עדיפה על תיאוריה עם ‪ N‬הנחות כשלשתיהן אותה יכולת הסברית‪.‬‬ ‫תיאוריה על פי קרלינגר‪:‬‬ ‫מערכת של מונחים‪ ,‬הגדרות וטענות המייצגים השקפה על תופעה מסוימת ע"י הצגת היחסים בין המונחים‪ ,‬במטרה להסביר ולנבא את התופעה‪.‬‬ ‫מונח תיאורטי (חסר הגדרה אופרציונלית)‪ ,‬תצפיתי (עבר אופרציונליזציה)‪ ,‬קדם תיאורטי (הגדרה אופרציונלית מקובלת)‪.‬‬ ‫יש כמה סוגי קשרים בין משתני התיאוריה‪ ,‬חלקם מבוססים וחלקם משוערים‪ -‬מכונים חוקי גישור‪:‬‬ ‫‪ .1‬חוקים המגשרים בין מספר מונחים תיאורטיים – למשל‪ ,‬דימוי עצמי משפיע על הישגים‪.‬‬ ‫‪ .2‬חוקים המגשרים ישירות בין מונח תיאורטי למונח תצפיתי – למשל‪ ,‬דימוי עצמי נמדד ע"פ מבחן ציור‪-‬איש‪.‬‬ ‫‪ .3‬חוקים המגשרים בין מונח תיאורטי למונח תצפיתי דרך מונח קדם‪-‬תיאורטי – למשל‪ ,‬מדידת הישג (מונח תיאורטי) ע"י מבחן‬ ‫יכולת (תצפיתי)‪ ,‬מתוך הנחה שיכולת (קדם תיאורטי) משקפת הישגים‪.‬‬ ‫החקירה המדעית – סיכום‪:‬‬ ‫‪‬‬ ‫‪‬‬ ‫‪‬‬ ‫‪‬‬ ‫מניחה דטרמיניזם‪ :‬מערכת סגורה‪ ,‬לא ניתן להניח שמשהו הופיע באופן בלתי צפוי בלא סיבה‪ ,‬לכל תוצאה תופעה שקדמה לה‪.‬‬ ‫סיסטמתית‪ :‬הגדרה מדויקת של עולם התופעות‪ ,‬מדידה מהימנה‪ ,‬מתודולוגיה מקובלת‪ ,‬הסקת מסקנות לוגית מהנתונים‪.‬‬ ‫חייבת ליצר ידע חשוף לכל‪ :‬לצורך חשיפה של העבודה המדעית לעיניים ביקורתיות‪.‬‬ ‫מתבססת על איסוף נתונים‪.‬‬ ‫‪ ‬מייצרת מסקנות‪.‬‬ ‫‪ ‬שואלת שאלות בעלות תשובה ברורה וחד משמעית‪.‬‬ ‫‪ ‬מפתחת תיאוריות ניתנות להפרכה‪.‬‬ ‫מדע מול פסאודו‪-‬מדע‪:‬‬ ‫פסאודו‪-‬מדע‪" :‬חקירה" שנראית מדעית ומציגה רושם של כזו‪ ,‬אך לא עונה על קריטריונים של חקירה מדעית‪' .‬הכי מסוכנת' כי מטה‪ ,‬דברים‬ ‫שנתפסים על ידי אנשים כמוכחים כמדעיים אך למעשה אינם ובכך הם מתעתעים באנשים (אורי גלר‪ ,‬אסטרולוגיה)‪.‬‬ ‫אפיוני פסאודו –מדע‪:‬‬ ‫‪ .1‬ביסוס על "עובדות" אנקדוטליות‪ -‬דברים שכביכול נתפסים כידועים ועובדתיים‪ ,‬בניגוד לממצאים אמפיריים סיסטמתיים‪.‬‬ ‫‪ .2‬אי התאמה לתיאוריות מדעיות מוסכמות – לא כבול לתאוריות מדעיות ואף עומד בסתירה‪.‬‬ ‫‪" .3‬התנגדות" להפרכה ע"י הוספת הנחות חדשות או משתנים בכל פעם‪ ,‬כדי שיהיה הסבר למה זה לא הולך‪.‬‬ ‫‪ .4‬נטייה להסברים פשטניים במונחים פופולריים‪.‬‬ ‫עיקרון האמת‪ :‬הרובד האמפירי לבחינת תיאוריה‪ .‬כששתי תיאוריות מתחרות‪ ,‬בוחרים ניסוי אחד שלפי תוצאותיו יכריעו ביניהן‪.‬‬ ‫פסאודו מדע מפר את קריטריון האמת‪ :‬כי אין דרך מוסכמת בה מאוששים או מפריכים‪.‬‬ ‫פופר – על עיקרון ההפרכה ועל פסאודו מדע‪:‬‬ ‫לפי פופר‪ ,‬אינדוקציה (הכללה מתצפיות לתיאוריה) היא לא דרך מדעית‪ ,‬אלא הדדוקציה‪ -‬העלאת השערה מראש‪ ,‬בדיקתה‪ ,‬ניסיון להפריכה‪ ,‬ובכך‬ ‫אישוש או פסילה שלה‪ .‬אנו מחפשים אישושים לתיאוריות שלנו ולכן קל למצוא אותם (כל צפייה היא סלקטיבית ובעלת מערכת אינטרסים)‪ .‬יש‬ ‫להביא בחשבון אישושים רק אם הם תוצאה של חיזויים מסתכנים‪ :‬כלומר‪ ,‬אם בלי לדעת את התיאוריה הנידונה‪ ,‬היינו מצפים לאירוע שהיה‬ ‫מפריך את התיאוריה‪.‬‬ ‫תיאוריה טובה היא כזו שיש אפשרות להפריך אותה‪ ,‬אך הניסיונות להפריכה לא צלחו‪ .‬מנגד‪ ,‬תיאוריה שלא ניתן להפריך את ההשערות הנגזרות‬ ‫ממנה באופן אמפירי איננה מדעית‪ .‬הוספת הנחות עזר אד‪-‬הוק לתיאוריות שהופרכו‪ ,‬ע"מ "להשאירן בחיים"‪ ,‬הורסת את מעמדה המדעי ("תכסיס‬ ‫קונבנציונליסטי")‪.‬‬ ‫השלכות חברתיות של עיקרון ההפרכה‪ )1( :‬יש לפתוח את המחקרים לציבור ולפרסם אותם בכתבי עת מדעיים‪ )2( .‬יש לראות את הביקורת‬ ‫כעיקרון יסודי במדע ולהיות פתוחים לה‪.‬‬ ‫כשהשערה מופרכת ניתן להסיק ש‪ )1( :‬המחקר לא בדק את מה שהיה אמור לבדוק‪" ,‬המחקר לא טוב"‪ )2( .‬התיאוריה שממנה נגזרה ההשערה‬ ‫היא מוטעית‪.‬‬ ‫מדע הפסיכולוגיה‪:‬‬ ‫מדע הפסיכולוגיה טוען שיש אמת שניתן לגלות ע"י איסוף תצפיות סיסטמתי‪ .‬יש לשאול מהו אובייקט המחקר (המיינד? ההתנהגות?)‪ ,‬ומהי‬ ‫המתודה הטובה ביותר לחקור אותו‪ .‬העיסוק הפילוסופי בפסיכולוגיה עתיק יומין‪ ,‬אך העיסוק המדעי חדש יחסית‪:‬‬ ‫‪ ‬המעבדה של וונדט באירופה‪ ,‬הראשונה לפסיכולוגיה ניסויית‪ .‬טען שהפסיכולוגיה היא מדע ככל המדעים‪.‬‬ ‫ אובייקט המחקר‪ :‬המיינד האנושי‪ ,‬התנסות ומודעות‪.‬‬‫ אנטי רדוקציוניזם‪ :‬אירועים מנטליים לא ניתנים לרדוקציה לאירועים פיזיולוגיים‪ -‬גם אם יכולנו למפות את כל התהליכים הביולוגיים‬‫עדיין היינו יכולים להסביר רק חלק מההתנהגויות ולכן הפסיכולוגיה היא מדע בפני עצמו‪.‬‬ ‫ אירועים מנטאליים מתרחשים סיסטמתית ואינם כאוטיים‪ .‬תפקיד המדען לגלות את הסדר הזה‪.‬‬‫ שיטת המחקר‪ :‬איסוף תצפיות (כמו במדעי הטבע)‪.‬‬‫ הדרך לצפות באירועים מנטליים היא אינטרוספקציה ‪ :‬מתודה מוסדרת המאפשרת תצפיות מדויקות באירועים מנטליים פנימיים‪ .‬למשל‪,‬‬‫נבדק מבצע מטלה ונשאל באיזה אופן חשב וביצע אותה‪.‬‬ ‫‪ ‬הסטרוקטורליזם של טיצ'נר התפתח במקביל בארה"ב (‪.)1927-1867‬‬ ‫ פוזיטיביזם‪ :‬ניתן לדעת על העולם רק ע"י איסוף תצפיות‪ ,‬מה שלא בר צפייה לא מעניינו של המדען‪.‬‬‫ אובייקט המחקר בפסיכולוגיה‪ :‬המיינד והתנסויות מודעות‪.‬‬‫ אסוציטיביים‪ :‬אירועים מנטליים אינם רנדומליים אלא קשורים זה בזה‪ .‬תפקיד החוקר לחקור את טיב קשרים אלו‪.‬‬‫ פרלליזם ‪ :‬אירועים מנטליים ופיזיים מתרחשים במקביל‪ .‬אירועים מנטליים לא ניתנים לרדוקציה לאירועים פיזיים‪.‬‬‫ שיטת המחקר‪ :‬אינטרוספקציה‪.‬‬‫‪ ‬הוויכוח על תמונות מנטליות‪:‬‬ ‫ וונדט והסטרוקטורליסטים טענו כי חשיבה אנושית מלווה בהכרח בתמונות מנטליות‪.‬‬‫ בתחילת המאה ה‪ 20-‬חקר קולפ את הדרך בה יוצרים אסוציאציות מילים‪ .‬השיטה‪ -‬אינטרוספקציה‪ .‬התוצאה‪ -‬אסוציאציות למילים‬‫עולות ללא תמונות מנטליות‪* .‬לא היה אז קריטריון אמת למתודה הסדורה לאיסוף אינפו'‪ ,‬מדובר בויכוח לא מדעי‪.‬‬ ‫ טיצ'נר ווונדט סירבו לקבל את התוצאות בטענה ש"הנבדקים של קולפ אינם מאומנים בלדווח מה באמת מתרחש במוחם"‪.‬‬‫ התוצאה הסופית‪ :‬אין קריטריון אמת מוסכם אפריורי ברור למהי אינטרוספקציה נכונה‪ .‬תם לו עידן האינטרוספקציוניזם‪.‬‬‫‪ ‬המהפכה הביהביוריסטית (ווטסון‪ ,‬סקינר) צמחה על רקע התמוטטות האינטרוספקציוניזם‪.‬‬ ‫‬‫‬‫‬‫‬‫‬‫‬‫‪-‬‬ ‫‪‬‬ ‫אובייקט המחקר‪ :‬ההתנהגות הנצפית (במקום המיינד ותהליכים מנטליים)‪ .‬התנהגות נצפית היא רק זו הניתנת לצפייה ישירה ומדידה‬ ‫אובייקטיבית (תגובה מוטורית)‪.‬‬ ‫הסבר להתנהגות יכול להתבסס רק על קשרי גירוי‪-‬תגובה‪ .‬החוקר נדרש לתאר קשרי גירוי‪-‬תגובה ללא הסברים מנטליים מתווכים‬ ‫(ביהביוריזם רדיקלי)‪.‬‬ ‫אימפריציזם‪ -‬מטען האורגניזם לא רלוונטי בניגוד לנייטיביזם (יכולות מסוימות הן מולדות)‪ .‬האדם נולד כ"טאבולה ראסה"‪.‬‬ ‫אין הבדל מהותי ברכישת התנהגות בין חיות ובנ"א (חיזוקים ועונשים) ולכן עדיף מחקר בחיות‪.‬‬ ‫מטרת הפסיכולוגיה הינה ניבוי התנהגות‪ -‬מה האורגניזם עושה ולא מדוע‪.‬‬ ‫‪ 4‬חוקים בסיסיים שמסירים את ההתנהגות‪ :‬התניה קלאסית‪ /‬אופרנטית‪ ,‬הכחדה קלאסית‪ /‬אופרנטית‪.‬‬ ‫אפשר להסביר באמצעות שרשור (רצף של התניות ‪>-‬למדת את א' ועכשיו את ב')‪ ,‬אבחנה והכללה התנהגויות מורכבות‪.‬‬ ‫התבססות הפסיכולוגיה הניסויית המודרנית באמצעות קריסת הביהביוריזם‪ :‬בסוף שנות ה‪ .50-‬חל בהשפעת‪:‬‬ ‫ המהפכה המדעית בבלשנות‪ ,‬נעם חומסקי‪ :‬חוקי הסינטקס של השפה אינם נורמטיביים נלמדים אלא יש יכולת מולדת לרכשם‪ .‬זהו‬‫רציונליזם בניגוד לאימפריציזם‪.‬‬ ‫ לא ניתן להסביר התנהגות רק ע"י גירויים חיצוניים אלא חייבים להניח ידע מתווך‪ ,‬להסתכל על הקופסה השחורה‪( .‬טולמן)‬‫ הופעת מדעי המחשב ותיאוריות של עיבוד אינפורמציה‪.‬‬‫‪ -‬התפתחות טכנולוגיות‪ ,‬מכשור מדידה וכו'‪.‬‬ ‫הפסיכולוגיה הניסויית המודרנית‪:‬‬ ‫הנחות יסוד‪:‬‬ ‫‪ ‬אינטרוספקציה לא מספקת מידע מהימן ואובייקטיבי בנוגע לתפיסה וביצוע אנושי‪.‬‬ ‫‪ ‬שיפוטים אנושיים רצופי אשליות‪ ,‬הטיות סיסטמתיות וטעויות ידועות מראש‪.‬‬ ‫‪ ‬כדאי להכיר את מערך הכשלים המובנה בתפיסה האנושית‪.‬‬ ‫‪ ‬אין תחליף למדידה ובחינה מדעית אובייקטיבית‪ ,‬אפילו אם מה שמודדים נראה מובן מאליו‪.‬‬ ‫אפיוני הגישה‪:‬‬ ‫‪ ‬המחקר הוא בסיסי ולא יישומי (לא מפתח טכנולוגיות אלא מגלה את האמת על ההתנהגות)‪.‬‬ ‫‪ ‬ברובו מחקר מעבדה‪.‬‬ ‫‪ ‬אימוץ השיטה ההיפותטית דדוקטיבית‪ :‬יש תיאוריה וממנה גוזרים הנחות אותן בודקים בניסוי‪.‬‬ ‫‪ ‬המחקר ממוקד ובוחן מספר משתנים מצומצם‪.‬‬ ‫‪ ‬ההסבר הוא בד"כ ברמת ההתנהגות ולא ברמה הפיזיולוגית (התוכנה ולא החומרה)‪.‬‬ ‫מדעי החברה כמדע – טיעונים נגד‪:‬‬ ‫‪ .1‬אובייקטיביות מצריכה ריחוק בין החוקר לאובייקט מחקרו‪ :‬והחוקר האנושי העוסק בהתנהגות אנושית לא יכול לשמור על ריחוק כזה‪.‬‬ ‫תשובה‪ :‬חשוב שהערכים שמכווינים את החוקר לא ישפיעו על תכנון המחקר וניתוחו‪ .‬גם במדעי הטבע יש נושאים שלחוקרים יש עמדה‬ ‫ערכית לגביהם‪ .‬גדולת החוקר היא להעריך האם עמדותיו משפיעות על האופן בו עורך את המחקר‪.‬‬ ‫‪ .2‬בני אדם ייחודיים ושונים מהעולם הפיסיקלי‪ :‬לכן אי אפשר לנבא התנהגות אנושית כמו שניתן לנבא תנועת גופים‪ .‬גם אם מצליחים לנסח‬ ‫חוק התנהגותי תמיד יהיו יוצאים מן הכלל‪ .‬תשובה‪ :‬כפי שהתנהגותם של גופים היא תוצאה של סיבות‪ ,‬כך גם ההתנהגות האנושית‪ .‬כמו‬ ‫במדעי הטבע הניבוי הוא תמיד הסתברותי ולכן ייתכנו יוצאים מן הכלל‪ .‬הסיבה היא שקשר בין ‪ 2‬גורמים אינו מנותק מהשפעת גורמים‬ ‫אחרים‪ ,‬וכשיתגלו כל הגורמים הרלוונטיים‪ ,‬אפשר יהיה לנבא התנהגות בצורה מדויקת‪.‬‬ ‫‪ .3‬עובדה שיעילות המטפלים היא די מוגבלת (לעומת הצלחות של מדעי הטבע)‪ :‬תשובה‪ :‬העיסוק המדעי בהתנהגות אנושית הוא צעיר‬ ‫ממדעי הטבע ולכן המידע שהצטבר הוא מועט‪ ,‬אולם זה לא אמור להוות טיעון להפסקת העיסוק בו‪.‬‬ ‫האם חשיבתנו האינטואיטיבית היא נורמטיבית‪:‬‬ ‫‪ ‬חשיבה נורמטיבית = משקפת באופן מהימן את עקרונות תורת ההסתברות‪.‬‬ ‫‪ ‬חשיבה אינטואיטיבית = לא נורמטיבית אלא היוריסטית‪ .‬יוריסטיקה‪ :‬קיצור דרך מחשבתי שמספק פתרון קל ומהיר לבעיה סבוכה‪ .‬הבעיה‪:‬‬ ‫לחשיבה היוריסטית כשלים והטיות סיסטמיות‪ ,‬היא לא מתמודדת עם כל מקרה על בסיס העובדות הקיימות אלא על בסיס הנחות יסוד‬ ‫מוקדמות‪.‬‬ ‫דרכים לרכישת ידע (לביצוע חקירה) על פי צ'ארלס פירס‪:‬‬ ‫‪ .1‬שיטת הדבקות‪ :‬אדם שדבק בדעותיו מבלי להטיל בהן ספק ולבחון מידע נוסף‪ ,‬סבור שבידיו כל המידע הנחוץ‪ ,‬אין כאן שאלה שדורשת‬ ‫חקירה‪.‬‬ ‫‪ .2‬שיטת הסמכות‪ :‬אדם שמסתמך על ידע שמגיע מאנשים המוגדרים חברתית‪/‬פוליטית כ"יצרני ידע" ‪ -‬ילד ואביו‪ ,‬חולה ורופא וכו'‪ .‬יש כאן‬ ‫הכרה בצורך לאסוף מידע שהוא בחלקו גם מהימן (ולא להישען רק על ידע שצברת בעצמך)‪.‬‬ ‫‪ .3‬שיטת האינטואיטיביות‪ :‬אדם שדבק באמיתות כשהן נראות לו מתקבלות על הדעת‪ ,‬מתאימות לשכל הישר‪ .‬מצד אחד ניתן להגיע לאמיתות‬ ‫דרך אימוץ בררני ‪ ,‬מצד שני טיעון הגיוני זה עניין אישי שלא בהכרח משקף את העובדות במציאות‪.‬‬ ‫‪ .4‬השיטה המדעית‪ :‬איסוף מידע תוך הסתמכות על אובייקטיביות‪ :‬אין תלות בין הליך המחקר ומסקנותיו לשיפוטים והעדפות של החוקר ‪+‬‬ ‫אמפיריות‪ :‬איסוף ובדיקת נתונים עובדתיים (הנוגעים למציאות)‪.‬‬ ‫מטרות המדע (ברייתוייט)‪:‬‬ ‫‪‬‬ ‫‪‬‬ ‫‪‬‬ ‫‪‬‬ ‫‪‬‬ ‫לגבש חוקים כלליים (המכונים הסברים מדעיים)‪ ,‬המתייחסים להתנהגותם של אובייקטים‪.‬‬ ‫החוקים אמורים לגבש את הידע הקיים ולאפשר ניבוי של אירועים בעתיד ושליטה עליהם‪.‬‬ ‫החוקים מתארים בד"כ קשר בין ‪ 2‬משתנים‪ ,‬אולם הם לא תמיד מספקים בתור הסברים‪.‬‬ ‫חוק כללי מספק כהסבר ככל שאנו מבינים יותר את השרשרת הסיבתית שבין המשתנה המסביר למשתנה המוסבר‪.‬‬ ‫מטרות המדע‪ :‬הבנת השרשרת הסיבתית ‪ ‬הסבר‪/‬גיבוש חוקים ‪ ‬ניבוי ‪ ‬שליטה‪.‬‬ ‫הסבר מדעי ע"פ קרל המפל‪:‬‬ ‫על מנת שחוק כללי יהיה הסבר מדעי עליו לעמוד בשתי דרישות‪:‬‬ ‫‪ ‬רלוונטיות ‪ :‬ניתן לחזות את האירוע המוסבר מן המידע המסביר (סטטיסטית הכוונה היא למתאם)‪ ,‬כלומר ניתן לחזות את ערכו של‬ ‫משתנה אחד ביתר דיוק כשהמשתנה השני ידוע מאשר אם כשהוא לא ידוע‪.‬‬ ‫‪ ‬בחינות‪ :‬ניתן להעמיד את הטענה במבחן‪ .‬טענה שאי אפשר לבחון אותה לא יכולה להיות הסבר מדעי‪.‬‬ ‫שלבי החשיבה המדעית – ‪:Dewey‬‬ ‫‪ .1‬תהייה‪ :‬ניסוח של הבעיה (למה הוא מתנהג בתוקפנות?)‪.‬‬ ‫‪ .2‬השערה‪ :‬ניסוח חוק כללי המקשר בין שני משתנים או יותר (האם תסכול גורם לתוקפנות?)‪.‬‬ ‫‪ .3‬היקש‪ :‬ניסוח השתמעויות אמפיריות ‪ -‬השערה אופרציונלית (אם נסתכל מישהו בכך ש‪ ..‬הוא יגיב בתוקפנות מילולית)‪.‬‬ ‫‪ .4‬בדיקה ומסקנה‪ :‬בחינה אמפירית והסקת מסקנות‪.‬‬ ‫תרגול‪:‬‬ ‫הסרט עם רנדי והקוסם המוזר‪ :‬שלושת העקרונות כפי שמשתקפים בסרט ‪-‬‬ ‫‪ .1‬אמפיריות – הטענה של היידריק היא טענה שניתנת לבדיקה אמפירית במובן שניתן לצפות בה‪ :‬הוא טוען שיש לו יכולת להזיז חפצים‬ ‫בכוח המחשבה‪ ,‬ואת זה אנחנו יכולים לבחון ויזואלית‪.‬‬ ‫‪ .2‬אובייקטיביות – הובאו שופטים אובייקטיבים ולא אינטרסנטיים שיכריעו‪.‬‬ ‫‪ .3‬בחינות – שתי הגישות של רנדי ושל המכשף ניתנות לבחינה כי אפשר לדמיין מקרה שיראה שהן לא נכונות‪ .‬אם המכשף היה מצליח‬ ‫להפוך את הדף אז התיאוריה של רנדי הייתה נופלת‪.‬‬ ‫התיאוריה של רנדי עדיפה כי‪:‬‬ ‫א‪ .‬היא מסתדרת עם אקסיומות מתחומי ידע חיצוניים‪ .‬הנחת החשמל הסטטי של הקוסם למשל לא הסתדרה עם הידע שלנו לגבי איך‬ ‫העולם עובד לפי תיאוריות מקובלות אחרות‪.‬‬ ‫ב‪ .‬תיאוריה פרסימונית יותר כי היא מסתמכת על פחות הנחות‪ .‬הקוסם למשל הוסיף פתאום את הנחת החשמל הסטטי‪.‬‬ ‫סוגי מאמרים‪ )1( :‬מאמר תיאורטי – אין בבסיסו ניסוי (‪ )2‬מאמר אמפירי‪ -‬דיווח על ניסויים (‪ )3‬מאמר סקירה – נכתב ע"י מומחה ומסכם תת‬ ‫תחום מבחינת הידע האמפירי הקיים‪ ,‬פערים ושאלות עתידיות (הצעת תאוריה חדשה)‪.‬‬ ‫מדדים למאמר טוב‪:‬‬ ‫‪ ‬מדד ירושלים‪ :‬מדרג כתבי עת לפי ‪ A( D-A‬הטוב ביותר) לפי אחוז דחיית המאמרים שכתב העת מקבל (יותר דחייה יותר טוב)‪.‬‬ ‫‪ ‬אימפקט פקטור‪ :‬היחס בין הציטוטים של מאמרים מכתב עת מסוים לבין כמה מאמרים אותו ז'ורנל פירסם‪.‬‬ ‫תאוריה וניסוי‬ ‫הגישה היפותטית דדוקטיבית‪:‬‬ ‫בוחנת תאוריה כדי להפריכה‪ ,‬באמצעות ניסוי‪ .‬תיאוריה‪ :‬מערכת מושגים תיאורטיים‪ ,‬אבני בניין‪ ,‬עם קשרים שונים ביניהם ( ‪Theoretical‬‬ ‫‪ .)Construct‬בד"כ תיאוריה היא מכלול מורכב של טענות המתבטא בקשרים רבים בין מושגים עם מבנה פנימי מורכב בד"כ (עדיף לצייר)‪.‬‬ ‫המושגים תיאורטיים ולא ניתנים לצפייה ישירה‪ .‬כדי לבחון אותם יש לתרגמם להגדרה מדויקת‪ ,‬חד משמעית וברת מדידה= אופרציונלית‪.‬‬ ‫הגדרה אופרציונלית מול קונספטואלית‪:‬‬ ‫הגדרה קונספטואלית (נומינלית) מתארת מושגים באמצעות מושגים שכנים בתוך ההקשר התיאורטי‪ ,‬כמו במילון‪ .‬עומדת בפני עצמה ואין לה‬ ‫אלטרנטיבות‪ .‬ההרגל הוא להשתמש בהגדרות כאלו שלא ממש ניתן להתווכח עליהם‪.‬‬ ‫הגדרה אופרציונלית מתארת משתנים פסיכולוגיים באמצעות הדרך בה יש למדוד אותם (האופרציות שיש לעשות) בעזרת ניסוי ספציפי‪.‬‬ ‫מקשרת בין המשתנה התיאורטי ובין האמצעי למדוד אותו‪ ,‬לכן ייתכנו הגדרות אופרציונליות שונות לאותו משתנה תיאורטי שלאו דווקא יסתרו‬ ‫זו את זו‪.‬‬ ‫לדוג'‪" :‬חוקרים טובים מפרסמים את עבודותיהם בעיתונים רבי השפעה"‪ .‬המושגים הנטויים דורשים הגדרה‪ .‬הגדרה קונספטואלית לעיתון מדעי‬ ‫רב השפעה ‪ -‬עיתון שמעצב את אופי העבודה המדעית בתחומו‪ .‬הגדרה אופרציונלית ‪ -‬עיתון שיש לו אימפקט פקטור גבוה מהממוצע בתחומו‪ .‬אך‬ ‫גם אימפקט פקטור הוא מושג בעייתי‪ ,‬כי כמות הציטוטים מושפעת מגורמים נוספים כגון נושא המאמר‪.‬‬ ‫חשיבות ההגדרה ‪ :‬בבניית הניסוי החוקר מתרגם את מושגי התאוריה שבה הוא מעוניין להגדרות אופרציונליות שנראות לו מתאימות‪ .‬המטה היא‬ ‫למדוד בניסוי את כמות המשתנה הרלוונטי לאור ההגדרה שנבחרה‪ .‬חשוב לזכור שבמקרים רבים גורלו של המחקר נחרץ בשלב זה – באם‬ ‫ההגדרה האופרציונלית אינה מוצלחת (הגדרה מוצלחת היא תנאי הכרחי להצלחת המחקר)‪.‬‬ ‫שני סוגי הגדרות אופרציונלית‪:‬‬ ‫א‪ .‬הגדרה אופרציונלית נמדדת ‪ -‬מונחים תיאורטיים הנמדדים באמצעות מבחנים פסיכומטריים (הבנת הנקרא‪ ,‬יכולת מתמטית)‪ .‬תהליך‬ ‫האופרציונליזציה כולל‪ :‬בניית מבחן שתשובותיו הן מדד לכושר הנבדק‪ >-‬קביעת כללים לדרך העברתו ‪ >-‬כללים לציינון‪.‬‬ ‫ב‪ .‬הגדרה אופרציונלית ניסויית ‪ -‬מפרטת את המניפולציה שהחוקר מבצע בניסוי‪ .‬למשל‪ ,‬כדי לבדוק השפעת תסכול על תוקפנות החוקרים מגדירים‬ ‫תסכול כ"תחושה שיש לילדים כשהם נמצאים בחדר מלא צעצועים ולא יכולים לשחק בהם"‪.‬‬ ‫איומים אפשריים על הגדרה אופרציונלית‪:‬‬ ‫‪ ‬בעיית תוקף‪ :‬המשתנה האופרציונלי לא חופף ותואם באופן מלא את המושג התיאורטי (בודק בכלל משהו אחר ממה שהתכוונו לבדוק)‪ .‬אנשים‬ ‫שונים מייחסים משמעויות שונות לאותו מושג‪.‬‬ ‫‪ ‬מהימנות‪ :‬מדידת המשתנה האופרציונלית בבסיסה אינה מאפשרת תוצאה יציבה ועקבית‪ .‬המשתנה האופרציונלי שבחרנו לא מהימן (במדידה‬ ‫אחת יוצא א' ובמדידה אחרת ב')‪.‬‬ ‫דוגמא‪ :‬מי שיש לו כושר לימוד ואינטליגנציה גבוהים יצליח מבחינה אקדמית‪ .‬ההגדרה האופרציונלית היא שממוצע הבגרויות (=כושר לימוד)‬ ‫וציון הפסיכומטרי (=אינטליגנציה) ינבאו הצלחה ב ‪.BA‬‬ ‫‪ ‬שאלת התוקף‪ :‬מדד הינו תקף ככל שהוא מודד את התופעה שהוא אמור למדוד‪ .‬כלומר‪ ,‬ככל שיש יותר התאמה בין ההגדרה הנומינלית של‬ ‫התופעה להגדרה האופרציונלית אותה אנו מודדים‪ .‬האם מבחן פסיכומטרי אכן בודק אינטליגנציה? האם ממוצע הבגרות אכן בודק כושר‬ ‫לימוד?‬ ‫‪ ‬שאלת המהימנות‪ :‬באיזה מידת דיוק ועקביות כלי המדידה שלנו פועל‪ .‬מדד הוא מהימן ככל שהוא משקף את הערכים האמיתיים שהוא‬ ‫אמור למדוד‪ .‬כלומר‪ ,‬ככל שיש בו פחות טעויות מדידה‪ .‬מהימנות בניגוד למרבית סוגי התוקף ניתנת להערכה סטטיסטית‪ .‬האם ציון‬ ‫הפסיכומטרי הוא עקבי ויציב? כלומר‪ -‬אם מישהו ייגש מספר פעמים למבחן‪ ,‬האם יקבל את אותו ציון? (אם השונות תהיה גדולה מאוד זו‬ ‫בעיה)‪.‬‬ ‫מהימנות ‪ -‬שיעורים ‪ +‬ספר‪:‬‬ ‫מדידה מהימנה‪ :‬מדידה מדויקת שערכיה המתקבלים זהים לחלוטין לערכי המשתנה הנמדד (הערכים האמיתיים)‪.‬‬ ‫הציון הנצפה = הציון האמיתי ‪ +‬ציון הטעות‪[Observed Score = True Score + Error] X= t + E .‬‬ ‫הציון האמיתי הוא התוחלת של הערכים הנצפים‪ ,E(x) = T ,‬ממוצע הציונים הנצפים של נבחן שהתקבל ממס' רב של העברות‪ .‬ציון נצפה הוא‬ ‫תצפית אחת מתוך התפלגות שהתוחלת שלה היא הציון האמיתי‪.‬‬ ‫מהימנות היא מדד לבדיקת מידת העקביות‪ /‬יציבות של תוצאות המדידה (הציון) לאורך העברות חוזרות‪ ,‬תנאים משתנים (זמן‪ ,‬מקום‪ ,‬חוקר) וכו'‪.‬‬ ‫חייבים להניח שהתכונה הנמדדת היא בעצמה יציבה במידה סבירה (אחרת אקט המדידה עצמו מוטה)‪.‬‬ ‫טעויות המדידה נחלקות לשני סוגים עיקריים‪:‬‬ ‫(‪ )1‬טעות שיטתית (קבועה)‪ :‬חוזרת על עצמה ומשפיעה באופן עקבי (באותו כיוון) על הביצוע במבחן‪ ,‬ולכן שונותה = ‪ .0‬למשל‪ ,‬כשהמאזניים‬ ‫לא מכוילים הם יטו את המשקל כל הזמן באותה מידה‪ .‬בניגוד לטעות מקרית‪ ,‬אם אנו מודעים לקיומה אנחנו יכולים יחסית בקלות לתקן‪.‬‬ ‫טעות זו לא משפיעה על עקביות המדידה (מהימנות) אלא רק על ציון המדידה עצמו ונובעת מתכונה מסוימת של הנבחן או המבחן שלא‬ ‫קשורה לתכונה הנמדדת‪:‬‬ ‫‪ ‬משתני נבחן (עקבי עבור אותו נבחן)‪ :‬הנטייה של אדם לנחש‪ /‬לא‪ ,‬השליטה בשפת הבחינה‪ ,‬חרדת בחינות‪ ,‬קשיי ריכוז וכו'‪.‬‬ ‫‪ ‬משתני מבחן (עקבי עבור אותו מבחן)‪ :‬איכות ההפקה והעריכה‪ ,‬הקצאת זמן‪ ,‬ניסוח השאלות וכו'‪.‬‬ ‫(‪ )2‬טעות מקרית‪ :‬נובעת ממשתנים מצביים ואירועים מקריים שיכולים להשפיע על הציון בכל כיוון שהוא‪ .‬טעויות מקריות נוטות לקרות בכל‬ ‫מבחן והן בלתי נמנעות‪ ,‬קורות באופן שונה עבור כל שאלה ואינן זהות בהכרח בהעברות חוזרות‪ .‬טעות ששונותה אינה אפס וכל מדידה‬ ‫תאופיין בסטייה שונה‪ .‬משפיעה על מהימנות המדידה וגם על הציון במדידה‪ .‬תכונות של טעות מקרית‪:‬‬ ‫‪E (e x )  0‬‬ ‫‪ ‬מכיוון שבכל מדידה יש טעות‪ ,‬תוחלת משתנה הטעות היא אפס‬ ‫‪ ‬המתאם בין הציון האמיתי לטעות הוא אפס ‪ ,Rt,e = 0‬אין תלות בין ערך הציון והטעות‬ ‫‪ .‬השונות הנצפית בד"כ גדולה יותר מהשונות האמיתית כי היא כוללת את‬ ‫שונות נצפית= שונות הטעויות ‪ +‬שונות אמיתית‬ ‫טעויות המדידה (אלא אם כן שונות הטעויות היא ‪ .)0‬מהימנות מוגדרת כיחס בין השונות האמיתית לשונות הנצפית‪:‬‬ ‫כלומר‪ ,‬מקדם המהימנות הוא שבר (נע בין ‪ 0‬ל ‪)1‬שיכול להיות מוצג בשני אופנים‪:‬‬ ‫מתקרבת למושלמת‪ ,‬וככל שהוא קרוב ל – ‪ 0‬המהימנות נמוכה‪.‬‬ ‫‪ 2t‬‬ ‫‪ 2e‬‬ ‫‪‬‬ ‫‪1‬‬ ‫‪‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪rtt ‬‬ ‫ככל שהוא קרוב ל – ‪ 1‬המהימנות‬ ‫מקדם המהימנות = המתאם הפשוט בין שתי סדרות של ציונים נצפים = המתאם הריבועי בין הציונים האמיתיים לנצפים = היחס בין השונות‬ ‫האמיתית לנצפית (=שיעור השונות הנצפית המוסברת ע"י השונות האמתית)‪.‬‬ ‫לדוג'‪ ,‬אם המתאם בין הציונים הנצפים בשתי מדידות (של אותם נבחנים) הוא ‪ 64% ,0.64‬מהשונות בציונים הנצפים מוסברת ע"י שונות‬ ‫‪0.64  0.8‬‬ ‫הציונים האמיתיים‪ .‬המתאם הפשוט בין הציונים הנצפים לאמיתיים הוא‬ ‫נקודה חשובה מהספר‪ :‬המתאם בין שני משתנים נצפים לא יהיה גבוה משורש מקדם המהימנות של ‪ X‬ומשורש מקדם המהימנות של ‪ .Y‬שורש‬ ‫מקדם המהימנות הנמוך מבין השניים (של ‪ X‬ושל ‪ )Y‬הוא אומדן למתאם הגבוה ביותר האפשרי בין שני המשתנים הנצפים‪.‬‬ ‫המהימנות היא תכונה של האוכלוסייה אליה המבחן מיועד‪ ,‬ולא רק תכונה של המבחן עצמו‪ .‬אם אוכ' הומוגנית מאד‪ ,‬נקבל מהימנות נמוכה‬ ‫יחסית מזו שהיינו מקבלים באוכ' הטרוגנית‪ .‬הסיבה היא שאם אוכ' הומוגנית מאד השונות האמיתית נמוכה‪ ,‬ולכן היחס החלקי של שונות הטעויות‬ ‫(המונה) גדול‪ .‬מכאן‪ ,‬מהימנות תלויה בכך שניקח אוכלוסייה הטרוגנית מספיק‪.‬‬ ‫מהימנות איסוף תצפיות ע"י מבחנים‪ /‬שאלונים‪ :‬מכשיר מרכזי במחקר הפסיכולוגי שמהימנותו קשורה ב ‪ 3‬גורמי טעות מרכזיים‪:‬‬ ‫(‪ )1‬טעות הקשורה בתנאי ובמועד המבחן‪ :‬האם המדידה יציבה לאורך זמן‪ ,‬האם נקבל ציון דומה בזמנים שונים?‬ ‫(‪ )2‬טעות הקשורה במבנה הבחינה‪ :‬האם יש שקילות בין חלקי בחינה‪ ,‬נוסחי בחינה או נוסחי מבחן שונים (מועד א' וב')? ייתכן שאם היינו‬ ‫בוחרים פריטים אחרים היינו מקבלים תוצאה אחרת‪.‬‬ ‫עקיבות פנימית‪ :‬אם פריטי המבחן השונים מודדים כולם משתנה מסוים אמור להיות מתאם בין ציוני הפריטים (מודגם יותר טוב במבחן‬ ‫פתוח)‪ .‬מבחן עם עקיבות פנימית גבוהה הוא מבחן שבו יש מתאם גבוה בין הפריטים‪ ,‬משמע מבחן הומוגני‪ .‬במבחן הטרוגני העקיבות‬ ‫הפנימית תהיה נמוכה‪ ,‬וזה לא תמיד דבר רע‪ -‬בפסיכומטרי למשל אין קשר בין חלק המילולי לכמותי לאנגלית‪.‬‬ ‫(‪ )3‬טעויות הקשורות בשופט המעריך‪ :‬לעיתים חוסר מהימנות בין שופטים קשור בעמימות ההגדרה האופרציונלית (למשל 'תרפיסט טוב')‪,‬‬ ‫שיכולה להיות קשורה בעמימות המושג התיאורטי עצמו (כשרם היה מנהל המחלקה הוא מצא שהמתאם בין המראיינים למגמה הקלינית היה‬ ‫‪.)0.16‬‬ ‫נהוג להעריך מהימנות לפי כל אחת מסוגי הטעויות כשמבצעים לפחות שתי מדידות בלתי תלויות מקבילות‪.‬‬ ‫ככלל‪ ,‬מגדירים מהימנות טובה כשהיא שווה או גדולה מ‪.0.8 -‬‬ ‫‪ .1‬מהימנות כיציבות (‪ - Test-retest‬מבחן חוזר)‪:‬‬ ‫מבחן מהימן יותר ככל שהמתאם בין המדידות שנעשו בשתי העברות שלו גבוה יותר‪.‬‬ ‫יתרון‪ :‬מבקר את השפעתם של גורמים מצביים משתנים על ביצוע הנבדקים‪ ,‬כמו‪ :‬מוטיבציה‪ ,‬מצב הרוח‪ ,‬מזג אוויר וטמפרטורה‪.‬‬ ‫חסרונות‪ :‬מקדם מהימנות בשיטה זו גבוה מהמקדם האמיתי‪ .‬המהימנות האמיתית קטנה יותר מ‪ 2-‬סיבות‪ )1( :‬לא בא לידי ביטוי החלק בשונות‬ ‫הטעויות הנובע מדגימת השאלות‪ )2( .‬להעברה הראשונה של המבחן עלולה להיות השפעה על ההעברה השניה מכיוון שהנבדקים זוכרים חלק‬ ‫מהתשובות‪ .‬מה גם שכל נבדק זוכר דבר מה אחר‪ ,‬ולכן השפעת הזיכרון על הציון אינה אחידה ועלול להתקבל אומדן נמוך מדי ליציבותו של‬ ‫המדד‪ .‬לכן‪ ,‬מדד זה מתאים למבחנים שלא משתפרים בהם או לומדים אליהם‪ ,‬כמו תפיסה‪.‬‬ ‫‪ .2‬מהימנות כאקוויוולנטיות ‪ -‬נוסחים מקבילים‪:‬‬ ‫כדי להתגבר על החסרונות של מהימנות המבחן החוזר בונים שני נוסחים מקבילים של אותו המבחן – עליהם למדוד את אותה התכונה ולהיות‬ ‫בעלי תכונות סטטיסטיות דומות (התפלגות ציונים דומה כשמעבירים לאותה אוכ')‪.‬‬ ‫יתרונות‪ :‬רגישות לשונות הטעותית שמקורה בשאלות עצמן (וגם רגישות חלקית לגורמי זמן וסיטואציה)‪.‬‬ ‫חסרונות‪ )1( :‬גם פה ייתכן שההעברה הראשונה תשפיע על השנייה אך באופן פחות משמעותי‪ ,‬ולכן מדידה זו יותר יעילה‪ )2( .‬הקושי בבניית‬ ‫נוסחים מקבילים בעלי תכונות סטטיסטיות זהות בקירוב‪.‬‬ ‫‪ .3‬מהימנות כעקיבות פנימית‪:‬‬ ‫מבחן הוא מדגם של פריטים שכולם יחד ולחוד מודדים את אותו משתנה‪ .‬מבחן מהימן יותר ככל שהמתאמים בין פריטיו השונים גבוהים יותר‪.‬‬ ‫מדד זה רגיש לדגימת הפריטים (סוג ותוכן)‪* .‬אין בהכרח קשר בין עקיבות פנימית ליציבות‪.‬‬ ‫יתרונות‪ :‬אפשר להשתמש בהעברה אחת של מבחן ואין בעיה הנובעת מהשפעת העברה אחת על השנייה‪.‬‬ ‫חסרונות‪ )1( :‬לא רגיש לגורמים הקשורים באופן‪ /‬מועד העברת המבחן המשתנים לאורך זמן כי הוא מועבר פעם אחת‪ )2( .‬לא מתאים למבחנים‬ ‫שבודקים מספר עולמות תוכן‪ ,‬אלא אם כן מחולקים לתתי פרקים‪ )3( .‬לא מתאים למבחני מהירות‪.‬‬ ‫דרכים למדידת עקיבות פנימית‪:‬‬ ‫(‪ )1‬מהימנות מבחן חצוי‪ :‬חישוב מתאם בין שני חלקים של אותו מבחן‪ .‬מחלקים את פריטי המבחן ל‪ 2-‬קבוצות ומחשבים את המתאם בין‬ ‫הציון הנצפה בחלק אחד ובין הציון הנצפה בחלק השני‪ .‬בד"כ מחלקים לפריטים זוגיים ואי זוגיים‪ ,‬אפשר לחלק גם בדרכים אחרות כמו‬ ‫חלוקתם המקרית של הפריטים בשני החלקים‪ .‬המתאם בין שני החלקים הוא אומדן למהימנות של כל מחצית בנפרד‪ .‬בעייתיות‪ :‬ייתכן‬ ‫שחציות שונות יניבו תוצאות שנות‪ ,‬וכן ייתכן שבתוך החצאים אין עקיבות‪.‬‬ ‫כדי לאמוד את מהימנות המבחן כולו יש להשתמש בנוסחה הנקראת תיקון ספירמן בראון‪:‬‬ ‫‪kr‬‬ ‫‪AB‬‬ ‫‪rxx ‬‬ ‫‪ = rtt‬מציין את מהימנות המבחן כולו‬ ‫‪1 (k 1)r‬‬ ‫‪AB‬‬ ‫‪ = r12‬מציין את המתאם בין שני החלקים‪.‬‬ ‫(‪ )2‬מקדם אלפא קרונבאך‪ :‬שיטה יותר טובה לחשב עקיבות פנימית‪ -‬בוחנים את המתאם של כל זוג שאלות אחת עם השנייה‪.‬‬ ‫ניתן לראות מקדם זה כממוצע של כל מקדמי ספירמן בראון של כל החציות האפשריות‪ ,‬לכן יכול להיות קטן או גדול ממנו באופן מקרי‪.‬‬ ‫מייצרים את כל המתאמים הזוגיים‪ ,‬ממצעים‪ ,‬עושים תיקון סטטיסטי‪ .‬חישוב בפועל‪ :‬קודם נחשב ממוצע של התוצאות בכל פריט עבור‬ ‫כל הנבדקים ואז נחשב את המתאמים בין הממוצעים הללו‪.‬‬ ‫‪‬‬ ‫‪‬‬ ‫‪‬‬ ‫‪‬‬ ‫‪‬‬ ‫‪ 2‬‬ ‫‪si 2‬‬ ‫‪k  s0  ‬‬ ‫‪i 1‬‬ ‫‪rtt ‬‬ ‫‪k  1 ‬‬ ‫‪s0 2‬‬ ‫‪‬‬ ‫‪k‬‬ ‫‪ =K‬מספר פריטים‪,‬‬ ‫‪ = Si‬שונות הפריט ‪,i‬‬ ‫‪ = So‬שונות ציוני המבחן‬ ‫ישנה גם נוסחת עבודה פשוטה יותר‪:‬‬ ‫הוא המתאם הממוצע בין תוצאות הפריטים‬ ‫‪ K‬הוא מספר הפריטים‪.‬‬ ‫‪ ‬מספר הפריטים – ככל שיותר גבוה המהימנות יותר גבוהה משום שהרנדומליות פוחתת‪.‬‬ ‫‪ .4‬מהימנות בין שופטים ‪ -‬טעויות הקשורות במאבחן‪ ,‬בבוחן‪ ,‬או בשופט‪:‬‬ ‫כל מקדמי המהימנות עד כה הניחו שהמדידה היא אובייקטיבית‪ -‬נעשית ע"י מכשיר עם סטנדרטים אחידים לציינון של כל תשובה‪ ,‬אולם יש‬ ‫מצבים בהם הערכת ההתנהגות מתבצעת ע"י שופט אנושי ‪ -‬קביעת הציון היא סובייקטיבית ונוסף מרכיב של שונות טעויות הנובעת מהשופט‬ ‫עצמו (עייף‪ ,‬לא עקבי בשיפוטיו וכו')‪ .‬אחת הדרכים לקבוע את גודל שונות הטעויות היא לתת ליותר משופט אחד להעריך‪ ,‬ולבדוק מהימנות בין‬ ‫שופטים‪ :‬חישוב המתאם (מידת ההלימה) בין הערכותיהם לגבי אותו מדד‪ .‬ככל ששיפוטיהם קרובים יותר מרכיב הטעות קטן יותר והמהימנות‬ ‫גדלה‪ .‬כשיש יותר משניים‪ ,‬מדווחים על מקדמי המתאם שבין כל זוג שופטים‪.‬‬ ‫באיזה מדד לבחור? סוג המבחן והמטרה לשמה מחושבת המהימנות הם שקובעים באיזה מדד יש להשתמש‪:‬‬ ‫‪ ‬מבחן הומוגני‪/‬הטרוגני‪ :‬במבחן הומוגני נבדוק עקיבות פנימית ובמבחן הטרוגני נבדוק יציבות או אקוויוולנטיות‪.‬‬ ‫‪ ‬מבחן מהירות‪/‬כושר‪ :‬מבחני מהירות מוגבלים בזמן ולכן אין טעם לחשב עקיבות פנימית (המתאם בין הראשונים לאחרונים נמוך)‪ ,‬לכן יש‬ ‫לבדוק יציבות ואקוויוולנטיות‪ .‬במבחני כושר (אין לחץ זמן) אפשר להוסיף גם עקיבות פנימית‪.‬‬ ‫‪ ‬מטרת ההערכה‪ :‬כשמעוניינים לבדוק את יציבות המדידה לאורך זמן יש טעם לבחון ‪ .test-retest‬אולם כשמדובר על תכונה המשתנה עם‬ ‫הזמן‪ ,‬המתאם בין ההעברות יהיה נמוך וזה לא ישרת אותנו‪ .‬במקרה זה העקיבות הפנימית היא הביטוי הקרוב ביותר למשמעות תיאורטית של‬ ‫מהימנות‪.‬‬ ‫הקשר בין המדדים השונים‪ :‬בין עקיבות פנימית ליציבות אין קשר בהכרח‪ ,‬אבל בין עקיבות פנימית לאקוויוולנטיות יש‪ :‬אם קיים מתאם‬ ‫גבוה בין פריטי המבחן‪ ,‬אפשר לצפות למתאם טוב בין נוסחים מקבילים‪ .‬אם העקיבות הפנימית גבוהה בהרבה מהאקוויוולנטיות‪ -‬יש לכך ‪2‬‬ ‫הסברים‪ :‬או שיש הבדלי תוכן משמעותיים בין הנוסחים‪ ,‬או שההבדלים בביצוע ‪ 2‬הנוסחים נובעים מפער זמנים בין ‪ 2‬ההעברות‪.‬‬ ‫מהתרגול‪ :‬מהימנות היא חסם עליון לתוקף‪ -‬התוקף לעולם לא יהיה גבוה יותר מהמהימנות של המדידה ולכן‪ ,‬אם אין מהימנות אין מה לדבר על‬ ‫תוקף‪.‬‬ ‫תוקף (המבחן‪/‬המדידה)‬ ‫הגדרה תיאורטית‪ :‬תוקף הוא המידה בה המדידה מודדת את מה שהיא אמורה למדוד‪ ,‬ולא דבר אחר‪ .‬במבחן‪ ,‬תוקף בודק האם התצפיות מודדות‬ ‫את המשתנה התיאורטי שאנחנו מבקשים לחקור‪ .‬תוקף מבחן עונה על מהי המהות הנמדדת במבחן‪ ,‬ובאיזה מידת הצלחה המבחן מודד את המהות‬ ‫שאנו מבקשים למדוד‪ .‬בדיקת התוקף היא תהליך מורכב של הוכחות אמפיריות‪.‬‬ ‫הגדרה אופרציונלית‪ :‬התוקף נחלק ל‪ 3-‬סוגים‪ :‬תוקף ניבוי (במיון למשל)‪ ,‬תוקף תוכן (בבחינות שבודקות ידע למשל)‪ ,‬תוקף מבנה (בהקשרים‬ ‫יותר תיאורטיים)‪.‬‬ ‫‪ .1‬תוקף ניבוי (קריטריון)‪:‬‬ ‫עוסק בשאלה עד כמה המבחן יעיל לניבוי או אבחון תחום התנהגות מוגדר‪ .‬הוא נחוץ כשציוני מבחן המיועד לאבחון או ניבוי משמשים לצורך‬ ‫קבלת החלטות‪.‬‬ ‫המשתנה שרוצים לנבא נקרא 'קריטריון' = ההגדרה האופרציונלית של המשתנה התיאורטי אותו מבקשים לנבא‪.‬‬ ‫תוקף הניבוי = המתאם בין הציון המנבא לציון הקריטריון (ככל שהוא גבוה יותר תוקף הניבוי גבוה יותר)‪ .‬לדוג'‪ ,‬הפסיכומטרי הוא המשתנה‬ ‫המנבא להצלחה בלימודים (המשתנה המנובא)‪ .‬הקריטריון הוא ממוצע ציוני הב‪.‬א‪.‬‬ ‫בעיה‪ :‬עד כמה הקריטריון שנקבע מתאים? עד כמה הוא משקף את המשתנה התיאורטי אותו מבקשים לנבא?‬ ‫שלושה סוגי שימוש בתוקף ניבוי‪:‬‬ ‫‪ ‬תוקף שלאחר מעשה‪ :‬כשהקריטריון נמדד לפני מדידת המשתנה המנבא – משתנה המתייחס לאירוע בעבר (נגיד לנבא כמה מצטייני הדיקן‬ ‫קיבלו בפסיכומטרי)‪.‬‬ ‫‪ ‬תוקף מקביל (‪ :)Concurrent Validity‬כשהקריטריון והמשתנה נמדדים בו זמנית – משתנה המתייחס לאירוע בהווה (למשל‪ ,‬מכשיר‬ ‫המאבחן פגיעה מוחית)‪.‬‬ ‫‪ ‬תוקף ניבוי (‪ :)Predictive Validity‬כשהקריטריון נמדד לאחר מדידת המשתנה המנבא – משתנה המתייחס לאירוע בעתיד (למשל‪,‬‬ ‫פסיכומטרי)‪.‬‬ ‫שלבים בבדיקת תוקף ניבוי‪ )1( :‬הגדרת הקריטריון והדרך למדידתו‪ )2( .‬איתור מדגם מייצג של אוכלוסיית היעד‪ )3( .‬העברת המבחן וחישוב‬ ‫הציונים‪ )4( .‬מדידת הביצוע בקריטריון‪ )5( .‬אמידת המתאם בין ציוני המבחן לבין הביצוע בקריטריון‪.‬‬ ‫בעיות מעשיות בהערכת תוקף ניבוי‪:‬‬ ‫‪ ‬הגדרת הקריטריון‪ :‬קריטריונים רבים קשים להגדרה או למדידה ישירה (מסיבות מתודולוגיות או לוגיסטיות)‪ ,‬למשל‪ :‬אפקטיביות הוראה‪,‬‬ ‫מנהיגות‪ ,‬יכולת להשתלב ביישוב קהילתי‪ .‬לעיתים המשתנה התיאורטי מוגדר בצורה כלשהי באמצעות ציון המבחן‪ ,‬ואז אין דרך ברורה‬ ‫לבחור קריטריון‪ .‬למשל‪ ,‬מהי אינטליגנציה? מה שמבחן ‪ IQ‬מודד‪.‬‬ ‫‪ ‬זיהום ציוני הקריטריון‪ :‬מצב בו ציוני הקריטריון מתקבלים באופן התלוי בציוני המבחן‪ .‬לדוג'‪ ,‬כשהמשתנה המנבא הוא תוצאות הפוליגרף‬ ‫(אשם‪ /‬חף מפשע) והקריטריון הוא הודאה בפשע – של הנאשם או של חשוד אחר – נוצרת תלות בין המשתנה המנבא לקריטריון‪ .‬כלומר‪,‬‬ ‫המשטרה תנסה לחלץ הודאה רק ממי שנמצא "אשם" (משקר) בפוליגרף‪ .‬הבעיה היא שנוצר מדגם מוטה – לא כולל אנשים אשמים שבדיקת‬ ‫הפוליגרף הראתה שהם חפים מפשע (התוקף מוטה לטובת הפוליגרף כמשתנה מנבא)‪.‬‬ ‫‪ ‬זיהום ציוני מבחן‪ :‬זיהוי שגוי של מה שנמדד‪ ,‬בעיקר כשהמבחן פתוח ואין אלגוריתם ציינון חד משמעי‪ .‬יכול להתרחש כשהערכת המבחן‬ ‫מערבת ידע קודם‪ ,‬דעה קדומה או הטיה כלשהי של הבוחן המעריך‪ .‬לדוג'‪ ,‬כשאבחון גרפולוגי נעשה על טקסט של קו"ח‪ ,‬או בפוליגרף‬ ‫כשהבוחן מניח כי הנבדק אשם‪ -‬ציון המבחן של הנבדק "יזוהם"‪ .‬בסרט שראינו‪ -‬כשניתן ידע מקדים (שגוי) למעריכי פוליגרף הוא הטה את‬ ‫תוצאות ההערכה ואנשים חפים מפשע נמצאו אשמים‪ .‬זה קשור להטיית האישוש‪ :‬אנו נוטים לראות דברים שתואמים להשערות שלנו‪ .‬ייתכן‬ ‫שבאופן בלתי מכוון נגיע למסקנות שגויות כי חיפשנו סימנים מאששים‪ ,‬נתנו להם משקל רב יותר והתעלמנו מסימנים מנוגדים‪.‬‬ ‫‪ ‬ייצוגיות המדגם‪ :‬המידה בה המדגם מייצג את האוכלוסייה הרלוונטית‪ .‬מדידת תוקף הניבוי מושפעת מאפיוני האוכ' ובמיוחד משונותה‪ .‬למשל‪,‬‬ ‫מתאמים נמוכים צפויים באוכלוסיות הומוגניות המרוכזות בחלק זה או אחר של ההתפלגות – 'קיצוץ טווח'‪ :‬בציונים של המנבא‪ ,‬הקריטריון או‬ ‫שניהם‪ .‬כל קיצוץ מקטין את שונות המנבא‪ ,‬הקריטריון‪ ,‬או שניהם‪ ,‬ויוצר הערכת חסר של התוקף (הקטנת המתאם בין המנבא לקריטריון)‪.‬‬ ‫‪ ‬קיצוץ תחום בציוני המנבא‪ :‬בכל מיון מועבר מבחן לאוכלוסיית מועמדים‪ .‬מדידת התוקף לאחר מכן מתייחסת רק למועמדים שהתקבלו‬ ‫ולכן בפועל ישנן תוצאות רבות מן המבחן המקורי שלא מקבלות ביטוי בבחינת התוקף מאחר ואין לנו תוצאות קריטריון לצמד אליהן‪.‬‬ ‫‪ ‬קיצוץ תחום בציוני הקריטריון‪ :‬כשמתרחשת נשירה של נבדקים שקשורה בהצלחה באפיוני הקריטריון‪ .‬למשל‪ ,‬נשירת סטודנטים‬ ‫שהלימודים קשים להם‪.‬‬ ‫‪ ‬תנאי המבחן‪ :‬יש להתאימם לתנאים הקיימים במציאות לצורך סימולציה תקפה‪ .‬תנאי מבחן לא מתאימים עלולים להטות את התוצאות‪.‬‬ ‫יתרון וחיסרון של תוקף הניבוי‪:‬‬ ‫יתרון‪ :‬לתוקף הניבוי יש חשיבות מעשית בעיקר בנוגע לבעיות ביישום מבחנים למיון‪ .‬גם לערכים נמוכים (מתאם ‪ )0.3‬יש ערך‪ ,‬אם מכשיר‬ ‫המדידה מבטא שיפור בניבוי לעומת מצב ללא שום מכשיר מדידה‪.‬‬ ‫חסרון‪ :‬לא תמיד אפשר להעריך את תוקף הניבוי משום שהקריטריון מעורר בעיות‪ .‬למשל‪ ,‬כשרוצים לתקף מבחן אינטליגנציה חדש – יש לתקפו‬ ‫עם מדד אחר של אינטליגנציה כדי להיות בטוחים שהמבחן החדש מודד אינטליגנציה ולא מוטיבציה או יכולת לעמוד במבחנים‪ .‬אך האם קיים‬ ‫קריטריון כלשהו לאינטליגנציה שאינו "נגוע" בגורמים הלא‪-‬רלוונטיים הללו?‬ ‫‪ .2‬תוקף תוכן‪:‬‬ ‫כשמבקשים למדוד ביצוע כלשהו באופן ישיר עולה השאלה עד כמה המבחן שאנו עורכים מייצג את עולם התוכן בו עוסקים‪ .‬במקרה זה אין‬ ‫חשיבות לתוקף ניבוי שכן המבחן עצמו הוא הקריטריון (למשל‪ ,‬מבחן סיום של קורסים)‪ .‬מבחן תקף יענה על הקריטריונים‪ )1( :‬מבוסס על‬ ‫ניתוח נכון של עולם התוכן שלנו (‪ )2‬פריטיו משקפים את הניתוח הזה ומייצגים את עולם התוכן שלנו (בלבד)‪.‬‬ ‫לדוג'‪ ,‬אם מבקשים למדוד הצלחה בקורס חשוב לשאול האם פריטי המבחן כוללים את כל פרטי עולם התוכן‪ ,‬והאם לא הכנסנו בטעות פריטים‬ ‫מעולם תוכן שונה (למשל סטטיסטיקה בתוך מבחן בניסויית)‪.‬‬ ‫מפרט מבחן (‪ :)Test specifications‬האמצעי להבטיח תוקף תוכן‪ .‬תכנית הכוללת הגדרה מפורטת של הנושאים‪ ,‬התכנים והמיומנויות שיש‬ ‫לכלול במבחן‪ ,‬לרבות הייצוג היחסי של כל מרכיב‪ .‬נקבע לרוב ע"י מומחים בתחום (אקדמאי‪ ,‬תעסוקתי וכו') ומבוסס על מקורות רלוונטיים‬ ‫(תכנית לימודים‪ ,‬ספרי לימוד‪ ,‬ראיונות עם מועסקים בתחום וכו')‪.‬‬ ‫משפטי מיפוי‪ :‬כשעולם התוכן מוגדר וברור קל מאוד לייצגו באופן אופרציונלי‪ .‬כדי לעשות זאת אפשר להיעזר במשפטי מיפוי‪ -‬למשל‪ ,‬עבור‬ ‫חשבון בכיתה ב'‪ :‬התלמיד נדרש לפעולת (הפעלת כלל‪/‬הסקת כלל) במשימת (חיבור‪/‬חיסור‪/‬כפל) בשפה (מילולית‪/‬מספרית)‪.‬‬ ‫מאפיינים של תוקף תוכן‪ )1( :‬נבדק לרוב לפני העברת מבחן (ולא אחרי)‪ ,‬לא תלוי בתוצאות‪ )2( .‬מבוסס בעיקרו על הליך איכותי ולא על‬ ‫ניתוח סטטיסטי‪ -‬הפעלת שיקול דעת ביחס למידת ההתאמה של המבחן ליעדי המדידה (כפי שנוסחו במפרט)‪.‬‬ ‫לצורך הערכת תוקף תוכן יש לשאול מספר שאלות‪:‬‬ ‫‪ ‬האם פריטי המבחן מייצגים עולם תוכן מוגדר אותו המבחן אמור לייצג‪.‬‬ ‫‪ ‬האם פריטי המבחן ממצים את כל עולם התוכן שאנו מעוניינים לבחון או רק לחלקים ממנו‪.‬‬ ‫‪ ‬בלבדיות‪ :‬האם פריטי המבחן מתייחסים לתוכן שאיננו חלק מעולם התוכן בו אנו מתעניינים‪ .‬בהקשר זה רלוונטית מהימנות של עקיבות‬ ‫פנימית‪ ,‬משום שאם פריטי המבחן מודדים משהו משותף זה תומך בתוקף התוכן‪.‬‬ ‫*קשר לעקיבות ‪ -‬מבחן שיוצא מהימן כעקיבות פנימית מראה שלפריטיו תוקף תוכן גבוה‪ .‬הסתייגות‪ :‬כשהעקיבות מייצגת עולם תוכן עקבי אך‬ ‫שונה מהרצוי ‪ >-‬התוקף תוכן לא גבוה!; או‪ -‬כאשר עולם התוכן הטרוגני ולא אמורה להיות בו עקיבות פנימית!‬ ‫‪ .3‬תוקף מבנה‪:‬‬ ‫דרוש כשרוצים לתקף מכשיר שמודד משתנה תיאורטי (=מבנה)‪ .‬בוחן השערות לגבי עולם התוכן של המשתנה התיאורטי שאותו אנו חוקרים‪.‬‬ ‫למשתנים רבים‪ ,‬כגון שיתוף פעולה‪ ,‬יושר ותוקפנות‪ ,‬אין הגדרה אופרציונלית ברורה וממצה ואין קריטריון חד משמעי‪ .‬כשאין הסכמה לגבי‬ ‫מבנה עולם התוכן לא ניתן לדעת כיצד לבחון אותו‪ .‬לכן‪ ,‬כשרוצים לבחון את תוקף מכשיר המדידה צריך קודם לערוך ניתוח בהיר של המשתנה‪.‬‬ ‫דרכים למדידת תוקף מבנה‪:‬‬ ‫א‪ .‬חקר מתאמים‪:‬‬ ‫המשתנה התיאורטי (מושא המחקר) מעוגן בתאוריה‪ ,‬שמכתיבה סדרת קשרים בין המשתנה למשתנים אחרים‪ .‬הבחינה האמפירית של תוקף‬ ‫מבנה כוללת בדיקה של מתאמים כאלו‪( .‬תוקף מבחין?)‬ ‫ב‪ .‬חקר הבדלים בין קבוצות‪:‬‬ ‫התיאוריה מנבאת הבדלים בין ‪ 2‬קבוצות בתוצאות המדידה‪ ,‬שמציאתם תומכת בתוקף המבנה של המכשיר‪ .‬למשל‪ :‬כדי לתקף שאלון על‬ ‫"מידת העניין במוסיקה"‪ ,‬נבדוק תוצאותיו בקבוצת מנויי הפילהרמונית ובקבוצת לא‪-‬מנויים‪ .‬נצפה שהשאלון יראה כי הקבוצה הראשונה‬ ‫יותר מתעניינת במוסיקה מהשנייה‪( .‬תוקף מתכנס?)‬ ‫ג‪ .‬תוקף הניבוי כחלק מתוקף המבנה‪:‬‬ ‫תוקף ניבוי מוצלח מחזק את תוקף המבנה אך לא מוכיח שהמבחן אכן בודק את התכונה שהוא רוצה‪ .‬למשל‪ :‬תיאורית אינטליגנציה תנבא‬ ‫מתאם חיובי בין מבחן אינטליגנציה למבחן הישגים בלימודים‪ .‬מתאם כזה מצדיק שימוש במבחן האינטליגנציה למיון סטודנטים‬ ‫לאוניברסיטה‪ ,‬ולכן הוא מחזק את תוקף הניבוי‪.‬‬ ‫ד‪ .‬בדיקת מהימנות כחלק מתוקף המבנה‪:‬‬ ‫בתאוריה שמנבאת מתאמים גדולים בין החלקים של המבחן‪/‬שאלון‪ ,‬עקיבות גבוהה תחזק גם את תוקף המבנה‪ .‬למשל‪ :‬במבחן המתיימר‬ ‫לבדוק תכונות אישיות יציבות‪ ,‬נצפה למתאמים גבוהים בין תוצאות המבחן בשתי העברות‪.‬‬ ‫איומים מרכזיים לתוקף מבנה‪:‬‬ ‫‪ ‬חוסר ייצוגיות של המבנה‪ :‬קיים כשההערכה צרה מדי ‪ -‬לא כוללת מאפיינים חשובים של המבנה‪.‬‬ ‫‪ ‬שונות לא רלוונטית למבנה‪ :‬קיים כשההערכה רחבה מדי ‪ -‬מכילה גם שונות עקבית הקשורה למבנים אחרים שאינם המבנה המבוקש‪.‬‬ ‫תוקף מתכנס ותוקף מבחין (קמפבל ופיסק)‬ ‫תוקף מתכנס‪ :‬בדיקה האם המשתנה התיאורטי אכן מצוי במתאם (חיובי או שלילי) עם משתנים אחרים כפי שמנבאת התיאוריה‪ .‬לשם כך‪ ,‬יש‬ ‫להשוות את מכשיר המדידה עם מכשירים אחרים (השונים ככל האפשר) שמודדים את אותו משתנה‪ .‬במידה ויימצא מתאם גבוה בין שני‬ ‫המבחנים נאמר ששניהם בעלי תוקף מתכנס‪.‬‬ ‫**תוקף מתכנס גבוה => מתאם גבוה בין הגדרות אופרציונליות שונות של אותו משתנה תיאורטי‪.‬‬ ‫תוקף מבחין‪ :‬ווידוא כי המשתנה לא מייצג משתנים מעולם תוכן אחר‪ ,‬אלא את עצמו בלבד‪ .‬כלומר‪ ,‬מוודאים שלא מדדתי משהו שלא הייתי צריך‬ ‫למדוד‪ .‬לכן נצפה לחוסר מתאם של המשתנה התיאורטי עם משתנים בלתי רלוונטיים‪.‬‬ ‫**תוקף מבחין גבוה => מתאם נמוך בין הגדרות אופרציונליות של משתנים תיאורטיים שונים‪.‬‬ ‫(‪The Multitrait-Multimethod Matrix )MMM‬‬ ‫שיטה לבד יקת תוקף מבנה המודדת במקביל כמה תכונות לפי כמה שיטות‪ .‬כל נבדק במדגם נבחן בכל אחד מהמבחנים ובכל אחת מהשיטות‪,‬‬ ‫ומחשבים את המתאמים בין כל זוג מדידות‪.‬‬ ‫מתקבלים ‪ 3‬סוגי מתאמים‪:‬‬ ‫‪ ‬מקדמי מהימנות‪ :‬מתאמים בין אותן תכונות‬ ‫שנמדדות באותה שיטה (צפויים להיות‬ ‫הגבוהים ביותר)‪.‬‬ ‫‪ ‬מקדמי תוקף מתכנס ‪:convergent‬‬ ‫מתאמים בין מבחנים שמודדים את אותה‬ ‫התכונה בשיטות שונות (צפויים להיות‬ ‫גבוהים יחסית)‪.‬‬ ‫‪ ‬מקדמי תוקף מבחין ‪:discriminant‬‬ ‫מתאמים בין תכונות שונות הנמדדות באותה‬ ‫השיטה או בין תכונות שונות הנמדדות‬ ‫באותה השיטה או בשיטות שונות (צפויים‬ ‫להיות הנמוכים ביותר)‪.‬‬ ‫תוקף המבנה ובדיקת התיאוריה‪ :‬כשממצאי המחקר עומדים בסתירה לניבוי‪ ,‬החוקר יכול להסיק אחת משלוש המסקנות הבאות‪-‬‬ ‫א‪ .‬המבחן אינו מודד את המשתנה הנחקר ולכן אינו תקף‪.‬‬ ‫ב‪ .‬התאוריה מוטעית‪ .‬למשל‪ :‬ההנחה שיהיו הבדלים בנטייה הספורטיבית של שתי קבוצות (מורים לספורט ומורים אחרים) שגויה‪.‬‬ ‫ג‪ .‬מערך המחקר לא בודק את ההשערה כראוי (היו שיבושים בהעברת השאלון‪ ,‬הקראת ההוראות‪ ,‬הציינון וכדומה)‪.‬‬ ‫הבחנה בין תוקף תוכן לתוקף מבנה‪:‬‬ ‫‪ #‬תוקף תוכן ‪ -‬השאלה האם המשתנים האופרציונליים בניסוי משקפים את מלוא מרחב התוכן של המשתנה התיאורטי‪ .‬בדיקת תוקף תוכן נעשית‬ ‫באמצעות ניתוח אפריורי לוגי (איכותי)‪ ,‬לפי שיקול דעתם של מומחים בתחום‪.‬‬ ‫‪ #‬תוקף מבנה ‪ -‬בוחן את המבנה הפנימי של המשתנה התיאורטי עצמו‪ ,‬ושואל באיזו מידה המבחן מודד את המבנה התיאורטי המבוקש‪ .‬זו בחינה‬ ‫אמפירית ‪ -‬האם המתאמים בין המשתנים שקיבלנו במבחן ובין משתנים אחרים תואמים את המבנה התיאורטי שהנחנו מבחינת התכנסות והבחנה‪.‬‬ ‫תוקף מבנה הוא תנאי הכרחי לתוקף תוכן‪ :‬לפני שברור לחוקר מה כוונתו במבנה התיאורטי בניסוי ובמשתנה התיאורטי‪ ,‬אין טעם לעבוד על‬ ‫הניסוי עצמו‪ .‬לדוג' ‪ -‬מבחן גרפולוגי שבודק האם אנשים הם ישרים‪ .‬תוקף מבנה ‪ -‬נבדוק כיצד אנו מגדירים יושר קודם כל תוקף תוכן‪ -‬נבדוק‬ ‫יושר ע"י גניבות‪ ,‬מעבר באור אדום וכו'‪ .‬כיצד נמפה את התכונה הזו? איזה ממדים היא כוללת? מה הקשר ביניהם?‬ ‫הקשר בין תוקף ומהימנות‪:‬‬ ‫‪‬‬ ‫‪‬‬ ‫‪‬‬ ‫‪‬‬ ‫שונות טעויות גדולה מקטינה גם את המהימנות וגם את התוקף‪ .‬שונות טעויות קטנה מבטיחה את המהימנות‪ ,‬אך לא מבטיחה את התוקף‪.‬‬ ‫מהימנות היא תנאי הכרחי אך לא מספיק לתוקף!‬ ‫מהימנות ותוקף ניבוי ‪ :‬למבחן שאיננו מהימן לא יכול להיות תוקף ניבוי‪ .‬המהימנות הכרחית ומהווה חסם עליון עבורו‪.‬‬ ‫עקיבות פנימית (כמו אלפא קרונבך) תלויה בתוקף תוכן‪ :‬לעיתים נגלה שדווקא תוקף תוכן גבוה יביא לעקיבות פנימית נמוכה‪ .‬אם יש עולם‬ ‫תוכן מאוד מורכב ייתכן שעקיבות פנימית גבוהה מעידה דווקא על כך שכיסינו רק חלק מצומצם מתוך עולם התוכן ומאידך אם נייצג עולם‬ ‫תוכן רחב בצורה תקפה נגלה שהעקיבות הפנימית נמוכה‪.‬‬ ‫עקיבות פנימית תלויה בתוקף מבנה‪ :‬שמכתיב את מערך המתאמים השונים בין פריטי המבחן‪.‬‬ ‫הגדרה מודרנית אינטגרטיבית של תוקף (מסיק – ‪:)1995‬‬ ‫תוקף השלכתי )‪ :(Consequential validity‬בודק את תוקף המבחן תוך התייחסות להשלכות הנגזרות ההשלכות מהשימוש בו‪.‬‬ ‫תרגול – מאמר מדעי‪:‬‬ ‫סוגי מאמרים‪ :‬תיאורטי (מציע תאוריה חדשה‪ /‬מבקר ישנות‪ ,‬אין בבסיסו ניסוי כלשהו); אמפירי (דיווח על ניסויים שנעשו‪ ,‬פחות עוסק‬ ‫בתאוריה); סקירה (נכתב ע"י מומחה ומסכם תת תחום מבחינת הידע הקיים‪ ,‬פערים ושאלות עתידיות‪ -‬מציע תאוריה חדשה)‪.‬‬ ‫מבנה מאמר אמפירי‪ :‬מבנה שעון החול‪-‬‬ ‫‪ .1‬כותרת‪:‬‬ ‫צריכה להגדיר במדויק את הנושא בו המאמר עוסק‪ ,‬וגם להיות מושכת‪ .‬מכילה את כל המושגים התיאורטיים הרלוונטיים –מילות המפתח‪ -‬כדי‬ ‫להבהיר לאיזה עולם תיאורטי מתייחסים במאמר‪ ,‬ולשם איתור פשוט במאגרי המידע‪ 10-12 .‬מילים‪.‬‬ ‫‪ - Abstract .2‬תמצית‪:‬‬ ‫מזעור כל חלקי המאמר‪ -‬פסקת סיכום שת אפשר להבין בדיוק את התיאוריה‪ ,‬מה חיפשו ומה מצאו‪ .‬חשוב שתכיל רק את מה שבמאמר‪ ,‬ללא‬ ‫הפניות וציטוטים‪ .‬האבסטרקט הוא לא הערכתי‪ -‬יש בו מסירת מידע פשוטה בזמן עבר‪ ,‬לא כולל פרשנות‪.‬‬ ‫‪ .3‬מבוא‪:‬‬ ‫הצגת הבעיה (איך התרבות משפיעה על תפיסה)‪ ,‬מה ידוע כיום בספרות (תאוריית ‪ -new look‬התפיסה מושפעת מהנחות התופס‪ ,‬ציפיות התופס‬ ‫וכו'‪ ,‬מטלת ‪ – RFT‬להניח קו במקביל לקרקע‪ ,‬דורש התעלמות מהקשר)‪ ,‬רציונל הניסוי (בנו מטלת ‪ FLT‬במשימה אבסולוטית ויחסית – החידוש‬ ‫הוא ביצירת מטלה לא אלא קוגניטיבית) ושאלה‪ -‬מה החוקרים מציעים‪ ,‬פתרון צפוי‪ -‬השערות הניסוי (הביצוע ישתנה בהתאם לניסוי)‪ .‬בסוף‬ ‫המבוא מציגים את שאלת המחקר ומסבירים מהם המשתנים האופרציונליים‪ .‬איך מאמר מחדש? או ברמה התיאורטית‪ ,‬או בפרדיגמה הניסויית‪.‬‬ ‫‪ .4‬שיטה‪ :‬שתי מטרות עיקריות‪( :‬א) לתת אפשרות לשחזר את הניסוי‪( ,‬ב) ולבקר את מתודת המחקר ‪ -‬לבחון אם היא תואמת את מה שהמחקר‬ ‫רצה לבדוק‪ .‬השיטה בד"כ נחלקת לכמה תתי פרקים קצרים‪:‬‬ ‫‪ .1‬משתתפים – כמות‪ ,‬מאפיינים דמוגרפיים‪ ,‬כיצד גויסו‪ ,‬באיזה תנאים הוחזקו (חיות ניסוי)‪ ,‬מי נשר‪ .‬חשוב לדעת את הפרטים הללו כדי‬ ‫שיהיו עדויות להסבר חלופי לתוצאות המחקר‪ ,‬וכדי לדעת על מי ניתן להכליל את התוצאות‪ .‬במאמר השתתפו רק סטודנטים‪ ,‬שזמן‬ ‫שהותם במדינה האורחת שונה (ליקוי)‪ ,‬מעט נבדקים‪.‬‬ ‫‪ .2‬מכשירים – מהי המטלה? האם היו מכשירים‪ ,‬שאלונים וכו'‪ .‬אם זה כלי שידוע בספרות אז מצטטים מאיפה הביאו אותו ואם ידועים‬ ‫נתונים לגביו כמו תוקף ומהימנות שמים אותם גם‪.‬‬ ‫‪ .3‬מהלך – תיאור מדויק ומפורט של העברת הניסוי‪ .‬במאמר‪ :‬שפת הניסוי (שאח"כ מהווה גם הסתייגות מהתוצאות)‪ ,‬העובדה שהשרטוט‬ ‫התבצע בשולחן אחר‪ ,‬העובדה שהוראות הציור ניתנו לאחר שסיימו לבחון את הגירוי‪ .‬את חלק מהדברים הם מסבירים (ההעברה לקצה‬ ‫השני של החדר) וחלק לא (מתן ההוראות רק אחרי הצגת הגירוי הראשוני)‪.‬‬ ‫‪ .4‬מערך – המשתנים הב"ת והתלויים במחקר‪ .‬במאמר‪ :‬משתנים ב"ת‪ -‬תרבות (יפן‪/‬ארה"ב)‪ ,‬מטלה (יחסית‪/‬אבסולוטית)‪ ,‬גרסא (‪5‬‬ ‫קומבינציות)‪ ,‬שלא מעניינת תיאורטית ונכנסת רק כדי לשלול שהיא הגורם המשפיע‪ .‬המשתנה התלוי‪ -‬גודל הטעות‪.‬‬ ‫‪ .5‬תוצאות‪:‬‬ ‫מה נלמד מהמבחנים הסטטיסטיים ומהממצאים‪ .‬מוצג בגרפים או בטבלה (בנספחים)‪ ,‬ובטקסט‪ -‬תיאור מילולי של התוצאות מהחשוב לפחות‬ ‫חשוב (במטלה האבסולוטית לאמריקאים היה ממוצע טעות גבוה יותר מהאסיאתיים‪ ,‬וההיפך מבטלה היחסית)‪ .‬באינטראקציה מציינים קודם כל‬ ‫אפקטים עיקריים‪ .‬בתיאור התוצאות נהוג לדווח על המבחן הסטטיסטי‪ ,‬הסטטיסטי שהתקבל וה‪ value-p‬שלו‪ .‬אפקטים שהתקבלו אך לא שיערו‬ ‫שיתקבלו חייבים בדיווח אבל לא בהסבר‪ .‬לדוג'‪ ,‬במחקר היה אפקט עיקרי לגרסא‪ ,‬הם דיווחו את זה אך לא התעכבו על זה‪.‬‬ ‫‪ .6‬דיון‪:‬‬ ‫חזרה על התוצאות‪ ,‬ביקורת על הניסוי (נקודות תורפה)‪ ,‬יישומים עתידיים‪ ,‬מחקרי המשך‪ ,‬פרשנות‪ .‬צורתו היא של משפך הפוך מזה שהיה‬ ‫במבוא‪ :‬מהספציפי לכללי‪.‬‬ ‫‪ .7‬הפניות‬ ‫בניית הניסוי‪:‬‬ ‫סוגי מחקרים‪:‬‬ ‫מחקר גישוש‪ :‬חיפוש כללי וגמיש‪ ,‬מסייע לאתר השערות‪ ,‬לא נחשב מדעי‪ .‬מחקר תיאורי‪ :‬נועד לתאר תכונות באוכלוסיה‪ ,‬שכיחות של תופעה‬ ‫או קשר בין משתנים‪ ,‬חשוב שיהיה מהימן‪ .‬מחקר סיבתי‪ :‬נועד לבדוק השערות על סיבתיות‪ ,‬מורכב יותר‪ ,‬חייב לכלול מעבר לקשר הסטטיסטי‬ ‫גם סדר זמנים והפרכת הסברים חלופיים באמצעות מניפולציה‪.‬‬ ‫סיבתיות‪:‬‬ ‫סיבתיות גלויה (ברורה)‪ :‬התאוריה מנבאת כי ‪ A‬גורם ל‪.B-‬‬ ‫סיבתיות סמויה‪ :‬התאוריה מנבאת כי ‪ A‬קשור ל‪ .B-‬בכל אמירה על קורלציות חבויה סיבתיות‪ ,‬שהרי אם ‪ A‬קשור ב‪ B -‬קרוב לוודאי כי שניהם‬ ‫נובעים מ‪ ,C -‬כלומר ‪ C‬גורם גם ל‪ A -‬וגם ל‪.B -‬‬ ‫סוגי קשרים‪( :‬מתאם יתגלה בכולם)‬ ‫רצויים‪:‬‬ ‫קשר סיבתי ישיר‪( .A ← B / B ← A :‬הרבה מהקשרים הישירים מותנים בתנאי‪ ,‬ולכן רובם הם סיבתי מותנה או סיבתי מתווך רק שאין לנו‬ ‫תמיד ידע מספיק כדי להבין מה מתווך)‪.‬‬ ‫קשר סיבתי מתווך‪ ,B ← C ← A :‬משתנה מתווך מבחינת הזמן‪ .‬חרדה ממוות← ערך עצמי והנצחה← מנהיג כריזמטי‪.‬‬ ‫קשר סיבתי מותנה‪ B ← A :‬רק כאשר ‪ C‬קיים‪ .‬אכילת אפרסמונים אכן גורמת לחסימת מעיים‪ ,‬אך רק אצל חולים מסוימים‪.‬‬ ‫לא רצויים‪:‬‬ ‫קשר עקיף‪ :‬קשר עקיף בין ‪ A‬ל‪ A ← C :B-‬ובנפרד ‪( B ← C‬קראו לו בתרגול גם "מתאם מזויף")‪.‬‬ ‫‪ .A‬למשל‪ :‬חרדה חברתית גורמת להימנעות‪ ,‬אך גם הימנעות גורמת לחרדה‪ .‬לא יודעים מה גרם למה‪.‬‬ ‫קשר דו כיווני‪B :‬‬ ‫כדי להוכיח כי ‪ A‬גורם ל ‪ B‬יש לוודא‪( :‬בנוסף כמובן למתאם בין השניים)‬ ‫סדר זמנים‪ A :‬קודם ל ‪ .B‬כלומר‪ ,‬אין הקשר ביניהם נובע מכך ש ‪ B‬גורם ל ‪.A‬‬ ‫‪.1‬‬ ‫הפרכת הסברים חלופיים‪ :‬אין משתנה מתערב (מתווך) נוסף שגורם ל ‪ A‬ו‪/‬או ל ‪ .B‬כלומר‪ ,‬אין מצב בו‪:‬‬ ‫‪.2‬‬ ‫‪ .‬על בעיה זו ניתן להתגבר כך (מהתרגול)‪:‬‬ ‫או‬ ‫‪ ‬הקצאה מקרית ל‪ 2-‬קבוצות‪ :‬בדרך זו מוודאים ששתי הקבוצות זהות (אינטיליגנציה‪ ,‬מצב כלכלי) והדבר היחיד שמבדיל ביניהן הוא‬ ‫המניפולציה‪ .‬רק כך נוכל להגיד שרק ‪ A‬הוא שמשפיע על ‪ .B‬הדגימה צריכה להיות יחסית רחבה‪.‬‬ ‫‪ ‬התאמה‪ :‬במחקרים מסוימים הקצאה מקרית לא תמיד מתאימה‪ .‬לדוג'‪ ,‬במחקר נוירופסיכולוגי שקבוצת הניסוי היא חולים במחלה נוירולוגית‬ ‫כלשהיא‪ ,‬ויש להרכיב קב' ביקורת שתהיה זהה לחלוטין בהכל חוץ מבפגיעה הספציפית שבודקים (אנשים שעברו שבץ‪ ,‬באותו גיל וכו')‪.‬‬ ‫דרישה זו בעייתית שכן קשה לחשוב מראש על כל המשתנים המתערבים האפשרים‪ ,‬ובנוסף מאוד קשה למצוא נבדקים שעונים על כל‬ ‫התנאים‪.‬‬ ‫‪ ‬החזקת משתנה קבוע‪ :‬במקרים מסוימים יש משתנה חיצוני‪ ,‬שהמערך שלנו לא מנסה לבדוק אותו ושיש לו קשר למשתנה התלוי‪ ,‬וכך הוא‬ ‫מתערב בניסוי ויכול להוות הסבר תיאורטי חלופי‪ .‬ניתן לנסות ולצמצם משתנים חיצוניים בכך שנשמור אותם קבועים עבור כל קבוצות‬ ‫ההשוואה ובכך נמנע מהם לגרום להבדל בין הקבוצות‪ .‬לדוג'‪ ,‬שיטת קריאה שמשפרת מיומנויות קריאה לא תעזור לילדים לילדים ממצב‬ ‫סוציו‪-‬אקונומי גבוה כי הם ממילא מקבלים המון תמיכה בבית‪ .‬במקרים אלו נוכל להחזיק משתנה אחד קבוע‪ -‬ז"א‪ ,‬להוציא מלכתחילה את‬ ‫אוכלוסיית הילדים במצב הסוציו אקונומי הגבוה ולבחון את שאלת המחקר שלנו רק על ילדים ממצב סוציו‪-‬אקונומי בינוני ומטה‪.‬‬ ‫דוג' לסיבתיות כגורם מרכזי בתיאוריה‪:‬‬ ‫הויכוח המדעי בנוגע להתחממות כדור הארץ‪ :‬עמדת הרוב היא שכדור הארץ מתחמם כי פעילות אנושיות ותעשייתית גורמת לפליטת דו‬ ‫תחמוצת הפחמן לאטמוספירה (‪ )A‬שגורמת לאפקט החממה שמביא להתחממות (‪ .)B‬כלומר ‪.B ← A‬‬ ‫סיבתיות בתיאוריית ההתחממות הגלובלית‪ :‬מציאת מתאם ברור בין עליית רמות ‪ Co2‬להתחממות גלובלית לא מעיד על נכונות התאוריה‪.‬‬ ‫הנקודה הקריטית נוגעת לסדר זמנים לפיו קודם הייתה עלייה בכמות ה‪ Co2-‬ולאחר מכן עלייה בטמפ'‪ .‬בסרט שראינו חוקרים מצאו שעליית‬ ‫הטמפרטורה קודמת לעליית ריכוז ה‪.Co2-‬‬ ‫מחקר מתאמי‪ /‬ניסויי‪:‬‬ ‫מחקר ניסויי‪ :‬החוקר מפעיל מניפולציה של משתנה ב"ת (משתנה מתופעל)‪ ,‬ומודד את השפעתו‪ /‬השפעתם על משתנה תלוי כלשהו‪ .‬ז"א‪ ,‬הוא‬ ‫יוצר הבדלים בין הנבדקים בערכי המשתנה הב"ת‪ ,‬ובוחן את השפעתם‪ .‬החוקר יכול לשלוט בסדר הזמנים ולבחון הסברים חלופיים‪ .‬אבל‪,‬‬ ‫קיימים גם הבדלים בתוך הקבוצות הללו – הבדלים בינאישיים המהווים מטרד עבור החוקר‪ .‬ככל שהם גדולים יותר‪ ,‬כך קשה יותר לחוקר לגלות‬ ‫הבדלים הקיימים בין קבוצות הניסוי השונות‪ .‬מחקרים ניסויים בד"כ מתחילים ממחקרים מתאמיים‪ -‬לוקחים נתונים סטטיסטיים ומוצאים מתאם‬ ‫בין ‪ 2‬משתנים ‪ >-‬גוזרים תיאוריה ‪ >-‬מבצעים מערך ניסויי בו שולטים בקשרי סיבתיות‪.‬‬ ‫משתנה מתופעל‪ :‬משתנה ב"ת שהחוקר עצמו מבצע בו את המניפולציה‪ ,‬ז"א נותן את ערך המשתנה לנבדקים ע"פ רצונו‪.‬‬ ‫אופי המניפולציה‪ :‬מה ישתנה בין תנאי הניסוי‪ )1( :‬מצבי ניסוי משתנים (‪ )2‬מטלות ניסוי משתנות (‪ )3‬הוראות ניסוי משתנות‪.‬‬ ‫יתרון המערך הניסויי‪ :‬מאפשר לפקח ולשלוט במשתנים‪ ,‬ולהסיק מהמחקר מסקנות סיבתיות‪.‬‬ ‫חסרון המערך הניסויי‪ :‬במצבים רבים אי אפשר לעשות מניפולציה במשתנים – למשל‪ ,‬להכתיב את האינטליגנציה של נבדק‪ ,‬או לתת לאנשים‬ ‫לאכול תקופה ארוכה מזון אורגני או סוג אחר ולבדוק תוחלת חיים‪ .‬בנוסף‪ ,‬יש מצבים בהם לא מוסרי לעשות מניפולציה– למשל‪ ,‬לתת לילדים‬ ‫חיזוקים שליליים כדי לבדוק את השפעתם על דימויים העצמי‪.‬‬ ‫מחקר מתאמי‪ :‬החוקר בוחן הבדלים נתונים בין הנבדקים ‪ -‬הן במשתנה הב"ת (משתנה ייחוס) והן במשתנה התלוי‪ .‬החוקר לא מפעיל מניפולציה‬ ‫לשם כך אלא מקבל מתאמים כנתון‪ .‬במחקר מתאמי אין שליטה בסדר הזמנים ובסיבתיות‪ ,‬ולכן הוא טומן בחובו הסברים חלופיים‪ .‬לעומת המחקר‬ ‫הניסויי‪ ,‬במחקר המתאמי ההבדלים הבינאישיים הכרחיים‪.‬‬ ‫משתנה ייחוס‪/‬נמדד‪ :‬משתנה ב"ת שהחוקר מקבל כנתון ולא משנה את ערכו‪ .‬אין הקצאה מקרית‪ .‬לדוג'‪ ,‬חוקר שבדק את השפעת שביעות רצון‬ ‫העובדים (מילאו שאלון) על איכות העובד (קיבל ציון הערכה מההנהלה)‪.‬‬ ‫יתרון המערך המתאמי‪ :‬פחות מלאכותי וקרוב יותר למציאות‪ ,‬בהשוואה לניסויי‪.‬‬ ‫חסרון המערך המתאמי‪ :‬פחות שליטה על המשתנים‪.‬‬ ‫משתני אישיות (כמו אינטליגנציה‪ ,‬מין) הם משתני ייחוס מטבעם שאי אפשר לתפעל‪ -‬משתני נבדק‪ .‬לעומתם יש משתנים שניתן לבחור את‬ ‫"מעמדם"‪ .‬למשל‪ ,‬השפעת חרדה על הישגים ניתן לבחון במחקר מתאמי (מתאם בין רמת החרדה לציון)‪ ,‬או במחקר ניסויי (גרימת חרדה לקבוצה‬ ‫אחת והפחתת חרדה אצל השניה‪ ,‬ואח"כ מתן אותו מבחן הישגים לשתיהן)‪.‬‬ ‫ההחלטה אם המערך ניסויי‪/‬מתאמי תלויה בסוג המשתנה הב"ת (מופעל או ייחוס) ולא בשיטת בדיקת ההשערה‪ .‬כאשר החוקר בעצמו יצר או‬ ‫סייע ליצירת ההבדלים במשתנה הב"ת אז זהו מערך ניסויי‪ ,‬וכאשר ההבדלים היו נתונים מדובר במערך מתאמי‪.‬‬ ‫דוגמא ‪ :‬חוקר מצא מתאם גבוה בין מזון אורגני לתוחלת חיים ארוכה‪ ,‬ולכן הסיק שמזון אורגני מגדיל תוחלת חיים‪ ,‬אך הסיבתיות לא ידועה‪:‬‬ ‫ייתכן כי אלו שאוכלים מזון אורגני הם בעלי רמה סוציו‪-‬אקונומית גבוהה יותר ואוכלים יותר מזון אורגני (יקר)‪ .‬לחלופין‪ ,‬ייתכן כי מי שאוכל‬ ‫מזון אורגני בד"כ גם יותר מודע בתחומים אחרים (כושר נגיד)‪ .‬המדגם נערך על ‪ 10,000‬נבדקים‪ ,‬יש לשים לב ‪ -‬גודל המדגם אינו ערובה‬ ‫לנכונות מסקנותיו!‬ ‫למרות שמחקר מתאמי לא שולט בקשרי סיבתיות וכיוונם‪ ,‬הוא נתפס כמעט באופן טבעי שכזה‪ .‬לעיתים קרובות מסקנת המחקר מוצגת כטענה‬ ‫ברורה של סיבתיות למרות שהמחקר מספק מתאם ולא יותר‪.‬‬ ‫הבדלים בין המערכים‪:‬‬ ‫א‪ .‬מידת השליטה בערכי המשתנה הב"ת‪ :‬במערך הניסויי החוקר קובע את ערכי המשתנה‪ .‬במחקר המתאמי המשתנה הב"ת נתון‪.‬‬ ‫ב‪ .‬העניין בהבדלים בינאישיים‪ :‬חוקר המערך הניסויי מחלק את הנבדקים ל‪ 2-‬קבוצות הנבדלות במשתנה הב"ת‪ ,‬ומתעניין בהבדלים שנוצרו‬ ‫ביניהן כתוצאה מהמניפולציה‪ .‬הוא רוצה לדעת האם יש הבדל מעבר להבדלים הבין‪-‬אישיים הקיימים ממילא‪ .‬לכן ההבדלים הבינאישיים‬ ‫בתוך הקבוצות מפריעים לו‪ -‬ככל שהם יותר גדולים‪ ,‬כך קשה לו לגלות את ההבדלים בין הקבוצות‪.‬‬ ‫במערך המתאמי אי אפשר לשלוט במשתנה הב"ת‪ .‬לכן‪ ,‬ההבדלים הבין אישיים בתוך הקבוצה הכרחיים‪.‬‬ ‫ג‪ .‬סוג המסקנות המוסקות‪ :‬מערך מתאמי מאפשר רק להסיק על קשר בין משתנים‪ .‬המערך הניסויי יכול להצביע על קשר סיבתי ‪ -‬החוקר‬ ‫שולט בסדר הופעת המשתנים ויכול גם להפריך הסברים חלופיים‪.‬‬ ‫מחקר ניסויי‪ -‬שדה או מעבדה‪:‬‬ ‫מחקר שדה – החוקר מבצע את מדידותיו בשטח‪ .‬יתרון‪ :‬תוקף אקולוגי‪ .‬בתוך מחקר זה קיים מחקר שדה אנתרופולוגי מסורתי‪ ,‬בו החוקר יוצא‬ ‫לשהייה ארוכה במסגרת חברתית כלשהי ורושם את תצפיותיו‪ ,‬או מחקר שדה בו החוקר לא מעורב בכל מרכיבי החיים של הקב'‪ ,‬אלא בהיבטים‬ ‫מסוימים‪ ,‬ולכן נוכח במקום לסירוגין‪.‬‬ ‫מחקר מעבדה ‪ -‬החוקר קובע את המשתנים הבלתי תלויים‪ ,‬הרמות שלהם ואופי המניפולציה הניסויית שהוא מבקש להפעיל‪ .‬החוקר דואג‬ ‫שהמשתנה הב"ת יופעל לפני מדידת המשתנה התלוי כדי לבחון את הכיוון הסיבתיות‪ .‬יש להציב קב' ביקורת או תנאי ביקורת כדי לבודד את‬ ‫השפעת המניפולציה‪ .‬יתרון‪ :‬יותר שליטה על המשתנים והמעבדה מותאמת לצרכי החוקר‪.‬‬ ‫דוגמה למחקר – תוקפנות ילדים של בנדורה ורוס‪:‬‬ ‫השפעת צפייה בהתנהגות תוקפנית על אימוץ דפוסי תוקפנות אצל ילדים‪.‬‬ ‫חלוקה לקבוצות ניסוי‪( :‬א) ילדים צופים במבוגר מכה בובת פלסטיק‪( .‬ב) צופים בסרט בו מבוגר מכה את הבובה‪( .‬ג) צופים בסרט מצויר בו‬ ‫דמות מוכרת מכה את הבובה‪( .‬ד) סרט ניטרלי בלי מודל תוקפני‪.‬‬ ‫מהלך‪ :‬צופים בסרט ואז מכניסים את הילד לחדר עם צעצועים‪ ,‬ביניהן בובת הפלסטיק מהסרט‪.‬‬ ‫תוצאות‪ :‬שלושת הקבוצות שצפו במודלים התוקפניים נהגו באלימות כלפי הבובה‪ ,‬לעומת קבוצת הבקרה‪ .‬בנים יותר מבנות‪.‬‬ ‫מסקנות‪ )1( :‬צפייה בהתנהגות תוקפנית מגבירה תוקפנות אצל ילדים‪ ,‬גם בנים וגם בנות‪ )2( .‬אין הבדל מובהק בסוג המודל (‪ )3‬בנים תוקפניים‬ ‫יותר מבנות‪.‬‬ ‫סוג המחקר‪ :‬ניסויי ולא מתאמי (המשתנה הב"ת הופעל לפני מדידת המשתנה התלוי על מנת לבחון את כיוון הסיבתיות‪ :‬צפייה בהתנהגות‬ ‫תוקפנית ← תוקפנות‪ .‬בנוסף‪ ,‬הוצב תנאי ביקורת כדי לבודד את השפעת המניפולציה)‪ .‬זהו מחקר מעבדה ולא מחקר שדה‪.‬‬ ‫משתנה ב"ת‪ :‬מצבי ניסוי משתנים (מטלת ניסוי והוראות זהות) ‪ 3 -‬רמות של מניפולציה "צפייה בהתנהגות תוקפנית"‪ 2 .‬רמות של משתנה ב"ת‪,‬‬ ‫משתנה נבדק – זכר‪/‬נקבה (לא יכול להיות מתופעל)‪.‬‬ ‫משתנה תלוי‪ :‬מספר אקטים תוקפניים כפי שנקבעו ע"י שופטים‪.‬‬ ‫עקרונות בקרה ניסויית‬ ‫א‪.‬‬ ‫ב‪.‬‬ ‫ג‪.‬‬ ‫ד‪.‬‬ ‫בלעדיות‪ :‬מצב בו רק המשתנה הבלתי תלוי שקבענו משפיע על התלוי‪ ,‬בלי "הסתננות" גורמים נוספים – ניסוי סטרילי‪ .‬לרוב זה מובטח‬ ‫ע"י קבוצת ביקורת שעושה בדיוק אותו הדבר מלבד המניפולציה‪.‬‬ ‫עוצמת המניפולציה‪ :‬המניפולציה צריכה להיות מספיק חזקה כך שתגרום לאפקט המצופה‪ .‬בניסויים בפסיכולוגיה חברתית בהם ישנם‬ ‫תהליכי עיצוב עמדות ואמונות זה חשוב במיוחד‪.‬‬ ‫קשר מתאים בין עצמת המניפולציה לערכי המשתנה התלוי‪ :‬צריך לתאם בין עצמת המניפולציה לסוג המשתנה התלוי אותו בודקים‪ .‬לא‬ ‫ניתן לגלות אפקט של שיפור או ירידה בביצוע במקרים הבאים‪:‬‬ ‫‪" ‬אפקט תקרה" – ביצוע הנבדקים טוב מדי‪ .‬אם הניסוי רוצה לבדוק עד כמה המשתנה הבלתי תלוי משפר ביצועים‪ ,‬אך מראש הנבדקים‬ ‫נמצאים ברמה מאוד גבוהה‪ ,‬אין להם מקום להשתפר כתוצאה מהמניפולציה‪ .‬הסיכוי לדחות את ‪ H0‬קטן מאוד‪ ,‬וצריך מניפולציה‬ ‫עוצמתית במיוחד כדי לשפרם‪.‬‬ ‫‪" ‬אפקט רצפה" – ביצוע הנבדקים נמוך מדי‪ .‬אם אני רוצה להראות שהמניפולציה מפריעה לביצוע וביצועיהם רצפתיים‪ ,‬לא נוכל‬ ‫לראות את ההנחתה של הביצוע‪ .‬לכן צריך כאן מניפולציה עוצמתית במיוחד כדי להראות אפקט‪.‬‬ ‫לכן‪ ,‬צריך שקבוצת הביקורת שלנו תהיה באמצע‪ .‬לדוג'‪ ,‬בביצוע קוגניטיבי של אחוזי טעות ‪ -‬אם בקבוצת הביקורת המטלה גורמת לאחוזי‬ ‫ביצוע גבוהים מאד‪ ,‬לא ניתן יהיה לגלות שיפור בביצוע אצל קבוצת הניסוי (אפקט תקרה)‪.‬‬ ‫בקרה באמצעות קבוצת ביקורת‪ :‬צריך שקבוצת הביקורת תהיה זהה לקבוצת הניסוי בכל חוץ מאשר במניפולציה (המשתנה הב"ת אותו‬ ‫בוחנים)‪ # .‬דגימה מאותה אוכלוסיה ‪ #‬דגימה בזמנים זהים ‪ #‬טיפול זהה בקבוצת הביקורת והניסוי מלבד המניפולציה (המשתנה הב"ת)‪ -‬כל‬ ‫תדרוך באשר למטרת הניסוי‪ ,‬תהליך הניסוי וכו' יהיה זהה בכל הקבוצות‪.‬‬ ‫אפקט הפלסבו – עצם ההשתתפות בניסוי יכולה לגרום לאפקט‪ ,‬ולכן כשעושים ניסוי על תרופה למשל מייצרים גלולה שזהה בכל חוץ‬ ‫מהחומר הפעיל הספציפי‪ .‬זה מה שמנסים לעשות גם בניסויים בפסיכולוגיה‪ .‬קב' ביקורת (ללא מניפולציה) היא בעצם מקרה פרטי של קב'‬ ‫ניסוי‪ ,‬שערך המשתנה הב"ת בה הוא אפס‪.‬‬ ‫תוקף תוצאות המחקר‪:‬‬ ‫לאחר שערכנו ניסוי או מחקר מתקבלים ממצאים ומסקנות שנגזרות מהם‪ .‬השאלה המתבקשת היא מהו תוקף הממצאים הללו? תוקף תוצאת‬ ‫המחקר לא עוסק בשאלת "תוקף המבחן" או "תוקף המדידה"‪ ,‬אלא הערכה של ממצאי המחקר או מסקנותיו‪.‬‬ ‫ארבעה ממדים להערכת תוקף תוצאות מחקר (‪:)Cook & Campbell, 1976‬‬ ‫ממצאי הניסוי כולל ‪ 4‬קריטריונים לצורך שיפוט ממצאים עם השערה סיבתית‪:‬‬ ‫תוקף המסקנה הסטטיסטית – עוצמת הקשר בין המשתנה הב"ת לתלוי‬ ‫תוקף פנימי – הסברים חלופיים לקשר הסטטיסטי שנמצא‬ ‫תוקף חיצוני – הכללה מעבר לאוכלוסיות ומצבים‬ ‫תוקף מבנה – הכללה מעבר להגדרות אופרציונליות שונות‬ ‫תנאים להסקה סיבתית‬ ‫יכולת להכליל ממצאים‬ ‫‪ .1‬תוקף המסקנה הסטטיסטית‪:‬‬ ‫בוחן את אמיתות הקשר בין המשתנה הב"ת למשתנה התלוי – האם הקשר שנמצא הוא אמיתי או מקרי‪ ,‬האם החוקר השתמש נכונה במבחנים‬ ‫הסטטיסטיים על מנת להגיע למסקנה? תוקף זה הוא תנאי הכרחי אך לא מספיק להסקה סיבתית‪ ,‬יש ‪ 3‬תנאים‪:‬‬ ‫(‪ )1‬קיום קשר בין המשתנה הב"ת לתלוי‪ )2( .‬הפעלת המשתנה הב"ת לפני התלוי‪ )3( .‬היעדר הסברים חלופיים לשינוי במשתנה התלוי‪.‬‬ ‫איומים אפשריים על תוקף המסקנה הסטטיסטית‪:‬‬ ‫א‪ .‬טעות מסוג ראשון (‪ :)α‬ייתכן והחוקר טעה טעות מסוג ראשון ‪ -‬דחה את השערת האפס כשהיא למעשה נכונה‪ .‬טעות זו תלך ותגדל ככל‬ ‫שמספר ההשוואות המתוכננות (קונטרסטים) יגדל‪.‬‬ ‫ב‪ .‬טעות מסוג שני (‪ :)β‬ייתכן והחוקר טעה טעות מסוג שני‪ -‬לא דחה את השערת האפס כאשר ‪ H1‬נכונה‪ .‬טעות זו תלויה בעוצמת המבחן‪.‬‬ ‫גורמים המשפיעים על העוצמה (‪ :)1-β‬הסיכוי לגלות את האפקט‪ ,‬אם הוא אכן קיים במציאות‪-‬‬ ‫‪ ‬גודל האפקט‪ :‬עד כמה קל לגדול את האפקט (בכמה רחוקה התפלגותו לעומת ‪.)H0‬‬ ‫‪ ‬השונות באוכלוסיה‪ :‬שונות קטנה יותר מקטינה את ‪ β‬ולכן מגדילה את העוצמה‪ .‬קשה יותר לזהות הבדלים במשתנה התלוי שנובעים‬ ‫מהשוני בין הקבוצות כשיש שונות גדולה בתוך הקבוצה‪.‬‬ ‫‪ ‬גודל המדגם‪ :‬מדגם גדול יותר מקטין את ‪ β‬ולכן מגדיל את העוצמה‪.‬‬ ‫‪ ‬החמרה בקריטריון דחיית השערת האפס‪ :‬ערך ‪ α‬גדול יותר מקטין את ‪ β‬ומגדיל את העוצמה‪.‬‬ ‫‪ ‬סוג המבחן הסטטיסטי‪ :‬כשבוחרים שלא בצדק מבחן סטטיסטי שאיננו מתאים העצמה הסטטיסטית יורדת‪ .‬למשל‪ ,‬מבחן דו‪-‬צדדי במקום‬ ‫חד‪-‬צדדי יגרום להקטנת אלפא ולכן גדל הסיכוי לטעות מסוג שני ועוצמת הניסוי תקטן‪.‬‬ ‫ג‪ .‬טעויות סטטיסטיות‪ :‬ייתכן ולחוקר טעויות סטטיסטיות אחרות‪ ,‬כגון אי שמירה על הנחות המבחן‪ ,‬הפרה של סולם המדידה‪ ,‬ריבוי השוואות‬ ‫שמגדיל את הסיכוי לטעות‪ ,‬מדגם קטן מדי וכו'‪.‬‬ ‫ד‪ .‬הגדלת השונות הטעותית‪ :‬עקב הטרוגניות של נבדקים (אוכלוסייה הטרוגנית‪ ,‬חוסר סטנדרטיזציה בהוראות ניסוי)‪.‬‬ ‫ה‪ .‬מהימנות המשתנה התלוי‪ :‬אם המשתנה התלוי שנמדד לא מהימן תיווצר שונות הנובעת מטעויות המדידה‪.‬‬ ‫‪ .2‬תוקף פנימי‪:‬‬ ‫מתאר את המידה בה הסברים חלופיים יכולים להסביר את התוצאות‪ .‬כלומר‪ ,‬האם המניפולציה (המשתנה הב"ת) היא שגרמה להבדלים בין קב'‬ ‫הניסוי והביקורת‪ ,‬ולא טעות שיטתית או משתנה סמוי שלא שלטנו עליו‪ ,‬שהחוקר לא חשב עליו – ארטיפקט )‪ .(confound‬מחקר מתאמי חשוף‬ ‫יותר לבעיות תוקף פנימי מאחר ומתאם לא מעיד בהכרח על המשתנה אשר גרם לקשר שנמצא‪ .‬גם מחקר ניסויי חשוף לבעיות תוקף פנימי אולם‬ ‫קשה יותר לחשוף את מקור האיום לתוקף‪.‬‬ ‫איומים אפשריים על תוקף פנימי‪:‬‬ ‫איומים אלה יכולים להשפיע על כל ניסוי‪ ,‬למעט מכשור ומדידה החלים רק על מחקרים בהם המשתנה התלוי הוא השינוי שחל בנבדקים בין ‪2‬‬ ‫מועדים‪.‬‬ ‫א‪ .‬היסטוריה‪ :‬בכל ניסוי שנמשך לאורך זמן קיים חשש כי מאורעות שקורים במשך תקופת המחקר משפיעים על תוצאותיו‪ ,‬ולא המשתנה‬ ‫הב"ת‪ .‬התוקף הפנימי נפגע כשניתן לייחס את תוצאות הניסוי למאורע שהתרחש בזמן שעבר בין ‪ 2‬מדידות אלו‪ .‬ככל שטווח הזמן בין ‪2‬‬ ‫המדידות גדל‪ ,‬גדלה ההסתברות לגורם זה‪.‬‬ ‫לדוג'‪ ,‬חוקר רצה לדעת האם שינוי תכנית הלימודים לפני מספר שנים‪ ,‬לפיו אין דרישת מעבר משנה א' ל‪ -‬ב'‪ ,‬מעלה את שביעות רצון‬ ‫התלמידים‪ ,‬אלא שבשנים אלו הוחלט שציון הב‪.‬א לא יהווה עוד מדד קבלה למ‪.‬א והחלטה זו שינתה את אקלים הלימוד‪ ,‬והשפיעה על‬ ‫שביעות רצון התלמידים‪.‬‬ ‫‪ #‬פתרון‪ :‬קבוצת ביקורת‪ .‬אם יחול שינוי גלובלי מעבר למניפולציה‪ ,‬הוא יחול על שתי הקבוצות‪.‬‬ ‫ב‪ .‬בשילה‪ :‬במחקר בו מתרחש תהליך כלשהו או ישנו מעבר זמן‪ ,‬עוברים הנבדקים לעיתים קרובות תהליך "בשילה" שמשנה את יכולותיהם‬ ‫הקונטיבית או את עמדותיהם הרגשיות‪ ,‬מה שעלול להוות משתנה מתערב‪ .‬מדובר בתהליך שעוברים נבדקי המחקר במהלך הניסוי כפונקציה‬ ‫של מעבר זמן גרידא‪ ,‬כגון התפתחות‪ ,‬עייפות או רעב‪ .‬גורם זה מאיים על התוקף הפנימי משום שאפשר לייחס את האפקט הניסויי לשינויים‬ ‫הנובעים מבשילת הנבדקים‪.‬‬ ‫לדוג'‪ ,‬בחנו שיטת הוראה במשך שנה על ילדים בני ‪ .6‬הישגיהם השתפרו‪ ,‬אך אין לדעת אם השיפור הוא תוצאה של ההוראה (המשתנה‬ ‫הב"ת) או של ההתפתחות הקוגניטיבית הטבעית (בשילה)‪.‬‬ ‫‪ #‬פתרון‪ :‬קבוצת ביקורת‪.‬‬ ‫ג‪ .‬מדידה‪ :‬אם בניסוי נערכות שתי מדידות‪ ,‬ייתכן שהמדידה הראשונה משפיעה על המדידה השנייה‪ ,‬ולא המשתנה הב"ת‪ .‬לדוג'‪ ,‬עריכת מבחן‬ ‫סימולמציה לפסיכומטרי תהווה השפעה על הסימולציה השנייה שנעשה‪ ,‬ולאו דווקא שיטת הטיפול‪.‬‬ ‫‪ #‬פתרון‪ :‬קב' ביקורת‪ ,‬ניסוי בשיטת ‪ 4‬הקבוצות של סלומון‪.‬‬ ‫ד‪ .‬מכשור‪ :‬אם במכשיר מדידה חלים שינויים בין שתי בדיקות יש בכך איום על תוקף פנימי‪ .‬לדוג'‪ ,‬בניסוי שבודק השפעת עוצמה על זמני‬ ‫תגובה לגירויים‪ ,‬תאורת המחשב משתנה ביחס למשך פעולת המסך‪ ,‬ולכן יש לוודא כי מכשירי המדידה מכוילים‪ .‬דוג' נוספת היא שהנסיין‬ ‫עצמו יכול להתעייף ולדייק פחות בבדיקה השנייה‪.‬‬ ‫‪ #‬פתרון‪ :‬אין לשנות את כלי המדידה (מכשור) במהלך הניסוי‪ ,‬גם אם הוא לא טוב‪ .‬צריכה להיות סטנדרטיזציה בכיול‪.‬‬ ‫ה‪ .‬רגרסיה לממוצע‪ :‬זוהי תופעה של נסיגה אל הממוצע כתוצאה מתופעה סטטיסטית ולא מהשפעת המניפולציה‪ -‬ביצועי נבדקים גבוהים מאוד‬ ‫או נמוכים מאוד בממוצע במדידה הראשונה ירדו או יעלו במדידה השנייה מסיבות הסתברותיות פשוטות‪ ,‬ללא קשר למשתנה הב"ת‬ ‫ולמניפולציה (אם מישהו קיבל את הציון הנמוך ביותר‪ ,‬יש סבירות גבוהה שציונו ישתפר בבחינה הבאה‪ ,‬כי כבר אין לו לאן לרדת‪ ,‬ולעומת‬ ‫זאת אם נבדק השיג ציון גבוה מאוד‪ ,‬הוא יתקשה לחזור על ההישג פעמיים)‪.‬‬ ‫ככל שהציון במדידה הראשונה סוטה יותר מממוצע הקבוצה‪ ,‬כך הוא כולל מרכיב גדול יותר של טעות מדידה‪ ,‬ויש יותר סיכוי שבמדידה‬ ‫הבאה הוא יתקרב לממוצע‪ .‬תופעה זו לא מתרחשת במכשיר מדידה עם מהימנות מושלמת‪ ,‬כי אז אין טעויות מדידה‪ ,‬אבל במציאות אין‬ ‫מכשיר כזה‪ .‬הרגרסיה פוגעת בתוקף (יכולה להחביא אפקט של שיפור או ירידה בביצוע) אם קב' הניסוי‪ /‬הביקורת נבחרו לפי ציוניהן‬ ‫הקיצוניים‪.‬‬ ‫לדוג'‪ ,‬חוקר בדק את יעילות שיטת הוראה על טעוני טיפוח‪ .‬במדידה הראשונה הוא בדק את יכולתם ובחר לקב' הניסוי את מקבלי הציונים‬ ‫הנמוכים ביותר‪ .‬לאחר המניפולציה הישגיהם השתפרו‪ ,‬אך ייתכן שהשיפור נבע מהנטייה הטבעית להתקרב לממוצע ולא משיטת ההוראה‪.‬‬ ‫‪ #‬פתרון‪ :‬אם חייבים לקחת נבדקים קיצוניים לקב' הניסוי‪ ,‬נקח גם קיצוניים לקב' הבקרה‪.‬‬ ‫ו‪ .‬סלקציה של נבדקים (ברירה)‪ :‬אם הנבדקים לא הוקצו לקב' הניסוי והביקורת בצורה רנדומלית‪ ,‬הקב' עלולות להיות שונות מלכתחילה (עוד‬ ‫לפני הפעלת המניפולציה)‪ .‬במקרה זה‪ ,‬ניתן לייחס את התוצאות להבדלים שהיו קיימים מראש בין הקבוצות ולא למשתנה הב"ת‪.‬‬ ‫‪ #‬פתרון‪ :‬קב' ביקורת ‪+‬הקצאה רנדומלית‪ ,‬כך שלא תהיה שום הטיה קבועה ביצירת הקבוצות‪ .‬במדידת הלפני‪ ,‬הקבוצות אמורות להיות‬ ‫זהות‪ ,‬כך שבאם נמצא הבדל‪ ,‬נוכל לדעת כי הוא בא מהמניפולציה הניסויית‪ ,‬ולא מההבדל בין הקבוצות‪.‬‬ ‫ז‪ .‬נשירת נבדקים‪ :‬בניסויים רבים מתרחשת נשירה של נבדקים‪ ,‬אך אם הנשירה אינה מקרית (אינה ביחס שווה בכל הקבוצות) אלא קשורה‬ ‫בתנאי ניסוי ספציפי‪ ,‬השוני יכול להיות מיוחס לנשירה ולא להבדל במשתנה הב"ת‪.‬‬ ‫‪ #‬פתרון‪ :‬לרוב אין פתרון‪ ,‬מומלץ להתאים את המניפולציה כדי למנוע אפקט תקרה‪/‬רצפה‪ .‬מהספר‪ :‬ניתן להשוות רק את כמות האנשים‬ ‫שנשארו לאורך כל הניסוי כך שיהיה מספר שווה של אנשים בכל קבוצה‪.‬‬ ‫ח‪ .‬מהספר ‪ >-‬אינטרקציות עם ברירה‪ :‬בשילה‪ ,‬מדידה או רגרסיה עלולות לחבור עם הברירה ולאיים במשולב על התוקף הפנימי‪ .‬כלומר‪,‬‬ ‫תהליכי בשילה‪ /‬מדידה‪ /‬רגרסיה שמתרחשים לאחר הברירה עלולים להשפיע באופן שונה על הקבוצות ובכך ליצור הבדלים נוספים בין‬ ‫הקבוצות ולהגביר את האיום על התוקף הפנימי‪ .‬כשהשינוי שחל בקב' הניסוי נבדל מהשינוי שחל בקב' הביקורת נאמר שיש אינטרקציה‬ ‫סטטיסטית‪.‬‬ ‫לדוג'‪ ,‬קצב הבשילה הטבעי של ילדים מבוססים עלול להיות שונה מזה של ילדים טעוני‪-‬טיפוח‪ .‬כלומר‪ ,‬הבשילה לא רק השפיעה על‬ ‫הנבדקים‪ ,‬אלא יצרה הבדל בין שתי הקבוצות שלא קשור למשתנה הב"ת‪ .‬הבדלי הבשילה יכולים לשמש הסבר חלופי‪.‬‬ ‫פתרונות כלליים לבעיית התוקף הפנימי‪:‬‬ ‫‪ .1‬שימוש בקבוצת ביקורת‪:‬‬ ‫‪ ‬מאפשר לבדוק את התנהגות הנבדקים אילו לא נחשפו למניפולציה‪.‬‬ ‫‪ ‬מאפשר לבדוק אם המניפולציה היא שאחראית להתנהגות הנבדקים בקב' הניסוי‪.‬‬ ‫‪ .2‬הקצאה מקרית לקבוצות ‪ -‬מבטיחה שלא יהיו הבדלים מראש בין קב' הניסוי והביקורת‪.‬‬ ‫איומים נוספים על התוקף הפנימי שאינם נפתרים על ידי הקצאה מקרית‪:‬‬ ‫איומים של טעות מסוג ראשון ‪ >-‬יוצרים הבדלים מלאכותיים בין קב' הניסוי לביקורת ומגלים אפקט למרות שהוא לא קיים‪.‬‬ ‫‪ ‬התמרמרות של נבדקי קבוצה מסוימת‪ :‬אם קב' הניסוי מקבלת תגמול‪/‬מניפולציה מבוקשת יותר מזו של קב' הביקורת (או להיפך)‪ ,‬וכאשר‬ ‫נבדקי הקבוצה המקופחת מודעים לכך‪ -‬עשויים לחוש טינה כלפי החוקר‪ ,‬וזו עלולה להשפיע על התנהגותם ולשמש הסבר חלופי לתוצאות‪.‬‬ ‫פתרון‪ :‬להשתדל למנוע מעבר מידע בין קבוצות הניסוי‪.‬‬ ‫‪ ‬היסטוריה מקומית‪ :‬אירועים שהתרחשו רק באחת מהקבוצות ועלולים לשמש הסבר חלופי לתוצאות‪ ,‬למשל רעש באחת הקבוצות‪ /‬בדיחה‬ ‫שפלט אחד הנבדקים‪ .‬פתרון‪ :‬רנדומניזציה של תנאי הניסוי (הנבדק הראשון והשני בקבוצת הניסוי‪ ,‬השלישי והרביעי בבקרה) ‪ -‬כך‬ ‫ההסתברות שמשהו יקרה בעת הניסוי היא שווה בשתי הקבוצות‪.‬‬ ‫איומים של טעות מסוג שני ‪ >-‬מקטינים הבדלים בין הקבוצות ומקשים על גילוי אפקט למרות שהוא קיים‪.‬‬ ‫‪ ‬השפעת מידע המגיע לנבדקי קב' הביקורת על הטיפול הניסויי ‪ -‬למשל‪ ,‬בניסוי על שיטות הוראה ממליץ המורה לקבוצות הניסוי להתכונן‬ ‫למבחן ע"י סיכום החומר בכתב‪ .‬אם המידע יגיע לקבוצת הביקורת‪ ,‬גם הם עלולים לאמץ שיטה זו ולהתנהג כמו נבדקי קבוצות הניסוי‪ .‬פתרון‪:‬‬ ‫למנוע חילוף מידע בין הקבוצות‪.‬‬ ‫‪ ‬השוואה מפצה של הטיפול ‪ -‬כשהטיפול הניסויי מתרחש במחקר שדה (מפעל‪/‬מוסד) וכולל טובות הנאה לקבוצות מסוימות ולא לאחרות‪,‬‬ ‫ההנהלה לוחצת להעניק פיצוי הולם לקבוצות האחרות‪ ,‬העלול לצמצם את ההבדלים בין הקבוצות‪.‬‬ ‫‪ ‬תחרות מפצה ‪ -‬כשברור לכל אחד מהנבדקים או קבוצות הנבדקים (כיתות‪ ,‬בתי‪-‬ספר וכדומה) לאיזה תנאי ניסויי הם שייכים‪ ,‬עלולה‬ ‫להתעורר תחרות בין קב' הניסוי לביקורת‪ .‬בד"כ‪ ,‬קב' הביקורת היא המקופחת ולכן הם מנסים להוכיח שהם מסוגלים להצליח לא פחות‬ ‫ומשפרים את ביצועיהם‪ .‬זה קורה במיוחד במקומות בהם עובדים עלולים לאבד את מקום פרנסתם (למשל‪ ,‬במפעלים בהם בודקים יעילות‬ ‫רובוטים על פני עובדים אנושיים)‪.‬‬ ‫‪ .3‬תוקף חיצוני‪:‬‬ ‫עוסק ביכולת החוקר להכליל את הממצאים שנמצאו בבדיקה (בתנאים בה בוצעה) לגבי העולם‪ .‬השאלה היא האם ניתן להסיק מן ההקשר‬ ‫הספציפי של הניסוי ונבדקיו אל כלל ההקשרים בעולם ואל שאר האוכלוסיות שבו‪ .‬לעיתים קרובות בעיה זו מכונה "תוקף אקולוגי"‪ ,‬כלומר‬ ‫המצב הניסויי אינו משקף את הסביבה האקולוגית האמיתית בה אנשים פועלים‪.‬‬ ‫לגבי אוכ' הנבדקים ‪ >-‬חשוב לזכור שאיננו דוגמים רנדומלית את הנבדקים מכלל האוכ'‪ ,‬כמעט תמיד קיימת סלקציה‪( :‬א) במחקרים‬ ‫באוניברסיאות נדגמים נבדקים משכבת גיל מצומצמת והשכלה מצומצמת‪( .‬ב) נדגמות חיות מעבדה מסוג אחד ולאו דווקא מסוג אחר‪( .‬ג)‬ ‫במחקרים רבים נדגמים נבדקים שמוכנים להשתתף בניסוי וסיבותיהם עמהם‪( .‬ד) באוניברסיטאות משתתפים סטודנטים לפסיכולוגיה שמחויבים‬ ‫להשתתף ויש לכך השפעות פוטנציאליות‪.‬‬ ‫לא רק אוכ' הנבדקים מאיימת על תוקף חיצוני‪ >-‬לעתים רואים שאפשר להכליל את המסקנות של הניסוי רק במצבים מסוימים‪ .‬השפעה כזו‬ ‫נקראת אינטראקציה‪ .‬ניתן לבצע הסקה סיבתית ללא תוקף חיצוני‪ ,‬אך תוקף זה מוודא את יציבות ההסקה הסיבתית על פני אוכלוסיות וזמנים‬ ‫שונים‪.‬‬ ‫לדוג'‪ ,‬במחקר חזרו על הניסוי של אש אודות השפעת לחץ חברתי – צריך לשפוט לגבי אורך של קו‪ ,‬כשהתשובה ברורה אבל כל שאר הנבדקים‬ ‫עונים משהו אחר בביטחון‪ .‬מצאו שלחץ חברתי משפיע יותר כשמטלת השיפוט מעורפלת (הבדל קטן בין הקווים)‪ .‬בכך נפגע התוקף החיצוני של‬ ‫מחקרו של אש‪ -‬אפשר להכליל את המסקנות בנוגע ללחץ הקבוצתי‪ ,‬רק על מצבים בהם מטלת השיפוט מעורפלת‪ .‬השפעה כזו נקראת‬ ‫אינטראקציה ‪ -‬יש אינטראקציה בין המשתנה "לחץ קבוצתי" לבין המשתנה מידת ערפול במטלת השיפוט‪ .‬אינטראקציה זו מגבילה את מסקנות‬ ‫המחקר למצבים מסוימים ולא לאחרים‪.‬‬ ‫סוגי אינטראקציות ואיומים על תוקף חיצוני‪:‬‬ ‫א‪ .‬אינטראקציה בין המדידה לבין המשתנה הב"ת‪ :‬ז"א‪ ,‬אינטראקציה בין המדידה לבין הרגישות למניפולציה הניסויית כשנבחנת‬ ‫רמת בסיס לפני המניפולציה‪ .‬השאלה היא‪ ,‬האם אפשר להכליל את התוצאות גם על מצבים בהם לא נעשתה מדידה מוקדמת‪,‬‬ ‫שכן המדידה המוקדמת עלולה להשפיע על עמדות הנבדק במדידה השנייה‪ ,‬ולשנות את רגישותו למניפולציה‪.‬‬ ‫לדוג'‪ ,‬חוקר שרוצה לבדוק עמדות לגבי שחורים לאחר צפייה בסרט בו דמות הגיבור שלילית או חיובית‪ ,‬ימדוד רמת בסיס‬ ‫של עמדת הצופה לגבי שחורים לפני הסרט ואחרי הסרט‪ .‬הבעיה היא שעצם המדידה המוקדמת תגרום להסבת קשב לעמדות‬ ‫כלפי שחורים‪ ,‬ותיווצר רגישות לדמויות שיופיעו בסרט‪ .‬לכן‪ ,‬המדידה המוקדמת "משתתפת" במניפולציה‪.‬‬ ‫‪ #‬פתרון ‪ -‬שימוש בקבוצת ביקורת בה המדידה תעשה רק לאחר הפעלת המניפולציה כך שנוכל לאמוד את ההבדלים שנבעו מעצם המדידה‪.‬‬ ‫אם ימצאו הבדלים משמעותיים נסיק כי המדידה המוקדמת אכן משנה את רגישות הנבדק ולא נוכל להכליל את הממצאים‪( .‬בתחום כמו‬ ‫הוראה שנעשות הרבה בחינות איום זה לא רלוונטי)‪.‬‬ ‫ב‪ .‬אינטראקציה בין הברירה לטיפול הניסויי‪ :‬ז"א‪ ,‬אינטרקציה בין סוג האוכ' הנדגמת והמניפולציה הניסויית תאפשר להכליל‬ ‫את התוצאות רק למסגרת הדגימה ממנה נלקח המדגם ולא מעבר לה‪.‬‬ ‫לדוג'‪ ,‬שיטת הוראת הקריאה שנקראת "השפה כמכלול" נמצאה כפוגעת במיוחד באוכלוסיות משכבות סוציואקונומיות‬ ‫נמוכות‪ .‬במידה והמחקר על יעילותה היה נערך בבתי"ס עם אוכלוסיות חזקות האינטרקציה לא הייתה מתגלה‪.‬‬ ‫‪ #‬פתרונות‪ )1( :‬להקפיד שהמדגם ייצג את האוכלוסייה עליה רוצים להכליל‪ .‬אבל‪ ,‬במידה והאוכלוסייה מאוד הטרוגנית מדגם מקרי עלול‬ ‫לפגוע בתוקף המסקנה הסטטיסטית‪ .‬ניתן להתמודד גם עם בעיה זו‪:‬‬ ‫(‪ )2‬ניתן להחזיק את "משתנה האוכלוסייה" כקבוע‪ ,‬בכך אנו נצמצם את יכולת ההכללה לאוכלוסייה מסוימת אבל לפחות התוצאות יהיו‬ ‫ממוקדות ותקפות‪ .‬למשל‪ ,‬אם רוצים להכליל רק על בי"ס מסוים נבדוק רק את הבית ספר‪ )3( .‬ניתן להפוך את "משתנה האוכלוסייה"‬ ‫ממשתנה מקרי למשתנה שהשפעתו שיטתית‪ .‬אפשר לעשות זאת באמצעות שימוש במדגמים הומוגניים מתוך תת‪-‬קבוצות של האוכלוסייה‬ ‫כולה ולאחר מכן להשוות את תוצאות המחקר בין המדגמים הללו ובכך לבדוק האם ניתן להכליל את המסקנות‪ .‬אם תת אוכלוסיות שונות‬ ‫יניבו תוצאות שונות משמע שישנה אינטראקציה‪ .‬למשל‪ ,‬הוראה חווייתית (המשתנה הב"ת הנחקר) יעילה רק בקרב טעוני טיפוח (משתנה‬ ‫ב"ת‪ -‬אוכלוסיה)‪.‬‬ ‫ג‪ .‬אינטראקציה בין סביבת הניסוי או מועדו לטיפול הניסויי‪ :‬תוצאות הניסוי עלולות להשתנות אם הוא נערך ברחוב הומה‪,‬‬ ‫במעבדה‪ ,‬או בבית ספר‪ .‬במועד הניסוי – למשל‪ ,‬האם הניסוי נערך בחורף ‪ /‬בקיץ‪.‬‬ ‫‪ #‬פתרון‪ :‬אם סביבת הניסוי או מועדו באמת רלוונטיים‪ ,‬אפשר לעשותם למשתנים בלתי תלויים ולערוך את הניסוי פעמים אחדות בסביבות‬ ‫ניסוי שונות או בזמנים שונים‪.‬‬ ‫‪ .4‬תוקף מבנה‪:‬‬ ‫עוסק בשאלת ההתאמה בין ההגדרות האופרציונליות של המשתנים התלויים והב"ת ובין העולם התיאורטי שהן מבקשות להסיק לגביו‪ .‬תוקף‬ ‫מבנה בהקשר של מדידה מוגדר כמידת ההלימה בין הכלי בו אנו משתמשים לבין המשתנה התיאורטי‪ .‬לתוקף המבנה של ממצאי המחקר יש אותו‬ ‫מובן‪ :‬כשחוקר מטיל ספק בתוקף המבנה של המחקר‪ ,‬הוא לא מערער על כך שמשתנה א' כפי שהופעל השפיע על משתנה ב' כפי שנמדד‪ ,‬אלא‬ ‫הוא מערער על מידת ההלימה בין ההגדרות האופרציונליות לבין המונחים התיאורטיים‪ .‬הוא מטיל ספק ביכולת להכליל את הקשר שנמצא מעבר‬ ‫להגדרות האופרציונליות‪.‬‬ ‫חוקרים חלוקים בדעותיהם לגבי ההגדרה האופרציונלית של מושגים רבים‪ ,‬כגון רגשנות‪ ,‬תוקפנות‪ ,‬אשמה‪ .‬למשל‪ ,‬חוקר אחד יגדיר "תוקפנות"‬ ‫כפגיעה פיזית במישהו‪ ,‬השני יגדיר זאת ככוונה להזיק‪ ,‬והשלישי‪ -‬כשאיפה להזיק‪ .‬כל חוקר מודד "תוקפנות" בדרכים שונות ומצפה להתנהגות‬ ‫שונה‪ .‬התוצאה‪ :‬תוקף מבנה לקוי‪ ,‬שלא מאפשר להשוות את התוצאות של מחקרים שונים באותו נושא‪.‬‬ ‫השלכות של תוקף מבנה‪:‬‬ ‫‪ ‬חוקר צריך להקפיד להבהיר את היקף ומבנה המשתנה התיאורטי בו הוא עוסק בטרם הוא בוחר את משתניו‪.‬‬ ‫‪ ‬כשהמשתנה התיאורטי מורכב עדיף להציג מספר אפשרויות להגדרות אופרציונליות למשתנה הב"ת ומספר מדדים למשתנה התלוי‪.‬‬ ‫‪ ‬על החוקר לערוך ניתוח מקיף של הסברים חילופיים אפשריים לתוצאותיו ולבחון אותם באופן פרטני‪.‬‬ ‫‪ :Confounding‬ערעור על תוצאות המחקר כתוצאה מהסברים חלופיים‪ ,‬שמקורם בתוקף מבנה לקוי‪ .‬זהו החשד שההגדרה האופרציונלית של‬ ‫המשתנה הב"ת אינה מבטאת רק את המשתנה התיאורטי הרצוי אלא גם משתנים תיאורטיים נוספים‪.‬‬ ‫איומים אפשריים על תוקף מבנה‪ :‬קיימים במיוחד כשעוסקים במשתנים פסיכולוגיים תיאורטיים ומורכבים‪ ,‬נחלקים ל‪ 2-‬סוגים‪:‬‬ ‫א‪ .‬חוסר מיצוי‪ :‬ההגדרה האופרציונלית מתייחסת רק לחלק מזערי מהיקף המושג התיאורטי‪.‬‬ ‫ב‪ .‬חוסר בלבדיות‪ :‬ההגדרה האופרציונלית מתייחסת למרכיבים שאמנם מצויים במושג התיאורטי אך אינם מצויים רק בו‪ ,‬אלא קשורים גם‬ ‫במושגים אחרים‪.‬‬ ‫חלק מהאיומים‪:‬‬ ‫אי בהירות המשתנה התיאורטי‪ :‬היעדר הסכמה בין חוקרים לגבי משתנה תיאורטי עשוי להוליד אי הסכמה גם לגבי פירושים של תוצאות‬ ‫הניסויים‪.‬‬ ‫חפיפה לא מספקת בין המשתנה התיאורטי לתצפיתי‪ :‬הגדרה אופרציונלית בודדת עלולה שלא למצות את המשתנה התיאורטי ולכלול‬ ‫היבטים לא רלוונטיים‪ ,‬גם במשתנה התלוי וגם בב"ת‪ .‬פתרון‪ :‬כדי למצות את המשתנה הב"ת יש ליצור כמה הגדרות אופרציונליות‬ ‫עבורו‪ -‬כלומר‪ ,‬כמה מניפולציות‪ .‬זהו תהליך יקר ומסובך‪ .‬עבור המשתנה התלוי זה יותר קל ולכן למצות אותו בכמה הגדרות‬ ‫אופרציונליות זה הכרחי יותר‪.‬‬ ‫איומים הנוגעת לאישיות הנסיין והנבדקים‪ :‬ציפיות הנסיין‪ ,‬רצון הנבדקים לנחש את השערות הניסוי‪ ,‬שאיפתם הכמוסה לזכות בהערכת‬ ‫הנסיין‪.‬‬ ‫אפשר לתפוס את המשתנה המסביר המקורי (הב"ת) ואת המשתנה המסביר החלופי (ציפיות הנסייןלמשל) כמשתנה תצפיתי מורכב אחד‪ ,‬שיש לו‬ ‫שני מרכיבים‪ :‬הראשון נובע מהמשתנה הב"ת והוא רלוונטי למשתנה התיאורטי הרצוי‪ .‬השני‪ ,‬נובע מציפיות הנסיין ואינו רלוונטי‪ .‬לכן‪ ,‬הוא פוגע‬ ‫בתוקף המבנה (בעיית הבלבדיות)‪.‬‬ ‫אפשר גם לתפוס את זה כאיום על התוקף הפנימי (‪ :)artifact‬המשתנה המסביר החדש (ציפיות הנסיין) שונה מהמשתנה הב"ת‪ ,‬ומייצג משתנה‬ ‫תיאורטי אחר‪ .‬הוא מהווה הסבר חלופי לתוצאות‪ ,‬ומאיים על התוקף הפנימי‪.‬‬ ‫חידוד משמעות ‪ Artifact‬ו‪ Confound -‬וההבדל ביניהם‪:‬‬ ‫ארטיפקט‪ :‬בעיה של תוקף פנימי (מסקנות הניסוי)‪ .‬גורם "רעש" שאינו המשתנה הב"ת ומשפיע על המשתנה התלוי‪ .‬יכול להיות חלק מהמשתנה‬ ‫הב"ת שלא תכננו (שגיאת אופרציונליזציה) או חלק אחר הנובע מאופי הניסוי כגון היסטוריה ובשילה‪.‬‬ ‫קונפאונד‪ :‬בעיה של תוקף מבנה‪ .‬מצב בו ללא כוונה מדדנו משתנה אחר מזה שהאמנו שאנו מודדים‪ ,‬אשר מתווך בין המשתנה התלוי והב"ת‪.‬‬ ‫באופן זה האופרציונליזציה לא בוודאות הובילה לשינוי במשתנה שמדדנו וייתכן והיא השפיעה על משתנה אחר קשור וזה למעשה מה שמדדנו‪.‬‬ ‫לסיכום‪ :‬הן ארטיפקט והן קונפאונד יכולים להיות הסברים אלטרנטיביים לתוצאות המשתנה התלוי‪ .‬ארטיפקט הינו הסבר חיצוני למערך‬ ‫וקונפאונד נמצא בתוך הגדרת המשתנה הבלתי תלוי‪.‬‬ ‫השלכות של בעיות תוקף‪:‬‬ ‫אי אפשר לדאוג בצורה מושלמת לכל סוגי התוקף‪ .‬הקפדה על ביסוס תוקף אחד עלולה לחבל בתוקף שני‪ .‬למשל‪ ,‬מניפולציה מדויקת של‬ ‫המשתנה הב"ת תעזור לתוקף המבנה‪ ,‬אך עלולה לפגוע בתוקף המסקנה הסטטיסטית‪ ,‬משום שלא תהיה לה השפעה מספקת והיא לא תבחין בין‬ ‫הקבוצות‪ .‬ניתן להתגבר על רוב בעיות התוקף על ידי תכנון מוקדם וישנו אלמנט של צבירת ניסיון ומיומנות מחקרית‪.‬‬ ‫לפי קוק וקמפבל‪ ,‬בכל מחקר יש לתת קדימות ראשונה לתוקף הפנימי‪ ,‬משום שהוא בודק אם קיים בכלל קשר סיבתי כלשהו בין המשתנים‪ .‬על‬ ‫תוקף זה קל יחסית להגן בניסוי מעבדה‪.‬‬ ‫דירוג בעיות תוקף בהן כדאי להתמקד‪ ,‬לפי הסדר הבא‪ :‬תוקף פנימי ‪ >-‬תוקף המסקנה הסטטיסטית ‪ >-‬תוקף מבנה ‪ >-‬תוקף חיצוני‬ ‫שילוב מידע ממספר מקורות – פרופ' בן שחר‪:‬‬ ‫אחד ההיבטים המרכזיים של תוקף הוא תוקף ניבוי (תוקף תלוי קריטריון)‪ .‬במקרים רבים נדרשים לקבל החלטות (לאבחן או לנבא) לאור קשת‬ ‫רחבה של מקורות מידע‪ ,‬ולא לאור משתנה מנבא יחיד‪ .‬לדוג'‪ ,‬אבחון קליני מתבסס על קורות חיים ‪ +‬מבחני אישיות אובייקטיביים ‪ +‬מבחנים‬ ‫השלכתיים ‪ +‬ראיונות אישיים‪ .‬השאלה כיצד מבצעים ניבוי מושכל המשלב את כל מקורות המידע שברשותנו?‬ ‫שיטות לשילוב מידע ממספר מקורות‪:‬‬ ‫‪ ‬ניבוי קליני‪ :‬שילוב מידע המתקבל ממדדים שונים באופן אינטואיטיבי‪ ,‬איננו בהכרח מודע ואיננו מתוקנן‪ .‬הקלינאי מייחס חשיבות דיפרנציאלית‬ ‫למדדים השונים ‪ ,on-line‬ללא אלגוריתם שנקבע מראש‪.‬‬ ‫‪ ‬ניבוי אקטוארי (סטטיסטי) עם תיקוף צולב‪ :‬שילוב המידע המתקבל ממדדים שונים באמצעות הליך אחיד שנקבע מראש ומבוסס על קשר מוכח‬ ‫בין המנבאים לבין הקריטריון‪ .‬המילה אקטוארי מגיעה מהביטוח (ביטוח חיים)‪ .‬אחד מהחישובים החשובים בתחום הביטוח הינו חישוב תוחלת‬ ‫החיים של אדם‪ ,‬המתבצע ע"י שילוב משתנים רבים תוך שימוש בניתוח סטטיסטי‪.‬‬ ‫מה עדיף? נתייחס למאמר משנת ‪ 1979‬אשר לדעת פרופ' בן שחר סוגר את המחלוקת בנושא זה‪.‬‬ ‫כלים לניבוי סטטיסטי‪:‬‬ ‫‪ .1‬רגרסיה מרובה‪ :‬ניבוי משתנה ע"י חיבור ליניארי של מספר מנבאים (בד"כ בציוני תקן)‪ .‬בדוגמת הבגרות והפסיכומטרי‪ ,‬ברגרסיה מרובה‬ ‫יינתן משקל מסוים לבגרות ולפסיכומטרי (יש נוסחה על פיה נחליט על המשקולות‪ ,‬לא חייבות להיות שוות)‪ .‬המשקלות נקבעים אמפירית כך‬ ‫שהמתאם בין הציון המנבא וקריטריון הניבוי יהיה מקסימלי‪ .‬המתאם בין הציון המנבא וקריטריון הניבוי נקרא מתאם מרובה‪.‬‬ ‫כשיש ‪ 2‬חזאים בעלי מתאם גבוה (הציונים מאוד דומים)‪ ,‬נצטרך לתת לאחד משקל גבוה ולשני נמוך‪ .‬לעומת זאת‪ ,‬בניבוי קליני הקלינאי‬ ‫יתרשם מאוד ויתן להם משקל יתר‪ .‬זו דוג' למצב בו הניבוי הקליני נופל מזה הסטטיסטי‪.‬‬ ‫‪ .2‬קביעת ציוני מעבר (נקודת חתך)‪ :‬במקרה הזה לא נשקלל את הגורמים אלא נדרוש ציון מינימום מסוים של מס' מנבאים‪ ,‬כאשר ניתן לקחת‬ ‫בחשבון או את שני הגורמים או להחליט שמספיק לעמוד בחתך באחד מן החזאים על מנת להתקבל‪ .‬במקרה הזה יש בעיה מאחר ואין שקלול‬ ‫של פיצוי בין החזאים (לדוג' בגרות נמוכה ופסיכומטרי גבוה) מאחר ומתייחסים אליהם בנפרד‪.‬‬ ‫שימושים של ניבוי סטטיסטי תוך שילוב מידע ממספר מקורות‪:‬‬ ‫‪ ‬ניבוי סטטיסטי לצורך חיזוי של‪ :‬הצלחה אקדמית‪/‬פשיטת רגל בעסקים‪/‬הערכת תוחלת חיים‪/‬הצלחה בקורסים צבאיים‬ ‫‪ ‬ניבוי קליני‪ :‬אבחון פסיכיאטרי‪/‬אבחון נוירו‪-‬פסיכולוגי‪/‬בעיות לב‪/‬הפרות חנינה‪/‬אלימות‪.‬‬ ‫דוגמא – אבחון פסיכיאטרי‪:‬‬ ‫‪ – X1 ‬מבחן רורשך‬ ‫‪ - X2 ‬מבחן ‪TAT‬‬ ‫‪ – X3 ‬ראיון קליני‬ ‫שימוש בניבוי קליני‪ :‬מומחה מנתח את כל המידע וקובע אבחון בהתאם לניסיונו הקליני ובהתאם להבנתו את המקרה‪.‬‬ ‫שימוש בניבוי סטטיסטי‪ :‬ניצור משוואת רגרסיה מרובה המבוססת על שלושת המנבאים‪ ,‬ולכל אחד משקל מסוים‪ .‬כך נראית משוואה ליניארית‬ ‫של רגרסיה מרובה‪:‬‬ ‫צריך מדגם (רצוי גדול ומייצג) של כל החזאים הללו ‪ +‬אינפורמציה על הקריטריון‪ .‬משקלות הרגרסיה (‪ )a1, a2, a3‬יחושבו כך שהמתאם בין‬ ‫המיון המנובא (‪ )’Y‬לבין הקריטריון הוא הגבוה ביותר במדגם‪ .‬המשוואה מעניקה ציון רציף המשקף דרגת חומרה של הפרעה פסיכיאטרית‬ ‫כלשהיא (למשל אובססיבית קומפולסיבית)‪ .‬הציון מתוקף ע"י קריטריון של מעקב פסיכיאטרי לאורך זמן שמודד את חומרת ההפרעה הלכה‬ ‫למעשה‪.‬‬ ‫* ככל שיש יותר משתנים צריך מדגם גדול יותר על מנת לפצות על טעויות הדגימה‪ .‬יחס מינימאלי יהיה של ‪ 20:1‬בין מספר המנבאים למספר‬ ‫הנבדקים‪ ,‬למשל ‪ 100‬נבדקים עבור ‪ 5‬חזאים‪.‬‬ ‫תיקוף צולב‪:‬‬ ‫ל אחר שמצאנו משוואת רגרסיה במדגם מסוים יש לחשוד (אלא אם המדגם ענק ומייצג) שייתכן וכלי הניבוי שלנו איננו תקף‪ .‬כדי לבחון את‬ ‫יכולת ההכללה של מכשיר הניבוי (משוואת רגרסיה) מעבר למדגם המקורי‪ ,‬יש לבדוק את משוואת הניבוי באמצעות תיקוף צולב‪ :‬יישום משוואת‬ ‫הניבוי שחושבה על סמך מדגם אחד במדגם חדש‪ ,‬שונה מזה ששימש לחישוב משוואת הניבוי המקורית‪ ,‬ובדיקת תוקף הניבוי במדגם החדש‪.‬‬ ‫בד"כ המתאם שיחושב בתיקוף הצולב יהיה נמוך יותר מזה שחושב עבור המדגם הראשון‪ ,‬מכיוון שהמשקולות חושבו כך שיביאו למתאם‬ ‫המקסימאלי במדגם שעליו אנו מתבססים‪ .‬ברור שגובה המתאם לא משקף את המתאם "האמיתי" בין המנבאים ומשקולותיהם לבין המשתנה‬ ‫שאנו מבקשים לנבא‪ ,‬אלא הוא נותן הערכת יתר‪ .‬הסטייה תהיה משמעותית ביותר במדגמים קטנים! לתופעה הזו קוראים "כיווץ" (‪.)shrinking‬‬ ‫התיקוף הצולב מאפשר לבקר טעויות דגימה שעלולות להוביל לחישוב קשרים בין המנבאים לקריטריון‪ ,‬ספציפיים למדגם נתון‪ .‬המתאם שמתקבל‬ ‫ממדגם ב' הוא האומד המדויק יותר לתוקף הניבוי‪.‬‬ ‫הוויכוח על ניבוי קליני מול ניבוי סטטיסטי‪:‬‬ ‫טענות בעד הניבוי הקליני‪ :‬ניבוי סטטיסטי מתעלם מקשרים לא ליניאריים ומאינטראקציות מורכבות בין המנבאים לקריטריון‪ .‬לקלינאי המנוסה‬ ‫יש את הידע המאפשר לו להתחשב בגורמים כאלה‪ .‬המומחה הקליני מכניס גמישות להערכותיו‪.‬‬ ‫טענות בעד הניבוי הסטטיסטי‪ :‬הקלינאי מושפע מגורמים לא רלוונטיים העלולים ליצור הטיות‪ ,‬החמורה מביניהן היא "הטיית האישוש"‪.‬‬ ‫הקלינאי נותן משקל יתר למנבאים שונים דווקא כשהוא מבחין שהם מעניקים ציון דומה‪ .‬המנבא השני "מאושש" את ההשערה של הקלינאי‬ ‫שנוצרה לאור המנבא הראשון‪ .‬אבל במרבית המקרים המנבאים נותנים ציון דומה פשוט כי יש ביניהם מתאם גבוה ואז השימוש בשניהם מטה את‬ ‫השיפוט כי הוא מעניק להם משקל כפול‪ .‬בנוסף‪ ,‬הקלינאי לא תמיד עקבי ועלול לתת ניבוי שונה לפרופילים זהים בהתאם לקונטקסט‪.‬‬ ‫מחקרים אמפיריים משנת ‪ 56‬ואילך מראים‬ ‫שוב ושוב שהניבוי הסטטיסטי טוב בהרבה‪,‬‬ ‫ועדיין הניבוי הקליני נפוץ הרבה יותר‪.‬‬ ‫המאמר מ‪ '79 -‬של ‪:Robin Dawes‬‬ ‫במאמרו הקלאסי בדק רובין דוז מתוך רשומות‬ ‫של נתונים את מתאמי תוקף הניבוי של‪:‬‬ ‫אבחנות פסיכיאטריות‪ -‬נוירוזה לעומת‬ ‫פסיכוזה‪ ,‬נתוני הצלחה אקדמית בשתי‬ ‫אוניברסיטאות‪ ,‬ודירוגי סגל אקדמי‬ ‫באוניברסיטה‪.‬‬ ‫מה ניתן להסיק?‬ ‫‪ ‬תופעת הכיווץ‪ :‬ההבדלים בין עמודה ‪ 5‬ו‪ 6-‬פרט למקרה הראשון (בגלל גודל המדגם)‪.‬‬ ‫‪ ‬מודל שיפוטי‪ :‬המתאמים בעמודה ‪ 2‬גבוהים מעמודה ‪ – 1‬מודל שיפוטי משפר את ניבוי השופטים‪ :‬מבצעים רגרסיה מרובה ומחשבים משקולות‬ ‫אופטימליים עבור החזאים (יש תוצאות של דגימת החזאים) כנגד ציוני הקריטריון שהתקבלו ע"י השיפוטים הקליניים‪ .‬באמצעות הרגרסיה‬ ‫יתקבלו משקולות שניתן ליישם במודל סטטיסטי לצורך ניבוי הקריטריון‪ .‬ממצאים אלה מעידים על כך שמתחת לשיפוטי השופטים מסתתרות‬ ‫משקולות עבור החזאים שנמצאות בראשם של השופטים‪ ,‬אך השופטים נכשלים בישומם באופן עקבי וזאת עקב השיפוט האנושי (שאיננו‬ ‫‪‬‬ ‫‪‬‬ ‫‪‬‬ ‫‪‬‬ ‫סיסטמתי) בהשוואה למודל סטטיסטי עקבי‪ .‬הרגרסיה למעשה מבטלת את גורם הטעות הנובע מחוסר העקביות של השיפוט האנושי‪ .‬זוהי‬ ‫הוכחה מצוינת לכך שמודלים סטטיסטיים טובים יותר מניבוי אנושי אפילו אם ציון הקריטריון נובע מתוך שיפוט אנושי עבור מדגם‪.‬‬ ‫מודל רנדומאלי‪ :‬טוב יותר ממודל ניבוי שופטים‪ ,‬וטוב לפחות באותה מידה כמו מודל השופט‪.‬‬ ‫מודל משקולות שווים‪ :‬המודל הזה פשוט מחלק משקולות שוות לכל החזאים ומתקבל ניבוי טוב יותר בצורה משמעותית בהשוואה למודל‬ ‫שופטים‪ ,‬שיפוטי ורנדומלי‪ .‬למעשה מדובר במודל הכי טוב שניתן ליישם במצב בו לא ניתן לבצע רגרסיה מרובה אופטימלית עבור מדגם גדול‬ ‫ולבצע תיקוף צולב‪ .‬אם נשווה את עמודה ‪ 4‬ל ‪ 6‬נראה שעבור מדגמים קטנים שימוש במשקולות שווים עדיף על המודל האופטימלי ‪ +‬תיקוף‬ ‫צולב‪.‬‬ ‫מודל אופטימלי‪ :‬במודל זה יחושבו מתאמים על סמך ציוני קריטריון אמיתיים בהליך של רגרסיה מרובה משקולות עבור החזאים השונים‪ .‬זהו‬ ‫ההליך הטוב ביותר‪.‬‬ ‫מודל אופטימלי לאחר תיקוף צולב‪ :‬תוצאת התיקוף הצולב מייצגות יותר את איכות המודל האופטימלי במציאות‪ .‬ניתן לראות שבמקרה של‬ ‫מדגמים קטנים התיקוף הצולב למעשה הופך את המודל האופטימלי לפחות מדויק בהשוואה למודל משקולות שוות‪.‬‬ ‫מערכי ניסוי‬ ‫מערך הניסוי‪:‬‬ ‫כל פרטי מבנה הניסוי – המשתנים התלויים והב"ת‪ ,‬מס' קבוצות הניסוי‪ ,‬אופי הקצאת הנבדקים‪ ,‬מספרם‪ ,‬אופי העברת הניסוי וכו'‪.‬‬ ‫בכל בניית מערך ניסוי החוקר צריך לחשוב האם המערך שנבנה יענה על שאלת המחקר ואלו בעיות על התוקף צפויות לו‪.‬‬ ‫מערך המחקר הוא הכלי המרכזי להבטחת תוקף פנימי‪ ,‬אולם לאו דווקא את היתר‪ :‬כדי להבטיח את תוקף המסקנה הסטטיסטית אפשר לכלול‬ ‫במערך משתנים ב"ת‪ ,‬שתפקידם להקטין את שונות הטעויות‪ ,‬אך נחוצים גם מדדים מהימנים‪ .‬כדי להבטיח את תוקף המבנה והתוקף חיצוני יש‬ ‫לעשות יותר מניסוי אחד‪ ,‬כי אחד לא יכול להבטיח יכולת הכללה מעבר לכל ההגדרות האופרציונליות של כל המשתנים ומעבר לכל האוכלוסיות‬ ‫והמצבים‪.‬‬ ‫האם מערך הניסוי יכול באופן לוגי לענות על שאלות המחקר?‬ ‫לדוג'‪ ,‬חוקר רוצה לדעת אם השיטה להוראת הקריאה שבחר יעילה‪ .‬לכן לימד כיתה ב' עם שיטה זו‪ ,‬ומצא שבסוף השנה רוב התלמידים שיפרו‬ ‫את רמת הקריאה שלהם ביחס לתחילת השנה ואף דיווחו בשאלון שאוהבים לקרוא‪ .‬הבעיה היא שללא קבוצת ביקורת לא ניתן להסיק על‬ ‫סיבתיות‪ .‬לא ניתן לדעת האם השיפור נובע משיטת ההוראה‪ ,‬או היה מתרחש גם בשיטות הוראה אחרות‪ .‬כלומר – לפנינו מערך ניסוי שגוי!‬ ‫חלוקה של מערכי מחקר‪:‬‬ ‫נהוג לחלק את מערכי הניסוי ל‪ 3-‬סוגים‪:‬‬ ‫מערכי ניסוי שגויים (קדם‪ -‬ניסויים)‪ :‬מערכים שהשתמשו בהם בעבר‪ ,‬תוקף ממצאיהם מוטל בספק‪ .‬אין להשתמש בהם‪.‬‬ ‫‪.1‬‬ ‫מערכי ניסוי אמיתיים‪.‬‬ ‫‪.2‬‬ ‫‪ .3‬מערכים דמויי ניסוי (‪ -)Quasi Experimental Design‬משרתים מחקר שדה עם השערה סיבתית‪ .‬מחקרים אלו שונים מניסויי מעבדה‬ ‫באחד מהבאים‪ )1( :‬החוקר לא יכול לקבוע את סדר הזמנים‪ -‬מתי להפעיל את המניפולציה‪ )2( .‬אי אפשר לעשות הקצאה רנדומלית‬ ‫לקב' הניסוי והביקורת‪.‬‬ ‫סימנים לתיאור מערכים‪:‬‬ ‫‪ -X‬הפעלת המניפולציה או כל מאורע אחר שיש למדוד את השפעתו‪.‬‬ ‫‪ -O‬מציין תצפית‪ /‬מדידה של המשתנה התלוי‪ :On....O2 ,O1 .‬סדרת מדידות של המשתנה התלוי‪.‬‬ ‫‪ -R‬חלוקה רנדומלית‪.‬‬ ‫‪( ----‬קו מרוסק)‪ -‬חלוקה לא רנדומלית‪.‬‬ ‫מערכי ניסוי שגויים‪:‬‬ ‫‪ .1‬ניתוח מקרה‬ ‫הפעלת מניפולציה (‪ )X‬על קבוצה‪ ,‬ואז מדידת המשתנה התלוי (‪ )O‬כדי לבדוק את השפעתה‪.‬‬ ‫‪O‬‬ ‫קידוד‪X :‬‬ ‫דוגמא‪ :‬מנהל רוצה לבדוק יעילות שיטת הוראה‪ .‬הוא מלמד לפיה למשך תקופה ואז בוחן את הישגי התלמידים‪.‬‬ ‫בעייתיות‪ :‬מחקר חסר ערך‪ .‬מחקר מדעי דורש לפחות השוואה אחת‪ ,‬ובמערך זה אין שום השוואה בין קבוצה לפני ואחרי המניפולציה או לפחות‬ ‫בין מדידה לפני המניפולציה ומדידה לאחריה‪ .‬אין למה להשוות את הממצאים‪ -‬התוצאות יכלו להתקבל גם ללא המניפולציה‪ ,‬וללא השוואה אי‬ ‫אפשר לבדוק זאת‪ .‬ישנו משתנה ב"ת קבוע‪ -‬עם רמה אחת בלבד‪ .‬לכן נקרא המערך "ניתוח מקרה"‪ -‬הוא נוגע למקרה אחד בלבד‪ ,‬ללא השוואה‪.‬‬ ‫‪ .2‬מערך "לפני‪-‬אחרי" ללא קבוצת ביקורת‬ ‫‪ O2‬שתי מדידות לפחות‪ -‬לפני המניפולציה ואחריה‪.‬‬ ‫‪X‬‬ ‫קידוד‪O1 :‬‬ ‫דוגמא‪ :‬המנהל משווה את הישגי תלמידיו לפני שהחלו ללמוד לפי השיטה החדשה להישגיהם אחרי שלמדו‪ .‬הוא לא משווה להישגי תלמידים‬ ‫שלא למדו לפי השיטה החדשה‪ ,‬ולכן אין קבוצת ביקורת‪.‬‬ ‫יתרונות‪ :‬עדיף על המערך הקודם‪ ,‬משום שיש השוואה אחת לפחות‪.‬‬ ‫חסרונות‪ :‬מערך זה לא עולה על קודמו מבחינת ההתגברות על איומי התוקף הפנימי‪ ,‬שעשויים לשמש הסברים חלופיים‪:‬‬ ‫היסטוריה‪ -‬הציונים עלו משום שהתלמידים החלו ללמוד לבחינות הבגרות‪.‬‬ ‫‪‬‬ ‫בשילה‪ -‬התלמידים גדלו וחשיבתם הלוגית השתפרה‪.‬‬ ‫‪‬‬ ‫מדידה‪ -‬המדידה הראשונה רמזה לתלמידים שמדובר במקצוע חשוב שכדאי להשקיע בו‪ ,‬ולכן עלו ציוניהם במדידה השניה‪.‬‬ ‫‪‬‬ ‫מכשור‪ -‬שינויים שחלו במכשור (מבחן לא מהימן‪ ,‬למשל) או בבוחנים בין מדידה למדידה‪.‬‬ ‫‪‬‬ ‫רגרסיה לממוצע‪ -‬אם קבוצת הניסוי נבחרה על סמך ציוניה הקיצוניים‪.‬‬ ‫‪‬‬ ‫‪ .3‬מערך "אחרי"‪ +‬קב' ביקורת ללא רנדומיזציה‬ ‫היפוכו של המערך הקודם‪ ,‬יתרונותיו של המערך הקודם הם מגרעותיו של מערך זה ולהפך‪.‬‬ ‫‪---‬‬‫קב' ניסוי המקבלת מניפולציה וקב' ביקורת שלא מקבלת את המניפולציה‪ .‬שתיהן נמדדות רק לאחר‬ ‫קידוד‪O1 X :‬‬ ‫המניפולציה ולא לפניה‪ .‬אין הקצאה מקרית‪.‬‬ ‫‪----‬‬‫‪O2‬‬ ‫דוגמא‪ :‬מלמדים שיטה חדשה על כיתה אחת‪ ,‬בעוד השנייה ממשיכה ללמוד כרגיל‪ .‬לאחר תקופה‪ ,‬נמדדים הישגי שתיהן‪.‬‬ ‫בעייתיות‪ )1( :‬הנבדקים לא הוקצו לקבוצות בצורה מקרית‪ )2( .‬הקבוצות לא נבדקו לפני הפעלת המניפולציה‪ ,‬כך שאין דרך לוודא שהן היו‬ ‫שוות מלכתחילה‪.‬‬ ‫בעיות אלו יוצרות איומים על התוקף הפנימי‪:‬‬ ‫ברירה‪ -‬ההבדל בין ‪ 2‬הכיתות אולי נבע מהבדל ברמה ההתחלתית של שתי הקבוצות‪.‬‬ ‫‪‬‬ ‫בשילה‪ -‬כמו במחקר הקודם‪.‬‬ ‫‪‬‬ ‫נשירה‪ -‬בד"כ התלמידים הנושרים מביה"ס הם הפחות טובים‪.‬‬ ‫‪‬‬ ‫אינטראקציה בין ברירה ונשירה או בין ברירה ובשילה‪ -‬אם הקבוצות היו שונות מלכתחילה‪ ,‬עלולה להיות נשירה גדולה יותר בקב'‬ ‫‪‬‬ ‫אחת ולא בשנייה‪ ,‬וכן בשילה גדולה בקב' אחת ולא בשנייה‪.‬‬ ‫חוקרים רבים סבורים שאפשר להתגבר על מגבלות מערך זה ע"י התאמה‪ :‬מתאימים לכל נבדק מקב' הניסוי נבדק מקביל מקב' הביקורת‪ ,‬הזהה‬ ‫לו במשתנים רבים ככל האפשר (גיל‪ ,‬מין‪ ,‬מוצא וכו')‪ .‬אולם‪ ,‬אי אפשר ליצור שוויון באינסוף משתנים‪ .‬כמו כן אין כל ערך להתאמה אם היא לא‬ ‫נעשתה גם לפי המשתנה התלוי ולפני הטיפול הניסויי‪.‬‬ ‫מערך דמוי ניסויי‪:‬‬ ‫מחקר דמוי ניסויי הוא מחקר בו הנבדקים לא נדגמים ע"י החוקר‪ ,‬אלא נלקחים כיחידה אחת‪ .‬בד"כ מדובר במחקרי שדה‪.‬‬ ‫לדוג'‪ ,‬מנהלת בי"ס רוצה לבדוק האם הוראת חשבון בצורה כלשהי טובה יותר מזו הפרונטלית‪ .‬היא קובעת שבשנה מסוימת כיתה ד'‪ 1‬תלמד‬ ‫בצורה הזו ו‪-‬ד'‪ 2‬תלמד פרונטלית‪ ,‬ובסוף השנה מעבירה מבחן זהה לשתי הקבוצות‪.‬‬ ‫זהו מחקר דמוי ניסויי כי הנבדקים לא נדגמו לניסוי אלא נעשה שימוש בקבוצה קיימת‪ .‬מחקר כזה הוא בעייתי כי לא ניתן לדעת האם ההבדלים‬ ‫בין הקבוצות היו מלכתחילה או שהם נבעו מהמניפולציה הניסויית‪ .‬מחקר ניסויי אמיתי תמיד עולה על דמוי ניסויי כי יכולת ההסקה אודות‬ ‫סיבתיות תמיד גבוהה יותר‪.‬‬ ‫עם זאת‪ ,‬לעיתים קרובות לא ניתן לערוך בשדה מחקרים ניסויים אמיתיים ואין ברירה אלא להסתמך על מערך מחקר דמוי ניסויי‪( .‬לדוג'‪ ,‬חוקר‬ ‫שבודק צמחונים מול לא צמחונים)‪ .‬במצבים כאלו על החוקר לנסות ולבקר כמיטב יכולתו את ההתאמה בין קב' הניסוי והביקורת‪ .‬מערכים דמויי‬ ‫ניסוי נועדו לאפשר הסקה סיבתית במצבים בהם‪:‬‬ ‫‪ ‬החוקר לא שולט בסדר הזמנים‪ -‬זמן מתן המניפולציה‪.‬‬ ‫‪ ‬החוקר לא שולט במדגמים‪ -‬לא יכול לבצע הקצאה רנדומלית‪.‬‬ ‫‪ .1‬סדרת בדיקות "לפני ואחרי" ללא קב' ביקורת‬ ‫כל אדם העומד בראש ארגון מעוניין לעתים לשנות את שיטות העבודה‪ .‬אם אין לו קב' ביקורת הדבר היחיד שהוא יכול לעשות זה שימוש בקב'‬ ‫ניסוי אחת ומדידתה מספר פעמים לפני המניפולציה ומספר פעמים אחריה‪.‬‬ ‫‪O8‬‬ ‫‪O7‬‬ ‫‪O6‬‬ ‫‪O5‬‬ ‫‪X‬‬ ‫‪O4‬‬ ‫‪O3‬‬ ‫‪O2‬‬ ‫‪O1‬‬ ‫קידוד‪:‬‬ ‫אם לא יימצא הבדל בין המדידות ‪ O4 ,O3 ,O2 ,O1‬וגם לא בין המדידות ‪ ,O8 ,O7 ,O6 ,O5‬אבל כן יתקבל הבדל מובהק בין ‪ 2‬קבוצות‬ ‫המדידות‪ -‬משמע שהוא נובע מהמניפולציה‪.‬‬ ‫חסרון‪:‬‬ ‫‪ ‬היסטוריה‪ :‬ייתכן שאירוע שהתרחש במקביל ל‪ X -‬גרם להבדל‪ .‬איום זה חמור כשהנבדקים חשופים לגירויים רבים‪ .‬אם רוצים לבדוק‬ ‫השפעת ת כנית לימודים על עמדות‪ ,‬יש לדעת שהנבדקים חשופים יום יום להשפעות נוספות חוץ מהשפעת התוכנית‪ .‬בבדיקת השפעת‬ ‫תרופה על זיכרון איום זה לא מרכזי‪ ,‬כי זיכרון לא נתון כ"כ להשפעות חיצוניות‪ .‬אבל יש פתרון‪ :‬שימוש במדידות החוזרות לאורך זמן לפני‬ ‫הטיפול ואחריו‪ ,‬מאפשרות לשלוט באיום זה‪.‬‬ ‫‪ ‬מכשור‪ :‬שינוי בכיול כלי המדידה מבדיקה אחת לשנייה עלול להיות הסבר חלופי‪ .‬אם למשל הבוחנים מודעים להשערות המחקר‪ ,‬זה עלול‬ ‫לסלף את שיפוטם‪ .‬בכל מקרה‪ ,‬לעולם אין להחליף את כלי המדידה במקביל להפעלת המניפולציה‪ .‬אין להחליף את מדדי הערכת העמדות‬ ‫לאחר סיום הוראת התוכנית (‪ )X‬לצורך הבדיקות שלאחר הטיפול‪ ,‬גם אם החוקר לא מרוצה מהמדדים בהם השתמש לפני ההוראה‪.‬‬ ‫‪ ‬איומים על התוקף החיצוני‪:‬‬ ‫אינטראקציה בין ברירה לטיפול‪.‬‬ ‫א‪.‬‬ ‫אינטראקציה בין מדידה לטיפול‪.‬‬ ‫ב‪.‬‬ ‫הערה‪ :‬למרות הבעיות‪ ,‬מערך זה מומלץ כאשר אין קבוצת ביקורת‪.‬‬ ‫‪ .2‬מערך "לפני‪ -‬אחרי" ‪ +‬קב' ביקורת לא זהה‬ ‫במערך זה החוקר יכול להשיג קבוצת ביקורת‪ ,‬אך לא יכול לבצע הקצאה מקרית‪.‬‬ ‫‪( O2‬קב' ניסוי ‪ -‬לפני אחרי עם מניפולציה)‬ ‫‪X‬‬ ‫‪O1‬‬ ‫קידוד‪:‬‬ ‫‪--------------------‬‬‫‪( O4‬קב' ביקורת ‪ -‬לפני אחרי בלי מניפולציה)‬ ‫‪O3‬‬ ‫מערך זה זהה למערך האמיתי "לפני‪ -‬אחרי"‪ +‬קב' ביקורת‪ ,‬עם הבדל אחד‪ :‬פה אין הקצאה מקרית‪.‬‬ ‫במערך "לפני‪ -‬אחרי" עם קב' ביקורת אפשר להניח ש‪ 2-‬הקבוצות זהות‪ ,‬משום שהנבדקים נדגמו מאותה אוכלוסיה ורק אז הוקצו מקרית‬ ‫לקבוצות‪ .‬במערך הנוכחי אין אפשרות לעשות זאת‪ .‬לדוגמא‪ ,‬אם מורה מעוניין להשוות בין שיטת לימוד שנלמדת בת"א לבין שיטה אחרת‬ ‫הנלמדת באילת‪ ,‬אין לו אפשרות לחלק את הנבדקים מקרית‪.‬‬ ‫יתרונות‪:‬‬ ‫‪ ‬היסטוריה‪ ,‬בשילה ומדידה‪ -‬כל אלו מבוקרים היטב במערך זה‪ .‬אם ההבדל בין המדידה לפני למדידה אחרי בקב' הניסוי גדול מאותו הבדל‬ ‫בקב' הביקורת‪ -‬האחראי לכך הוא הטיפול הניסויי‪.‬‬ ‫‪ ‬מערך זה אפילו עשוי להיות עדיף על המערך האמיתי המקביל לו בכך שאפשר לבצע אותו מבלי שהנבדקים ידעו שהם משתתפים במחקר‪.‬‬ ‫במערך האמיתי הרנדומיזציה בד"כ אומרת לנבדקים שהם משתתפים בניסוי‪.‬‬ ‫חסרונות‪:‬‬ ‫‪ ‬סכנה של אינטראקציה בין בשילה וברירה‪ ,‬היסטוריה וברירה או מדידה וברירה‪ -‬אם נבדקי קב' הניסוי הם חולי נפש וקב' הביקורת היא‬ ‫נורמלית‪ ,‬כל שינוי בקב' הניסוי עלול להתפרש כהחלמה ספונטנית‪.‬‬ ‫‪ ‬רגרסיה לממוצע‪ :‬אם ‪ 2‬הקבוצות או אחת מהן נבחרו לפי ציוניהן הקיצוניים‪ ,‬כל הבדל ביניהן עלול להתפרש כרגרסיה לממוצע‪ .‬אפקט זה‬ ‫גדל במחקרים בהם נעשתה טעות בהתאמה ‪ -‬הניסיון להשוות את ציוני שתי הקבוצות לפני הפעלת המניפולציה‪.‬‬ ‫במערך אמיתי ניתן להשתמש בהתאמה כהשלמה לרנדומיזציה‪ ,‬אולם בדמוי ניסויי אי אפשר (כי אין רנדומ') וזה מעוות את התוצאות‪ :‬יש‬ ‫מחקרים בהם כדי להשוות בין הקבוצות יש לבחור קב' קיצוניות מאוד‪.‬‬ ‫לדוג'‪ ,‬אם החוקר רוצה להתאים את ציוני כיתה ג' לציוני כיתה ה'‪ ,‬עליו לבחור מכיתה ה' רק את התלמידים הנחשלים ביותר‪ .‬סביר כי‬ ‫הרגרסיה לממוצע בכיתה ה' תהיה שונה מהרגרסיה בכיתה ג'‪ ,‬ותהווה הסבר חלופי‪.‬‬ ‫לעתים הרגרסיה גורמת להבדל מלאכותי‪ ,‬ולעתים היא מטשטשת הבדל אמיתי‪-‬‬ ‫דוג' אחרת‪ :‬במחקר בדקו השפעת טיפול נפשי על דימוי עצמי של מטופלים‪ .‬בקב' הניסוי היו אנשים עם בעיות נפשיות‪ ,‬בקב' הביקורת אנשים‬ ‫רגילים‪ .‬לפני המניפולציה ציוני קב' הביקורת בדימוי עצמי הותאמו לציוני קב' הניסוי‪ .‬כך יצא שבקבוצת הבריאים היו אנשים שהדימוי‬ ‫העצמי שלהם נמוך בצורה קיצונית‪ .‬במדידה לאחר המניפולציה‪ ,‬הרגרסיה גרמה לציוני קב' הביקורת להתקרב לממוצע‪ -‬כלומר‪ ,‬ציוניה עלו‬ ‫ונוצר אצלה פער בין המדידה שלפני לבין המדידה שאחרי‪ .‬פער זה דמה לפער שבקב' הניסוי‪ ,‬וכך לא התקבל הבדל בין ‪ 2‬הקבוצות‪ ,‬למרות‬ ‫שהוא קיים במציאות‪.‬‬ ‫יש לשים לב ‪ -‬אם בכל זאת יימצא הבדל‪ ,‬הרי שהרגרסיה חיזקה את תוקף הממצאים‪ ,‬משום שהוא התקבל למרות הרגרסיה‪.‬‬ ‫פתרון אפשרי לבעיית הרגרסיה‪ :‬ניתן לנסות ולנבא מראש את כיוונה‪ ,‬ובהתאם לכך לשפוט את התוצאות‪.‬‬ ‫מערך ניסוי אמיתי‪:‬‬ ‫מערכים אלה מומלצים משום שהם עונים על כל איום אפשרי על התוקף הפנימי‪ .‬בעקרון הם מושתתים על ‪ 2‬עקרונות‪:‬‬ ‫‪ ‬הקצאה מקרית‪.‬‬ ‫‪ ‬שליטה בעיתוי הפעלת המניפולציה‪ ,‬בבחירת ממדי המשתנה התלוי‪ ,‬בזמן המדידה ובאופייה‪.‬‬ ‫מערך בין‪-‬נבדקי או תוך‪-‬נבדקי‪:‬‬ ‫מערך בין‪-‬נבדקי ‪ -‬לקבוצות הניסוי השונות נדגמים נבדקים שונים‪ .‬נבחר לעיתים קרובות כי הוא היחיד שיכול לענות על שאלת המחקר‪.‬‬ ‫דוגמאות‪:‬‬ ‫א‪ .‬כששאלת המחקר נוגעת לאוכלוסיות שונות‪ .‬לדוג'‪ :‬מחקר נבדקים אקסטרוברטים ואינטרוברטים שונים בביצוע מטלות מוטוריות‪ .‬אי‬ ‫אפשר להפוך את אותו אדם פעם לאקס' ופעם לאינ' (כמו גבר ואישה)‪ ,‬ויש לקחת נבדקים שונים לכל קבוצה‪.‬‬ ‫ב‪ .‬כשההשתתפות בתנאי ניסוי אחד משפיעה על ביצועי הנבדקים בתנאי ניסוי אחר‪ .‬לדוג'‪ :‬כשנבדקים שונים מקבלים הוראות שונות‬ ‫והניסוי כרוך בהולכת שולל‪.‬‬ ‫ג‪ .‬במצבים בהם אסור שקבוצת הביקורת תקבל טיפול בעוד קבוצת הניסוי מקבלת אותו‪ .‬לדוג'‪ :‬בניסויים רפואיים בהם קבוצת ביקורת‬ ‫מקבלת רק פלסבו‪.‬‬ ‫היתרון‪ :‬כל נבדק נכנס לניסוי כלוח חלק‪.‬‬ ‫החסרונות‪ )1( :‬דרוש מספר רב של נבדקים‪ ,‬עלות ניסוי גבוהה‪ .‬כשיש בניסוי ‪ K‬קבוצות‪ ,‬זקוקים לפי ‪ K‬נבדקים‪ ,‬וכשהנבדקים הם נדירים מאוד‬ ‫קשה להשיג אותם‪ )2( .‬ההבדלים בין הקבוצות יכולים לנבוע מהבדלים בין נבדקים‪ ,‬ולכן יש מקור עשיר יותר לשונות טעותית ← הסתברות‬ ‫גבוהה לטעות מסוג שני (בתוקף המסקנה הסטטיסטית)‪.‬‬ ‫כיצד יוצרים קבוצות זהות במערך בין נבדקי?‬ ‫א‪ .‬הקצאה מקרית לחלוטין‪ :‬כלומר‪ ,‬ההסתברות להשתייך לקב' הניסו י או הביקורת זהה‪ ,‬הנבדק מוגרל לתוך הניסוי ולא נבחר‪ .‬ב‪ N-‬מספיק‬ ‫גדול הרנדומיזציה אפקטיבית יותר‪ ,‬ולכן הסיכוי שלא י היו הבדלים מהותיים בין הקבוצות גדל‪ ,‬הסיכוי לאינטרקציה בין משתני נבדק‬ ‫כלשהם לבין המשתנה התלוי הנמדד קטנים‪.‬‬ ‫ב‪ .‬התאמה‪ :‬כאשר מספר הנבדקים מצומצם (למשל במחקרי דימות מוח) ולא ניתן להבטיח כי דגימה רנדומלית תטשטש את ההבדלים ותיצור‬ ‫קבוצות זהות ‪ -‬החוקר מתערב בדגימה ומתאם את נבדקיו בקבוצות השונות לאור משתני רקע רלוונטיים או לאור מדידת ביצועים במטלות‬ ‫רלוונטיות‪.‬‬ ‫לדוג'‪ ,‬חוקר בודק ב ‪ fMRI‬אקטיבציה סמנטית אצל ילדים עם ליקויי קריאה‪ ,‬כדי לבחון קשר בין בעיות בפענוח אותיות לצלילים לבין‬ ‫אקטיבציה במח‪ .‬לרשות החוקר מדגם של ‪ 12‬ילדים הסובלים מבעיות פענוח בגיל ממוצע ‪ .8.4‬איך ידגום את קב' הביקורת?‬ ‫‪ ‬אפשרות א'‪ -‬התאמה לפי גיל‪ :‬ילדים שלא סובלים מבעיות קריאה וממוצע גילם הינו ‪ 8.4‬גם כן‪ .‬היתרון‪ :‬זהות במשתנה הרקע הרלוונטי‬ ‫לקריאה‪ -‬גיל‪ .‬החסרון‪ :‬יתכן ואקטיבציה סמנטית קשורה בהיסטוריה של קריאה‪ ,‬ולפיכך בהינתן גיל זהה הנבדקים הדיסלקטים קראו פחות‬ ‫מקבוצת הביקורת‪ ,‬ודפוס עיבודם הסמנטי במח יהיה שונה ללא קשר לדיסלקציה‪.‬‬ ‫‪ ‬אפשרות ב'‪ -‬התאמה לפי יכולת קריאה‪ :‬החוקר יערוך מבחן פענוח לקבוצת הניסוי (לקויי קריאה)‪ ,‬ולנבדקים פוטנציאלים מקבוצת‬ ‫הביקורת‪ ,‬ויתאם בין שתי הקבוצות לפי ביצועיהן במבחן הפענוח‪ .‬יתרון‪ :‬ייווצר מצב בו ההבדל בין שתי הקבוצות יתמקד רק בהיות נבדקי‬ ‫קב' הניסוי דיסלקטים‪ .‬החיסרון‪ :‬במצב זה לא תהיה התאמה בגיל‪ ,‬ואם המערכת הסמנטית מתפתחת גם לפי הגיל‪ ,‬לאור נסיון שאיננו מוגבל‬ ‫רק לקריאה‪ ,‬תיווצר בעיה‪.‬‬ ‫* לעיתים קרובות לא ניתן להגיע להתאמה ללא חסרונות‪ ,‬והחוקר מתאם לקבוצת הניסוי יותר מקבוצת ביקורת אחת‪.‬‬ ‫מערך תוך‪-‬נבדקי ‪ -‬כל הנבדקים עוברים את הטיפולים כולם‪ .‬נקרא גם מערך מדידות חוזרות ‪.Repeated Measures -‬‬ ‫יתרונות‪:‬‬ ‫‪ .1‬הקטנת השונות הטעותית‪ :‬כל נבדק משמש כקבוצת ביקורת לעצמו‪ -‬מודדים את ההפרש אצל אותו אדם‪ .‬ההבדלים בקבוצת הניסוי לא‬ ‫נובעים מהבדלים מקריים שמקורם בין‪ -‬אישי‪ .‬מערך תוך‪ -‬נבדקי חשוב במיוחד כשנמדדים ביצועי נבדקים במטלות בהן יש מלכתחילה‬ ‫הבדלים בין‪ -‬אישיים גדולים‪ ,‬למשל בהקרנת גירויים בזמני חשיפה קצרים‪ .‬במערך תוך‪ -‬נבדקי עוצמת המבחן עולה‪ ,‬כלומר מערך זה‬ ‫משפר את יכולתנו לגלות את האפקט‪.‬‬ ‫‪ .2‬חסכון במספר הנבדקים‪.‬‬ ‫איומים על מערך תוך נבדקי‪ :‬דוגמא להמחשה‪ :‬חוקר רוצה לבחון את המרחק שכדורי גולף שונים עוברים בחבטה‪ .‬במערך בין נבדקי הוא דוגם‬ ‫שתי קבוצות חובטים‪ ,‬כשאחת חובטת בכדור מסוג ‪ 1‬והשנייה בכדור מסוג ‪ .2‬נמצא שהקבוצה עם כדור מסוג ‪ 2‬הגיעה למרחק רב יותר‪ .‬האיומים‬ ‫על תוקף מסקנות המחקר‪ )1( :‬ההבדל נובע מטעות מסוג ראשון (‪ )2‬אולי החובטים בקבוצה זו היו טובים יותר ולא הכדור‪ .‬במערך תוך נבדקי כל‬ ‫נבדק חובט עם שני הכדורים‪ ,‬ונמדד ממוצע ההפרשים אצל כל נבדק‪.‬‬ ‫א‪ .‬אפקט סדר (‪ :)sequence effect‬תנאי הניסוי ישפיע על תוצאות הנבדק‪ .‬ייתכן שבחבטה השנייה החובט מתעייף ומבצע פחות טוב‪ ,‬או‬ ‫לחילופין שהוא "התחמם" ומבצע יותר טוב‪.‬‬ ‫ב‪ .‬אפקט העברה (‪ :)carry over effect‬תנאי הניסוי הראשון גרם ללמידה שהשפיעה על תנאי הניסוי השני‪" .‬למידה" יכולה להיות כל שינוי‬ ‫התנהגותי (הגברת רגישות תפיסתית‪ ,‬הגברת קשב‪ ,‬עומס זיכרון וכו')‪.‬‬ ‫דרכים להתגבר על אפקט הסדר‪:‬‬ ‫א‪ 2 .‬תנאי ניסוי ‪ -‬איזון סדר תנאי הניסוי‪ :‬בדוגמא‪ -‬מחצית מהחובטים יחבטו קודם בכדור מסוג ‪ 1‬ולאחר מכן בכדור מסוג ‪ ,2‬בעוד מחציתם‬ ‫יחבטו בסדר הפוך‪.‬‬ ‫ב‪ 3 .‬תנאי ניסוי ‪ -‬איזון מוחלט (‪ :)counter balancing‬כל הסדרים הקומבינטורים האפשריים נבחנים‪ ,‬וכל נבדק מוקצה‬ ‫לסדר אחד‪ .‬בשלושה תנאים ניצור ‪ 6‬קבוצות (‪ -)!3‬קבוצה לכל סדר אפשרי‪ ,‬שבכל אחת מס' נבדקים שווה‪.‬‬ ‫ג‪ .‬יותר מ ‪ 3‬תנאי ניסוי ‪ -‬איזון חלקי‪ /‬ריבוע לטיני‪ :‬בהינתן ‪ 4‬תנאי ניסוי ‪ ,ABCD‬ידגמו ‪ 4‬סדרים מתוך ‪ 4!=24‬סדרים אפשריים‪.‬‬ ‫כל תנאי ניסוי יופיע פעם אחת בכל מיקום אפשרי‪ -‬ראשון‪ ,‬שני‪ ,‬שלישי או רביעי‪ .‬התנאים הם תמיד באותו סדר‪ ,‬אך בכל פעם‬ ‫האות הראשונה עוברת לסוף‪ .‬מתאים רק כשלחוקר לא משנה איזה תנאי היה לפני או אחרי התנאי הנוכחי‪.‬‬ ‫מערכי ניסוי אמיתיים עם מספר צעדים רב‪ :‬לעיתים צריך להגיב לגירויים רבים במערך הניסוי‪ .‬לדוגמא‪ ,‬ניסויים פסיכופיזיים או‬ ‫ניסויי תפיסה בהם יש מאות צעדים‪ ,‬וכל צעד שייך לתנאי ניסוי אחר‪ .‬גורמים כמו עייפות הנבדק‪ ,‬הסתגלות הדרגתית לאור וכו' משנים את‬ ‫התגובות לאורך זמן‪ .‬הפתרון‪ :‬הקצאה רנדומלית של סדר גירויים אחר לכל נבדק‪ .‬המחשב בוחר בכל צעד גירוי באופן מקרי‪.‬‬ ‫מערכי ניסוי אמיתיים עם חזרה על גירויים – מערך משולב‪ :‬לעיתים מתבקש הנבדק להגיב לגירויים זהים בתנאי ניסוי שונים‪ .‬לדוגמא‪ ,‬ניסוי‬ ‫זיהוי מילים‪ :‬בודק האם אנשים שרואים מילה מגיבים יותר מהר למילה עם קשר מבני (משקל)‪ /‬עם קשר סמאנטי‪ /‬קשר צלילי של חריזה‪ /‬חוסר‬ ‫קשר (ביקורת)‪ .‬הבעיה‪ :‬תגובה שנייה לאותה מילה תמיד מהירה יותר‪ ,‬ולכן אסור לנבדק לראות את אותה מילה פעמיים‪ .‬בנוסף‪ ,‬יש שונות‬ ‫בזיהוי של המילים‪ -‬יש מילים יותר מוכרות שקל יותר לזהות ויש כאלה שפחות‪ .‬לכן חשוב שאותן מילים מסוימות יחזרו על עצמן בתנאים‬ ‫השונים‪.‬‬ ‫פתרון‪ :‬מערך משולב‪ .‬יוצרים מספר רשימות‪ -‬כל נבדק יבצע רשימה אחת‪ .‬בכל רשימה מחלקים את המילים כך שכל קבוצת מילים תוקצה‬ ‫לתנאי אחר‪ .‬ברשימה הבאה‪ ,‬אותן קבוצות מילים יוקצו לתנאים שונים‪ .‬לבסוף נוצרות ‪ 4‬רשימות מילים‪ ,‬כשבכל רשימה קבוצת מילים מסוימת‬ ‫הוקצתה לתנאי שונה! זהו בעצם ריבוע לטיני גם לנבדקים וגם למילים‪ ,‬כדי שנוכל להכליל גם מהנבדקים לאוכלוסייה כולה‪ ,‬וגם מהמילים‬ ‫שבחרנו למילים כולן‪.‬‬ ‫יתרונות‪:‬‬ ‫ כל נבדק נחשף לכל תנאי הניסוי (מערך תוך נבדקי)‪.‬‬‫ כל מילה הוצגה בכל תנאי הניסוי (מערך תוך גירויי)‪.‬‬‫‪ -‬אין נבדק ספציפי שראה אותה מילה פעמיים‪.‬‬ ‫‪.‬‬ ‫‪.‬‬ ‫‪.‬‬ ‫‪.‬‬ ‫‪.‬‬ ‫‪.‬‬ ‫‪.‬‬ ‫‪.‬‬ ‫מערכים מעורבים ומשולבים‪ :‬בעלי לפחות שני גורמים בלתי תלויים‪:‬‬ ‫מערך מעורב‪ :‬מכיל לפחות משתנה ב"ת אחד בין נבדקי ולפחות משתנה ב"ת אחד תוך נבדקי‪.‬‬ ‫מערך משולב‪ :‬מכיל לפחות משתנה ב"ת אחד נמדד (מתאמי) ולפחות משתנה ב"ת אחד מתופעל (ניסויי)‪.‬‬ ‫‪ .1‬מערך "לפני‪ -‬אחרי" ‪ +‬קב' ביקורת‬ ‫במערך זה יש ‪ 2‬יתרונות מרכזיים על הקודמים‪ )1( :‬הקצאה רנדומלית‪ )2( .‬הקבוצות נמדדו במשתנה התלוי לפני המניפולציה‪ ,‬כך שנוצר בסיס‬ ‫להשוואה ביניהן‪.‬‬ ‫‪O2‬‬ ‫‪X‬‬ ‫‪O1‬‬ ‫‪R‬‬ ‫קידוד‪:‬‬ ‫‪O4‬‬ ‫‪O3‬‬ ‫‪R‬‬ ‫הנבדקים הוקצו רנדומלית לקבוצות (ולכן יש להניח שהן שוות)‪.‬‬ ‫‪.1‬‬ ‫ניתן לבדוק באופן מעשי‪ ,‬אם אכן היו שוות במשתנה התלוי לפני הניסוי – בגלל המדידות לפני (במדגם מאוד גדול אין צורך)‪.‬‬ ‫‪.2‬‬ ‫יעילות המניפולציה נמדדת ביתר דיוק בעזרת השוואה בין הפער ‪ O2 -O1‬לעומת ‪.O4 -O3‬‬ ‫‪.3‬‬ ‫מערך זה מאפשר להתגבר על כל האיומים על התוקף הפנימי‪:‬‬ ‫‪ ‬היסטוריה‪ :‬שתי הקבוצות נמדדות בו זמנית במשתנה התלוי לפני הפעלת המניפולציה וגם אחריה‪ .‬כל מאורע שיתרחש בין המדידה שלפני‬ ‫לבין המדידה שאחרי‪ ,‬ישפיע באותה מידה על שתיהן‪ .‬לכן‪ ,‬אין בו הסבר חלופי להבדלים שנמצאו‪ .‬הבעיה היא לגבי ההיסטוריה המקומית‪:‬‬ ‫כשאי אפשר לבצע את המדידות בקרב ‪ 2‬הקבוצות בו זמנית‪ ,‬כל מאורע שקורה בקב' אחת ולא בשנייה עלול לשמש הסבר חלופי‪ .‬מצד‬ ‫שני‪ ,‬כשהניסוי נערך בו זמנית אך ל‪ 2-‬הקבוצות בנפרד‪ ,‬חייבים להשתמש ב‪ 2-‬נסיינים‪ ,‬ואז מסתכנים בהשפעת הנסיין הפוגעת בתוקף‬ ‫המבנה‪.‬‬ ‫פתרון‪ :‬רנדומיזציה של תנאי הניסוי שהופכת את גורמי הטעות השיטתית לגורמי טעות מקרית‪ ,‬ב‪ 2-‬דרכים אפשריות‪:‬‬ ‫א‪ .‬ריכוז כל הנחקרים בחדר אחד‪ ,‬אך מתן דפי הוראות שונים‪ .‬דרך זו מוגבלת כמובן רק לניסויים שבהם המניפולציה נעשית‬ ‫ע"י דפים כתובים‪.‬‬ ‫ב‪ .‬לערוך את הבדיקה המוקדמת (המדידה שלפני) לכל נבדק בנפרד‪ ,‬ואז להקצותו רנדומלית לקב' הניסוי או הביקורת‪ .‬אם‬ ‫הניסוי מחייב בדיקה בקבוצות‪ ,‬יש להתייחס לכל קב' כאל נבדק אחד‪ ,‬היות שלכל קבוצה יש היסטוריה פנימית משלה‪.‬‬ ‫במקרה זה‪ ,‬הקבוצות יוקצו בסדר רנדומלי לניסוי וביקורת‪.‬‬ ‫‪ ‬בשילה ומדידה‪ :‬מבוקרות ע"י הקצאה הרנדומלית לקבוצות‪ .‬הבדיקה שלפני הטיפול נערכת בשתיהן באותו זמן‪ ,‬כך שלשתיהן ניתנת‬ ‫הזדמנות שווה "להבשיל"‪ ,‬ובאותה מידה‪.‬‬ ‫‪ ‬מכשור‪ :‬פותרים בעיה זו כמו בעיית ההיסטוריה המקומית‪ :‬אם משתמשים במבחנים כתובים‪ ,‬המחולקים רנדומלית בין נבדקי קב' הניסוי‬ ‫והביקורת‪ ,‬הרי שכל הנבדקים נבחנים באותו זמן ובאותו אופן‪ .‬אם כל נבדק או קב' נבדקים נחקרים בנפרד הרנדומיזציה של סדר‬ ‫הבדיקה בין קב' הניסוי והביקורת מבטיחה שוויון בין שתיהן‪.‬‬ ‫‪ ‬שימוש בכמה מעריכים‪ :‬אפשר לחלקם רנדומלית בין הקבוצות‪ ,‬אך המעריך חייב להיות עיוור לתנאי הניסוי‪ ,‬כלומר אסור לו לדעת‬ ‫לאיזה תנאי ניסויי שייכים הנבדקים‪.‬‬ ‫‪ ‬רגרסיה‪ :‬אם ‪ 2‬הקבוצות נדגמו מאותה אוכ' קיצונית‪ ,‬וההקצאה הייתה רנדומלית‪ -‬אז הרגרסיה תשפיע באותו אופן על שתיהן‪.‬‬ ‫‪ ‬ברירה‪ :‬הדרך היחידה להבטיח שוויון בין הקבוצות היא ע"י הקצאה אקראית לקבוצות‪ .‬יש לזכור שהתאמה אינה תחליף להקצאה‬ ‫רנדומלית‪ .‬אפשר להשתמש בה רק כאמצעי עזר להשוואת ‪ 2‬הקבוצות או להקטנת שונות הטעויות‪ :‬אפשר להתאים את הנבדקים לפי כמה‬ ‫ממדים‪ ,‬ואח"כ להקצות חברי זוגות תואמים באופן רנדומלי לקבוצות‪ .‬אפשר לבחור את המשתנה שבו רוצים להשוות בין הנבדקים ב‪2-‬‬ ‫הקבוצות‪ ,‬ולהשתמש בו כמשתנה ב"ת נוסף‪ .‬בדרך זו‪ ,‬הופכים את השונות המקרית שיצר משתנה זה לשונות שיטתית‪.‬‬ ‫‪ ‬נשירה‪ :‬השאלה המרכזית היא האם הנשירה מקרית או שיטתית‪ .‬נשירה מקרית איננה בעייתית אך במידה ויש לנו נשירה המאפיינת את‬ ‫אחת הקבוצות ניתן לשער שייתכן ומאפיין הקבוצה הוא זה שהוביל לנשירה ולכן זה יהיה בלתי הולם להתחשב רק בתוצאות של‬ ‫הנבדקים שנותרו בעת ההשוואה‪ .‬ניתן להתגבר על בעיה זו בעזרת הכללת המדידות הראשונות של הנושרים במדידה השנייה במהלך‬ ‫הניתוח‪ .‬כלומר‪ ,‬לנושרים יהיה אותו ציון ב‪ 2-‬המדידות‪ .‬כך מחלישים את האפקט הניסויי‪ ,‬אך לפחות נמנעים מטעות הדגימה‪.‬‬ ‫הבעיה העיקרית במערך זה‪ :‬פגיעה בתוקף החיצוני (להכליל את הממצאים)‪ -‬שנובעת מן האינטראקציה בין המדידה למשתנה הב"ת (בין‬ ‫המדידה למניפולציה) ‪ .‬כל הנבדקים במערך עברו בדיקה מוקדמת‪ ,‬ולכן ייתכן שאי אפשר להכליל את הממצאים על נבדקים שלא עברו בדיקה‬ ‫כזו‪ .‬ברור‪ ,‬שההבדלים בין הקבוצות לא נגרמו רק מהבדיקה המוקדמת‪ ,‬משום שגם קב' הביקורת עברה בדיקה זו‪ .‬אולם‪ ,‬אי אפשר להיות בטוחים‬ ‫שההבדלים נגרמו רק בידי המשתנה הב"ת‪ .‬ייתכן שהמניפולציה יחד עם הבדיקה המוקדמת השפיעו יחד על המשתנה התלוי‪ .‬הבדיקה המוקדמת‬ ‫יכולה להשפיע בכמה דרכים‪:‬‬ ‫היא גרמה לנבדקים להיות מודעים לעמדותיהם‪.‬‬ ‫א‪.‬‬ ‫היא עוררה בנבדקים התגוננות ביחס לעמדותיהם‪.‬‬ ‫ב‪.‬‬ ‫היא הבהירה להם את משמעות הניסוי או את מטרתו‪.‬‬ ‫ג‪.‬‬ ‫כל אלה יכולים להשפיע על המדידה השנייה באופן שאיננו קשור למניפולציה‪.‬‬ ‫מחקרים מצאו שהבדיקה המוקדמת בד"כ מקטינה את אפקט הניסוי‪ ,‬כלומר‪ ,‬עלולה לגרום לחוקר לדחות השערה נכונה‪ .‬הדרך הטובה ביותר‬ ‫לפתור זאת היא לכלול קב' ביקורת שבה לא תיעשה המדידה שלפני‪.‬‬ ‫‪ .2‬מערך ‪ 4‬הקבוצות של סולומון‪:‬‬ ‫‪O1‬‬ ‫קידוד‪ :‬קבוצה א'‪R :‬‬ ‫‪R‬‬ ‫קבוצה ב'‪:‬‬ ‫קבוצה ג'‪R :‬‬ ‫קבוצה ד'‪R:‬‬ ‫‪X‬‬ ‫‪O3‬‬ ‫‪X‬‬ ‫‪( O2‬מניפולציה עם בדיקה לפני)‬ ‫‪( O4‬ביקורת – בלי מניפולציה – עם בדיקה לפני)‬ ‫‪( O5‬מניפולציה ללא בדיקה לפני)‬ ‫‪( O6‬ביקורת – בלי מניפולציה – ללא בדיקה לפני)‬ ‫ניתן לראות שמערך ‪ 4‬הקבוצות כולל את המערך הקודם ב‪ 2-‬השורות הראשונות‪ -‬קב' ניסוי וקב' ביקורת ששתיהן עברו בדיקה לפני ואחרי‪ ,‬אך‬ ‫בנוסף יש עוד קב' ניסוי וקב' ביקורת שלא עברו בדיקה לפני‪ ,‬אלא רק בדיקה אחרי‪.‬‬ ‫מערך זה מאפשר לבדוק את השפעת האינטראקציה בין המדידה למניפולציה‪ ,‬ואם אפשר להכליל את הממצאים על אוכלוסיות שלא עברו מדידה‬ ‫מוקדמת‪( .‬בתרגול התייחסו לזה גם כמערך דו גורמי – שני משתנים ב"ת‪ :‬אחד‪ -‬הטיפול‪ ,‬שני – המדידה הראשונה)‪.‬‬ ‫‪ 4‬מקורות יכולים להשפיע על ציוני נבדקי ‪ 4‬הקבוצות בבדיקה "שאחרי"‪-‬‬ ‫א'‪ -‬ניסוי עם‬ ‫ב'‪ -‬ביקורת עם‬ ‫ג'‪ -‬ניסוי ללא‬ ‫ד'‪ -‬ביקורת ללא‬ ‫בדיקה לפני‬ ‫בדיקה לפני‬ ‫בדיקה לפני‬ ‫בדיקה לפני‬ ‫√‬ ‫√‬ ‫‪ )1‬הבדיקה שלפני‬ ‫√‬ ‫√‬ ‫√‬ ‫√‬ ‫‪ )2‬השפעות הזמן‬ ‫√‬ ‫√‬ ‫‪ )3‬המניפולציה‬ ‫√‬ ‫‪ )4‬האינטראקציה בין המניפולציה למדידה‬ ‫ההבדלים בין קב' א' לקב' ב' במדידה שאחרי (‪ )O2 -O4‬מבטאים ‪ 3‬דברים‪:‬‬ ‫השפעת המניפולציה‪.‬‬ ‫‪.1‬‬ ‫השפעת האינטראקציה בין הבדיקה המוקדמת לבין הטיפול‪.‬‬ ‫‪.2‬‬ ‫השפעת הזמן‪.‬‬ ‫‪.3‬‬ ‫אלו למעשה התוצאות של מערך המחקר הקודם‪.‬‬ ‫ציוני קב' ג' במדידה שאחרי (‪ )O5‬משקפים רק את‪:‬‬ ‫השפעת המניפולציה‪.‬‬ ‫‪.1‬‬ ‫השפעת הזמן (השפעות חיצוניות כמו היסטוריה‪ ,‬בשילה וכו')‪.‬‬ ‫‪.2‬‬ ‫לכן‪ ,‬אם נפחית את ציוני קבוצות ב' ו‪-‬ג' (‪ O4‬ו‪ )O5-‬מציוני קבוצה א' (‪ ,)O2‬נקבל את גודל השפעת האינטראקציה‪.‬‬ ‫ציוני קב' ד' (‪ )O6‬משקפים רק את השפעת הזמן שחלף‪:‬‬ ‫אם נפחית את ציוני קבוצה ד' מציוני קב' ג' (‪ ,)O5 -O6‬נקבל אומדן להשפעת המניפולציה בלבד‪.‬‬ ‫אם ההפרשים ‪ O2 -O5‬ו‪ O4 -O6 -‬שווים לאפס‪ ,‬אפשר לומר שהבדיקה המוקדמת והאינטראקציה בין הבדיקה לטיפול לא משפיעות על‬ ‫התוצאות ולכן ניתן להכליל את ממצאי המחקר‪.‬‬ ‫מערך זה הוא מצוין‪ ,‬אך מסובך ויקר‪ .‬מכיוון שהוא לא מוסיף לתוקף הפנימי‪ ,‬מומלץ להשתמש בו רק במקרים בהם חשוב במיוחד להכליל את‬ ‫הממצאים‪.‬‬ ‫‪ .3‬מערך "אחרי" ‪ +‬קב' ביקורת‪:‬‬ ‫זהו המערך היחיד במערכים האמיתיים שלא נערכות בו מדידות לפני המניפולציה‪ .‬הבטחת השוויון בין הקב' מבוססת רק על רנדומיזציה‪ .‬יש‬ ‫חוקרים שמתקשים לתת אמון בעקרון הרנדומיזציה בלבד‪ ,‬אולם הבדיקה המוקדמת היא לעתים מיותרת כי היא עלולה לגרום לשינויים עוד לפני‬ ‫הפעלת המניפולציה ולעתים לא ניתנת לביצוע‪ .‬לכן במקרים רבים אפשר לוותר עליה‪ .‬למשל‪ ,‬אם רוצים לשמור על אלמוניות הנבדקים‪ ,‬ביצוע‬ ‫בדיקה אחת אחרי הטיפול היא הפתרון‪ ,‬כי בדיקה חוזרת מחייבת ויתור מסוים על אלמוניות‪.‬‬ ‫‪O1‬‬ ‫‪X‬‬ ‫‪R‬‬ ‫קידוד‪:‬‬ ‫‪O2‬‬ ‫‪R‬‬ ‫המערך זהה ל‪ 2-‬הקבוצות האחרונות במערך ‪ 4‬הקבוצות של סלומון‪ .‬לכן‪ ,‬גם מערך זה מטפל בבעיית האינטראקציה‪ ,‬אולם אינו מאפשר למדוד‬ ‫את השפעתה‪.‬‬ ‫תיאוריה של גילוי אותות‪:‬‬ ‫גילוי אותות‪ -‬מצב ניסויי שכיח‪:‬‬ ‫לעיתים קרובות אנו נדרשים לזהות סיגנל‪ /‬אות‪ /‬אירוע במצבים שבהם הזיהוי אינו ברור‪ ,‬כי קשה לנו להבחין בין מצב שבו האות או הסיגנל‬ ‫מופיעים לבין מצב שאינם מופיעים‪.‬‬ ‫רעש‪:‬‬ ‫קושי בזיהוי האות‪ ,‬מצב בסיסי שמפריע לזהות את הסיגנל‪ .‬המצב הרגיל בעולם הוא של "רעש" רנדומלי במערכת‪ .‬כלומר‪ ,‬תמיד יהיה רעש‪ ,‬אך‬ ‫לפעמים יתווסף אליו גם סיגנל‪ .‬לכן שני המצבים הקיימים הם‪:‬‬ ‫המצב בו אין סיגנל = רעש (‪)n‬‬ ‫המצב בו יש סיגנל = רעש ‪ +‬אות (‪)s + n‬‬ ‫הרעש גורם לחוקר או לנבדק לקלוט משהו תמיד‪ .‬השאלה ‪ -‬האם מה שאנו קולטים הוא רק רעש או גם סיגנל?‬ ‫דוגמאות‪:‬‬ ‫‪ ‬גילוי מטוס במסך הרדאר – המסך תמיד מלא ריצודים ונקודות‪ ,‬וכשמופיע משהו לא ברור אם זה מטוס או ציפור‪ ,‬ואם זה מטוס האם אזרחי‬ ‫או צבאי‪ .‬בדומה‪ ,‬קשה לזהות שבר בצילום רנטגן‪ ,‬סוללת טילים בתצלום אויר ועוד‪.‬‬ ‫‪ ‬ניסויים פסיכו‪ -‬פיזיים‪ :‬מצבים של זיהוי קרוב לסף היכולת (זיהוי צליל בתדירויות גבוהות או נמוכות מאד‪ ,‬או זיהוי הבדלים זעירים‬ ‫במיוחד)‪.‬‬ ‫‪ ‬גילוי "סימנים חברתיים"‪ :‬האם אנו מזהים רגש‪ ,‬מסר בין‪-‬אישי רלוונטי ועוד‪.‬‬ ‫‪ ‬איתור מצוינות‪ ,‬למי מגיע פרס הצטיינות‪ ,‬מיהו דוקטורנט מצטיין‪ ,‬מי יהיה רופא טוב‪ ,‬קלינאי טוב‪ ,‬וכו'‪.‬‬ ‫סיגנל ורעש – מודל כללי‪:‬‬ ‫מודל הסיגנל והרעש מהווה מודל כללי של מערכת העצבים‪ :‬הרעש ‪ -‬תאי עצב יורים תמיד‪ ,‬גם ללא גרייה חיצונית‪ .‬תוספת ה"סיגנל" על‬ ‫ה"רעש" ‪ -‬גירוי בעוצמה נמוכה שיגביר את קצב הירי ברמה מסוימת‪ .‬תפיסת הגירוי תתבסס על אבחנה לגבי השינוי היחסי בקצב הירי‪ .‬מערכת‬ ‫העצבים עוסקת תדיר ב"גילוי אותות"‪ ,‬אך מודל הסיגנל והרעש רחב יותר‪ :‬הוא מייצג את רוב המצבים בעולם בהם אנו נדרשים לזהות‪ ,‬לאתר‪,‬‬ ‫להבין‪ ,‬לקלוט‪ ,‬להסיק ולהחליט בנוגע לאינפורמציה שבהירותה אינה מושלמת‪.‬‬ ‫טעויות אבחון‪:‬‬ ‫‪ ‬מקרים בהם נחשוב שאירוע התרחש או שזיהינו אות‪ ,‬על אף שבמציאות הוא לא התרחש והיה רק רעש ‪ -‬טעות מסוג ראשון‪.‬‬ ‫‪ ‬מקרים בהם נחשוב ששום דבר לא קרה‪ ,‬על אף שהתרחש אירוע והיה אות‪ -‬מקביל לטעות מסוג שני‪.‬‬ ‫הטעויות לא משקפות רק את רגישות המערכת הקוגניטיבית או את הרזולוציה שלה‪ ,‬אלא גם שיקולים כלליים של קונטקסט‪ .‬תיאורית גילוי‬ ‫אותות אינה עוסקת רק בתפיסה ישירה של האות‪ ,‬אלא באינטראקציה בין התפיסה הראשונית לבין מערכת של קבלת החלטות לאור‬ ‫ציפיות‪/‬עלויות‪/‬הטיות‪ ,‬ומכאן חשיבותה‪ .‬למשל‪:‬‬ ‫סבירות‪ -‬האם יש סבירות גבוהה או נמוכה לקיום הסיגנל? הציפייה או האי ציפייה שלנו לקיום האות תשפיע על ההחלטה‪ .‬למשל‪ :‬כשאדם מול‬ ‫רדאר צריך לקבוע אם סימן הוא חייזר או מטוס‪ ,‬הוא לא ייטה לקבוע שזה חייזר כי ההסתברות האפריורית לכך נמוכה‪.‬‬ ‫עלות של כל סוג טעות‪ -‬מחיר איתור מוטעה של סיגנל מול המחיר של אי איתור‪ .‬למשל‪ :‬במקרה מטוס הנוסעים הלובי שיורט‪ ,‬העלות האפשרית‬ ‫במידה וזה אויב שיפגע בכור הייתה גבוהה מידי‪.‬‬ ‫דוגמא להמחשה‪:‬‬ ‫‪ 3‬קוביות‪ :‬שתי קוביות רגילות (‪ + )1....6‬קובייה שלישית בה על ‪ 3‬דפנות מופיע המספר ‪ ,0‬ועל ‪ 3‬דפנות מופיע המספר ‪ .3‬מישהו זורק את‬ ‫הקוביות ומחבר את המספרים‪ .‬המטרה‪ :‬להחליט על סמך הסכום שנמסר לנו האם הקובייה השלישית נפלה על ‪ – 3‬זה הסיגנל‪ .‬ז"א‪ ,‬להחליט האם‬ ‫היה סיגנל או לא‪ ,‬כשהאינפורמציה שיש לנו היא רק סכום המספרים‪.‬‬ ‫בטבלה מוצג מספר הצירופים שיכול להוביל לכל סכום תחת שתי האפשרויות‪.‬‬ ‫אם אבחון שיצא ‪ 3‬הוא ה"סיגנל"‪:‬‬ ‫א‪ .‬באזור מסוים של ההתפלגות ברור לנו שאין סיגנל (‪ ,)3‬אלא רק רעש‪.‬‬ ‫ב‪ .‬באזור מסוים של ההתפלגות ברור שיש סיגנל‪.‬‬ ‫ג‪ .‬באזור החפיפה בין ההתפלגויות איננו יכולים לדעת בוודאות איזו משתי ההתפלגויות הוליכה‬ ‫לתוצאה שקיבלנו‪ ,‬כלומר זה מצב שבו יש סיגנל מעורב ברעש‪.‬‬ ‫עם זאת ‪ -‬ניתן לקבוע קריטריון החלטה אופטימאלי‪:‬‬ ‫אם הסכום ‪ 9‬ומעלה נחליט שהיה סיגנל ומספר ‪ 3‬התרחש‪ .‬אם הסכום ‪ 8‬ומטה נחליט שלא היה סיגנל ומספר ‪ 0‬התרחש‪ .‬זוהי מקסימיזציה של‬ ‫ההסתברות לתשובה נכונה‪ ,‬אך טעויות עדיין יכולות להתרחש‪.‬‬ ‫קריטריון אינו בהכרח קבוע‪ :‬הקריטריון האופטימאלי יכול לזוז ימינה או שמאלה בהשפעת גורמים כמו כדאיות‪ ,‬סבירות וכו'‪.‬‬ ‫• נניח שזיהוי נכון של ‪ 3‬מזכה בבונוס=>החלטה ליברלית‬ ‫• נניח שטעות באיתור ‪ 3‬מובילה לקנס=> קונסרבטיביות‬ ‫מאחר ויש תמיד חפיפה כלשהי בין התפלגות הסיגנל והרעש‪ ,‬הצופה קובע קריטריון לתגובה‪ ,‬ולפיו‪:‬‬ ‫• אם הקליטה של הצופה היא מעל לקריטריון – ההחלטה היא שהאירוע אכן התרחש‪.‬‬ ‫• אם קליטת הצופה מתחת לקריטריון – ההחלטה היא שהאירוע לא התרחש‪.‬‬ ‫הנחות‪:‬‬ ‫‪ ‬עצמת ה"רעש" הסובייקטיבית מתפלגת נורמלית‪.‬‬ ‫‪ ‬אם נוסף אות על הרעש הוא יוסיף ערך קבוע להתפלגות (תזוז ימינה) תוחלת‬ ‫‪‬‬ ‫הסיגנל‪+‬רעש תהיה תמיד גבוהה מתוחלת הרעש‪.‬‬ ‫עוצמת האות קובעת את המרחק בין שתי ההתפלגויות‬ ‫ציר ה‪ :X -‬הסקאלה על‪-‬פיה מחליטים האם היה אות או לא‪ .‬בד"כ זוהי‬ ‫סקלה של תחושה פנימית של המחליט‪.‬‬ ‫ציר ה‪ :Y-‬צפיפות‪/‬שכיחות יחסית של ערכי ‪.X‬‬ ‫מהם הסיכויים להחלטה נכונה?‬ ‫הרצוי‪ :‬מקסימום ‪ hits‬ו‪ Correct rejections‬ומינימום ‪ misses‬ו‪.false alarms‬‬ ‫אירוע‬ ‫כן‬ ‫לא‬ ‫‪HIT‬‬ ‫‪FALSE ALARM‬‬ ‫כן‬ ‫החלטה‬ ‫‪MISS CORECT REJECTION‬‬ ‫לא‬ ‫‪ Hit ‬ו‪ miss -‬הם מצבים משלימים‪ ,‬ההסתברות ל"פגיעה" ו"החמצה" כאשר האירוע אכן התרחש שווה ‪.1‬‬ ‫‪ FA ‬ו ‪ CR‬הם מצבים משלימים‪ ,‬ההסתברות ל"אזעקת שווא" ו"דחייה נכונה" כאשר האירוע לא התרחש שווה ‪:1‬‬ ‫הרגישות באיתור סיגנל‪:‬‬ ‫אינדיקציה ליכולת שלנו לאתר את הסיגנל מבוטאת ביחס בין שטח ה‪ hits-‬לשטח ה‪ false alarms-‬בהתפלגות‪ .‬הגדלת ה ‪ hits‬מקטינה אוטומטית‬ ‫את ה ‪ ,misses‬והקטנת ה ‪ false alarms‬מגדילה את ה ‪.correct rejections‬‬ ‫המרחק בין התפלגות הסיגנל והתפלגות הרעש קובע את הרגישות באיתור הסיגנל‪ .‬זהו מדד הרגישות‪:d’ -‬‬ ‫(רעש( ‪( - µ‬רעש‪+‬אות) ‪µ‬‬ ‫(רעש(‬ ‫’‪ d‬הוא "גודל האפקט" של הסיגנל בציוני תקן – הפרש התוחלות של התפלגות הרעש והסיגנל ביחידות של ס"ת של התפלגות הרעש‪.‬‬ ‫הבעיה‪ :‬אין לנו יכולת למדוד באופן ישיר את תוחלות הסיגנל והרעש ואת סטיית התקן של התפלגות הרעש‪ .‬מה שכן אפשר לעשות זה למדוד את‬ ‫פרופורציית ה‪ hits-‬ופרופורציית ה‪ false alarms-‬לכל נבדק‪ ,‬ומהם לחשב את המרחק בין שתי ההתפלגויות שלו‪.‬‬ ‫מודדים באופן אמפירי את פרופורציית ה‪ hits-‬ה‪ false alarm -‬של הנבדק‪ .‬באמצעות )‪ P(false alarm‬נמצא את המרחק בין רעש ‪ µ‬ובין ‪, β‬‬ ‫ובאמצעות )‪ P(hit‬נמצא את המרחק בין רעש‪+‬אות‪ µ‬ובין ‪ .β‬בטבלאות התפלגות נורמלית ניתן למצוא את ציוני התקן של כל שטח ולחשב = '‪d‬‬ ‫)‪.Z(hit rate) - Z(false alarm rate‬‬ ‫לדוג'‪ ,‬בניסוי של רם פרוסט שצריך לזהות מתי יש במילה סיכול אותות ומתי אין (חלק באנגלית חלק בעברית) התקבלו התוצאות‪:‬‬ ‫‪‬‬ ‫‪‬‬ ‫נע מ ‪ 0‬עד אינסוף‪ .‬מצב ‪ d'=0‬יתקבל כשאין שום הבדל בין התפלגות הסיגנל והרעש‪ ,‬אין שום רגישות לסיגנל‪ .‬ככה שיעלה מעל ‪ 0‬זה יעיד‬ ‫על רגישות גבוהה יותר לסיגנל (הסתברות זיהויו עולה על הסתברות החמצתו)‪.‬‬ ‫במצב בו לנבדק יש ‪ hit 100%‬ועל כן ‪ FA 0%‬נהוג לחשב הסתברות של ‪ 0.99‬ושל ‪( 0.01‬בהתאמה) כדי להימנע מערכי אינסוף‪.‬‬ ‫היכן לקבוע את הקריטריון? ‪ a‬היא הנקודה בה היחס בין ה‪ hits-‬ל‪ f.a-‬הוא מקסימאלי‪ ,‬בהינתן‬ ‫רגישות מסוימת של הנבדק‪ ,‬אבל כפי שראינו קודם שיקולים אחרים יכולים לגרום לו להזיז את‬ ‫הקריטריון‪.‬‬ ‫מצבים בהם הקריטריון לא ממוקם בנקודה האופטימאלית = מצבים של הטיית תגובה‪:‬‬ ‫‪ ‬תשלום טוב ל‪  hits-‬הזזת הקריטריון שמאלה ‪ ‬הסתברות גבוהה יותר ל‪ hits-‬ו‪.false alarms-‬‬ ‫‪ ‬קנס כבד ל‪  false alarms-‬הזזת הקריטריון ימינה ‪ ‬הסתברות נמוכה יותר ל‪ hits-‬ו‪false alarms-‬‬ ‫דוג' לכך היא מערכת המשפט בישראל‪ ,‬שרואה בחומרה רבה יותר ‪ FA‬לעומת ‪.miss‬‬ ‫מיקומים שונים של הקריטריון מעבר לנקודה האופטימאלית מעידים על הטיית יתר של הנבדק להחליט האם היה או לא היה אות – הטיה זו כונה‬ ‫‪ .β‬בפסיכולוגיה אנו מעוניינים פעמים רבות למדוד את רגישות הנבדק‪ ,‬ו‪ β -‬מאפשרת לנו למדוד את מיקום הקריטריון של כל נבדק‪ β .‬היא‬ ‫פונקציה מתמטית של יחס תגובות ה"כן" (‪ )hits+FA‬ויחס תגובות ה"לא" (‪ .)miss+CR‬כשאין שום הטיה‪ β -‬שווה לאחד‪ .‬בהינתן שני נבדקים‬ ‫עם אותו מדד רגישות‪ ,‬אצל הנבדק בלי הטיית התגובה מספר תגובות ה'כן' ומספר תגובות ה'לא' יהיה זהה‪ ,‬ואצל הנבדק עם הטיית התגובה מספר‬ ‫תגובות ה'כן' יהיה שונה ממספר תגובות ה'לא'‪.‬‬ ‫אבחנה בין ‪ 2‬השפעות בלתי‪-‬תלויות על התגובה‪:‬‬ ‫‪o‬‬ ‫‪o‬‬ ‫רגישות ’‪ -d‬עד כמה ההתפלגויות שונות זו מזו (כמה קל להבחין בין התרחשות אירוע לאי התרחשות אירוע)‪.‬‬ ‫הטיית תגובה ‪ - β‬האם קריטריון התגובה הוא אופטימאלי או מוטה‪.‬‬ ‫עקומת ‪:Receiver Operating Characteristics -ROC‬‬ ‫העקומה נותנת מידע על שינוי תגובת הצופה ע"י שינוי מטריצת התשלומים (בהינתן רגישות מסוימת)‪ ,‬מתארת את השפעת שינוי הקריטריון על‬ ‫)‪ P(hits‬ועל )‪ .P(FA‬כל עקומה כזו נבנית עבור ’‪ d‬נתון‪.‬‬ ‫כשאין רגישות ‪ -‬עקומת ‪ ROC‬היא האלכסון‪.‬‬ ‫‪ :a ‬תשלום טוב ל ‪ -hits‬יגיד הרבה כן ולכן יהיה לו הרבה ‪ Hit‬והרבה ‪.FA‬‬ ‫‪ :b ‬מצב של רגישות אופטימאלית‪ -‬כמות ה‪ hits-‬גדולה ביחס לכמות ה‪.f.a -‬‬ ‫‪ :C ‬קנס כבד ל ‪ -FA‬יגיד הרבה לא ולכן כמעט לא יהיה לו‬ ‫‪ Hit‬וגם לא ‪.FA‬‬ ‫ככל שהרגישות להבדל בין ‪ 2‬ההתפלגויות גדולה יותר העקומה‬ ‫הולכת יותר מעלה‪ .‬רגישות ‪ 0‬היא בדיוק האלכסון‪ ,‬והיא‬ ‫הפוכה)‪ .‬ז"א‪ ,‬כמות ה ‪ Hits‬גדולה ביחס לכמות ה ‪.FA‬‬ ‫יכולה לגדול עד רגישות =‪( 1‬ר‬ ‫של בדיקות שונות לאבחן במדויק‬ ‫נכון (‪ )true positive‬וזיהוי מוטעה‬ ‫עקומות ‪ ROC‬נמצאות בשימוש רחב ברפואה לתיאור יכולות‬ ‫מחלה‪ ,‬פגמים גנטיים‪ ,‬וכו'‪ .‬לכל בדיקה יש הסתברות של זיהוי‬ ‫(‪.)false positive‬‬ ‫לדוג'‪ :‬התפלגות ערכי הורמון ‪ T4‬אצל אנשים בריאים וחולים עם חוסר תפקוד של בלוטת התריס‪ .‬הקריטריון ערך של‬ ‫‪ 5.5‬הוא המקובל לאבחון של אדם כ"חולה"‪ .‬כחול – התפלגות האנשים הבריאים‪ ,‬ורוד – התפלגות האנשים החולים‪.‬‬ ‫קופת החולים מעדיפה ‪ FA‬מאשר ‪.miss‬‬ ‫דוגמא ממבחן‪:‬‬ ‫תיאור מקרה‪ :‬בעת תכנון ההשתלטות על הספינה "מרמרה" התלבט אגף המבצעים במטכ"ל האם נוסעי הספינה הם‬ ‫"פעילי שלום" פסיביים כמקובל במשטים כגון אלה‪ ,‬או לחילופין כי מדובר דווקא באקטיביסטים איסלמיים שפניהם‬ ‫לעימות‪ .‬בעת התכנון נבחנו ההשתמעויות האפשריות של הפעולה לאור שתי האופציות הללו‪ .‬בסופו של דבר תוכננה‬ ‫הפעולה לאור ההנחה כי מדובר ב"פעילי שלום" פסיביים‪ ,‬מה שהסתבר כטעות‪.‬‬ ‫שאלה‪ :‬הצג את השתלשלות האירועים הללו במונחים של תיאוריית גילוי אותות‪ .‬השתמש בתיאורך במונחים של התפלגות סיגנל ורעש‪ ,‬התייחס‬ ‫לסוג הטעות שהתרחשה‪ ,‬הסבר כיצד טעות זו יכלה להתרחש במונחי הזזת קריטריון‪.‬‬ ‫תשובה‪ :‬רעש=ספינת פעילי שלום‪ ,‬רעש‪+‬סיגנל=ספינת אקטיביסטים איסלמיים‪ =False alarm .‬התייחסות לפעילי שלום כאל אקטיביסטים‬ ‫איסלמיים‪ =Miss .‬זיהוי אקטיביסטים איסלמיים כפעילי שלום‪ .‬אגף המבצעים פחד מ‪( false alarm-‬קנס גבוה) ולכן נוצרה הטיית תגובה‪ ,‬בה‬ ‫הקריטריון זז ימינה על ציר ה‪ .X-‬למעשה מה שקרה להם זה ‪.miss‬‬ ‫הטיות ואיומיהן‬ ‫הטיות במהלך הניסוי נגרמות מכיוון שבמקרים רבים המחקר מבוסס על נבדקים כבני אדם‪ ,‬ותמיד המחקר מבוצע ע"י חוקרים שהם בני אדם‪.‬‬ ‫הנבדק או החוקר הם בני אדם לא ניטרליים ויש להם השפעה אקטיבית על מהלך הניסוי ותוצאותיו‪.‬‬ ‫שני סוגי הטיות‪:‬‬ ‫הטיות נסיין (‪ :)Invested Interest‬מעבר לעובדה שיש לחוקר אינטרס ברור להצליח במחקרו‪ ,‬הדיון בהטיות נסיין לא עוסק בהטיות מכוונות‬ ‫ומודעות‪ ,‬אלא בהטיות לא מכוונות – עד כמה הנסיין שיש לו ציפיות‪ ,‬הנחות והשערות יכול להשפיע על תוצאות המחקר גם כשאין לו כוונה‬ ‫לעשות כן‪ ,‬וכיצד ניתן למנוע זאת‪.‬‬ ‫הטיית הנבדק‪ :‬כפי שהנסיין אינו מכונה‪ ,‬גם הנבדק בעל ציפיות ואמונות בנוגע לניסוי‪.‬‬ ‫הטיות נסיין‪:‬‬ ‫הנס החכם‪ :‬המקרה הראשון המפורסם בו תועדה הטיית נסיין‪ .‬סוס מפורסם מגרמניה שהיה יכול לבצע פעולות חשבון מורכבות‪ .‬בעליו היה מציג‬ ‫לו בעיות חישוב‪ ,‬והסוס היה רוקע ברגליו בהתאם לתשובה‪ .‬לאחר מחקר ממושך נמצא כי הנס היה מגיב לתנועות הראש והעיניים הבלתי מודעות‬ ‫של בעליו (וון אוסטן)‪.‬‬ ‫הניסויים של ‪:Rosenthal‬‬ ‫(‪ )1‬שתי קבוצות של נסיינים הציגו תצלומים לנבדקים וביקשו מהם הערכות לגבי הצלחה צפויה של האנשים המופיעים בתצלומים‪.‬‬ ‫‪ ‬המניפולציה הניסויית‪ :‬המשתנה הב"ת‪ -‬עיצוב ציפיות הנסיינים בנוגע להערכות הנבדקים‪ .‬קבוצה א'‪ -‬נאמר לנסיינים כי הנבדקים‪ ,‬לאור‬ ‫מבחן אישיות‪ ,‬נוטים לתת הערכות נמוכות לגבי אחרים‪ .‬קבוצה ב'‪ -‬נוטים לתת הערכות גבוהות לאחרים‪.‬‬ ‫‪ ‬תוצאות‪ :‬ציפיות הנסיין הגשימו את עצמן‪ .‬הנסיינים שציפו לקבל הערכות נמוכות אכן קיבלו כאלו ולהפך‪ .‬כלומר‪ ,‬אמונת הנסיין קבעה את‬ ‫תוצאות הניסוי‪ .‬בדומה להנס החכם‪ ,‬הנסיין "העביר" לנבדק את ציפיותיו (חיוך‪ ,‬גבות‪ ,‬מצח וכו')‪.‬‬ ‫(‪ )2‬נתנו לנסיינים להאמין כי חולדות הניסוי שלהם לומדות מהר או לאט לאור סלקציה גנטית‪ .‬חולדות של נסיינים שחשבו שהחולדות שלהם‬ ‫מהירות למידה אכן למדו מהר יותר מחולדות שהנסיינים שלהן האמינו שהן איטיות‪.‬‬ ‫הפתרון – בקרה ניסויית‪:‬‬ ‫מאחר והטיות נסיין אינן מודעות‪ ,‬יש למנוע אותן באמצעות ניתוק הנסיין מן היכולת להשפיע על הנבדק‪:‬‬ ‫‪ .1‬מכניזציה ואוטומטיזציה של אופן הבדיקה‪ :‬הכנת הוראות כתובות‪ ,‬אימון במתן הוראות‪ ,‬מכניזציה של רישום ותוצאות‪.‬‬ ‫‪ .2‬הפרדה בין הנסיין והנבדק‪ :‬הפרדה מבחינת יכולת הנסיין לראות את תגובת הנבדק‪.‬‬ ‫‪ .3‬מכניזציה של הטיפול בחיות מעבדה‪ :‬מתן מזון‪ ,‬חיזוק ורישום תגובות באמצעות מיכון ולא באמצעות נסיין אנושי‪.‬‬ ‫‪ .4‬פרוצדורת ‪ :Double Blind‬כשישנם תנאי ניסוי שונים‪ ,‬הנסיין (כמו הנבדק) לא יודע לאיזו קבוצה כל נבדק משתייך‪ .‬פרוצדורה זו‬ ‫סטנדרטית בכל ניסוי רפואי כיום‪ ,‬ומונעת הטיות סיסטמתיות‪.‬‬ ‫‪ ‬דוגמא‪ -‬פרשת הדילול האינסופי‪ :‬ב‪ 1988-‬מחקר בפריז הראה תוצאות מדהימות של אפקטיביות תרופות הומאופטיות‪ :‬לאחר שהחומר‬ ‫האקטיבי בתמיסה דולל עד אינסוף (עד רמה של פחות ממולקולה בודדת) היא עדיין הייתה אפקטיבית‪ .‬טענתם הייתה שהתמיסה "זוכרת"‬ ‫את החומר הפעיל‪ ,‬כפי שטוענת התיאוריה ההומיאופטית‪ .‬תנאי לפרסום המחקר היה שהעיתון יקים וועדת חקירה לבדיקת המחקר‪ ,‬בראשות‬ ‫עורך העיתון‪ ,‬שני מדענים בכירים והקוסם המפורסם ג'יימס רנדי‪ .‬לא נמצאה עדות לשום הונאה (הניסוי נשען על ספירות מדויקות‪ ,‬הערכת‬ ‫טעות דגימה וכו')‪ .‬עם זאת‪ ,‬בכל פעם שהקוסם רנדי סידר את המבחנות בפרוצדורת דבל‪-‬בליינד האפקט נעלם‪ .‬בין השאר נמצא כי החוקרת‬ ‫הראשית קשורה בחוזי מחקר עם חברת תרופות הומיאופתיות‪.‬‬ ‫‪( When prophecy fails‬כשהנבואה לא מתגשמת)‪ /‬ליאון פסטינגר‪:‬‬ ‫הגורו קיצ' סיפרה למאמיניה שקיבלה מסר מכוכב קלריון לפיו בחצות ב ‪ 2‬בדצמבר יתרחש מבול שיוביל לקץ העולם‪ .‬אנשים עזבו את ביתם‪,‬‬ ‫מכרו את רכושם‪ ,‬נפרדו מבני זוג שסירבו להצטרף וכו'‪ .‬קב' המחקר של פסטינגר הסתננה לקבוצת המאמינים שתיעדו מה התרחש לאחר חצות‪,‬‬ ‫כשהמבול לא התרחש‪ ...‬בתחילה העלו השערות שהשעות בקלריון שונות‪ ,‬ולקראת לפנות בוקר קיצ' הודיעה שקיבלה מסר כי בזכות מאמיניה‬ ‫החליטו להסיר את הגזירה‪ .‬בסופו של אותו ערב‪ ,‬המאמינים נעשו אדוקים עוד יותר‪.‬‬ ‫על כך ביסס פסטינגר את המושג דיסוננס קוגניטיבי‪:‬‬ ‫‪ ‬אמונה עמוקה מאד בתיאוריה‪.‬‬ ‫‪ ‬נקיטת צעדים משמעותיים הנגזרים מהתיאוריה (המאמינים וויתרו על רכושם ומשפחתם)‪.‬‬ ‫‪ ‬כעומק הצעד‪ ,‬כך תגבר עוצמת הדיסוננס שיתרחש‪.‬‬ ‫‪ ‬סביבה חברתית תומכת‪.‬‬ ‫‪ ‬דיסוננס קוגניטיבי עמיד בפני הוכחות מפריכות‪ .‬המדען מזוהה עם התיאוריה שלו ויתקשה לקבל את הפרכתה‪ ,‬ולכן הדיסוננס הקוגניטיבי‬ ‫לגביה יגבר‪ .‬זה דומה למה שראינו בסרט על אוטיזם ‪ >-‬אנשי מדע שהעמיקו את אמונתם אחרי הכישלון‪.‬‬ ‫מהספר‬ ‫סכנת ההטיה של תוצאות המחקר בידי החוקר מאיימת על ‪ 2‬משלבי המחקר‪ )1( :‬בעת איסוף הנתונים למחקר ‪ -‬החוקר עלול להטות ישירות‬ ‫את תגובות הנחקרים‪ )2( .‬בעת רישום הנתונים וסיכומם ‪ -‬החוקר משפיע על ייצוגן של תגובות הנבדקים במחקר‪.‬‬ ‫החוקר כצופה וכמפרש‪:‬‬ ‫החוקר כצופה‪ :‬הטעויות ברישום ותיאור התופעות לעתים קרובות אינן מקריות ומושפעות מהשערות החוקר על הנתונים‪ .‬נהוג להבחין בין‪# :‬‬ ‫טעות‪ :‬התצפיות מתפלגות באקראי סביב הערך האמיתי‪ # .‬הטיה‪ :‬התצפיות גבוהות‪/‬נמוכות בעקביות מהערך האמיתי‪ ,‬או שהן נמצאות במתאם עם‬ ‫מאפייני הצופה‪ ,‬המצב או שניהם‪.‬‬ ‫שיטות לגילוי טעויות והטיות‪ :‬רפליקציה (חזרה)‪ -‬רישום התוצאות ע"י כמה צופים; שימוש בעזרים מכניים (רשמקול‪ ,‬וידאו וכו')‪.‬‬ ‫החוקר כמפרש‪ :‬עלול לשגות במתן המשמעות לתופעות בהן צפה‪ .‬פירוש התופעות הוא משימה מורכבת וסובייקטיבית יותר מתיאורן‪ ,‬ולכן קורה‬ ‫שחוקרים שונים מפרשים אחרת את אותן התצפיות‪ .‬גם בפירוש התופעות יש טעויות והטיות‪ # :‬בהטית פירוש ‪ -‬ניתן לחזות את כיוון הטעות של‬ ‫החוקר; ‪ #‬בטעות פירוש ‪ -‬כיוון הטעות לא ניתן לחיזוי‪.‬‬ ‫פירוש מוטה חמור פחות מתצפית מוטה משום שהפירוש הוא "ידוע בציבור" ואילו התצפית היא נסתרת‪.‬‬ ‫החוקר כאדם‪:‬‬ ‫תכונות ביולוגיות וחברתיות‪:‬‬ ‫מין‪ ,‬גיל‪ ,‬גזע החוקר וכו' עשויים להשפיע על תוצאות המחקר‪ .‬נמצא למשל‪( :‬א) נסיינים חברותיים יותר כלפי הנבדקים מנסייניות‪( .‬ב) איסוף‬ ‫הנתונים מצריך זמן רב יותר כאשר החוקר והנבדק הם בני מינים מנוגדים‪( .‬ג) השפעת הגזע‪ -‬שחורים רואיינו ע"י לבנים ושחורים לגבי אפליה‬ ‫גזעית‪ .‬כשהחוקר היה לבן‪ ,‬רק ‪ 11%‬טענו שיש אפליה‪ .‬כשהחוקר היה שחור‪ 35% -‬טענו לאפליה‪.‬‬ ‫תכונות פסיכולוגיות‪:‬‬ ‫חוקרים הנבדלים בתכונות אישיות וחברתיות כמו חרדה‪ ,‬צורך באישור וסמכותיות‪ ,‬נוטים לקבל מנבדקיהם תגובות שונות‪ .‬המסקנה הכללית‪:‬‬ ‫כשחוזרים על מחקר באמצעות איסוף נתונים דומים בידי חוקר אחר‪ ,‬סיכויי ההצלחה של החזרה תלויים במידת הדמיון שבין שני החוקרים‬ ‫בתכונות הפסיכולוגיות והחברתיות‪.‬‬ ‫השפעות המצב‪:‬‬ ‫התנהגות החוקר במחקר תלויה גם בגורמי מצב‪ .‬רוזנטל מנה את גורמי המצב הבאים‪:‬‬ ‫א‪ .‬היכרות קודמת בין החוקר לנחקר‪ :‬כשמוטלת על הנבדק משימה קשה ההיכרות משפרת את הביצוע; כשהמשימה פשוטה‪ -‬ההיכרות עלולה‬ ‫לגרוע מהביצוע‪.‬‬ ‫ב‪ .‬ניסיון קודם של החוקר‪ :‬למשל‪ ,‬לאחר ניסיון ממושך החוקר רגוע אך גם משועמם יותר‪.‬‬ ‫ג‪ .‬התנהגות הנבדק‪ :‬התנהגות הנבדק והחוקר משפיעות הדדית זו על זו‪ .‬נבדק←חוקר←נבדק‪ .‬ההשפעה החוזרת על הנבדק יכולה להיות‬ ‫ישירה‪ -‬כאשר הנבדק מודע לתגובה שביצע‪ ,‬ומודעות זו משפיעה על תגובותיו הבאות‪ ,‬או עקיפה‪ -‬כאשר תגובת הנבדק משפיעה על‬ ‫החוקר‪ ,‬והתנהגות החוקר שהשתנתה משפיעה על הנבדק‪.‬‬ ‫ד‪ .‬אפיוני סביבת המחקר‪ :‬עלולה להשפיע על הנבדק בשתי דרכים‪ :‬שינוי ישיר של תגובת הנבדק עקב הסביבה השונה; שינוי עקיף של‬ ‫תגובות הנבדק בהשפעת ההתנהגות המשתנה של החוקר בסביבה השונה‪.‬‬ ‫ה‪ .‬החוקר הבכיר‪ :‬מחקרים רבים נערכים בקבוצות בהן חוקרים זוטרים אוספים נתונים עבור חוקר בכיר‪ .‬תגובת הנבדק לאוסף הנתונים תלויה‬ ‫בתכונות החוקר הבכיר ובפעולת הגומלין שבינו לבין החוקר הזוטר‪.‬‬ ‫שינויים בהתנהגות עלולים להשפיע על תוצאות המחקר‪:‬‬ ‫בסקרים‪ -‬תכונות החוקר עלולות להשפיע על התוצאות‪ ,‬משום שהם מתמקדים בפרמטרים באוכלוסיה ומסתמכים על מדגם ועל סטנדרטיזציה של‬ ‫המבחנים‪.‬‬ ‫בניסוי‪ -‬השפעת תכונות החוקר פחותה‪ ,‬משום שהמסקנות מבוססות על השוואת ממוצעים‪ .‬תכונות החוקר ומצב הניסוי משפיעים על הממוצעים‪-‬‬ ‫אך לא בהכרח על ההבדלים בין הממוצעים‪ .‬אם אותו נסיין מעביר ניסוי ל‪ 2-‬קבוצות‪ ,‬השפעתו עליהן תהיה דומה‪ ,‬ולכן ההבדל בין הממוצעים‬ ‫יושפע רק מהמשתנה הב"ת‪.‬‬ ‫ציפיות החוקר‪:‬‬ ‫נבואה שמגשימה את עצמה במחקר‪ :‬הטיה שמקורה בציפיות חמורה מכמה סיבות‪-‬‬ ‫‪ ‬אי‪-‬אפשר לצפות בהשפעת ציפיות החוקר על תגובות הנבדקים‪.‬‬ ‫‪ ‬החוקר עצמו אינו יודע בד"כ אם השפעות סמויות שכאלו פעלו על נבדקיו‪.‬‬ ‫‪ ‬תכונות אחרות של החוקר (ביולוג יות‪/‬פסיכולוגיות) משפיעות באופן דומה על כל הקבוצות‪ ,‬ולכן לא משנות את הפרש הממוצעים‪ ,‬אך‬ ‫ציפיות החוקר תלויות בהשערות לגבי הבדלים בין הקבוצות‪ ,‬ולכן ישפיעו אחרת על נבדקי הקבוצות השונות‪.‬‬ ‫נמצא שלפחות חלק מהמנגנונים להעברת הציפיות הינם לא‪-‬מילוליים‪ ,‬כגון טון הדיבור והטיית הראש‪.‬‬ ‫הטיות נבדק‪:‬‬ ‫כבר בניסויים שנערכו בשנות העשרים בנוגע להשפעת תנאי עבודה על כושר ייצור של עובדים נמצא כי עובדים שהשתתפו במחקר ייצרו יותר‬ ‫בממוצע מאשר אלה שלא השתתפו בו‪ ,‬ללא קשר לתנאי העבודה‪ .‬כלומר‪ ,‬עצם קבלת תפקיד הנבדק שפרה את הביצוע‪.‬‬ ‫‪ -)1962( ORNE‬תפקיד הנבדק‪:‬‬ ‫הנחת היסוד היא כי נבדק שמשתתף בניסוי לוקח על עצמו תפקיד של "נבדק טוב"‪ .‬כלומר‪ ,‬הוא מבקש "להצליח" בניסוי‪ .‬הוא מנסה לעמוד על‬ ‫השערות הניסוי ולאושש אותן‪ .‬הנבדק אינו פאסיבי‪ ,‬אלא משתתף אקטיבי ושותף סמוי לנסיין‪ .‬הוא מנסה לנחש את מטרת הניסוי כדי להצליח‪,‬‬ ‫במודע או שלא במודע‪.‬‬ ‫הנבדק הממושמע‪:‬‬ ‫‪.i‬‬ ‫המניע העיקרי שמייחסים לנבדקים בפסיכולוגיה הוא המניע לציית לדרישות הנסיין ולציפיותיו‪ .‬אנשים מוכנים לבלות שעות במשימות חסרות‬ ‫תכלית בניסוי‪ .‬לכן‪ ,‬כל הגירויים הרומזים לנבדק על השערות המחקר משפיעים על התנהגותו‪.‬‬ ‫הגירויים הללו מכונים מאפייני דרישות הניסוי ‪ -Demand Characteristics‬לכל ניסוי אפיונים שמאפשרים לנבדק לעמוד על מטרותיו‪.‬‬ ‫אפיוני הניסוי מעצבים את התנהגות הנבדק והופכים אותו למשתתף פעיל באישוש התיאוריה‪ .‬ציפיות הנבדק בנוגע למאפייני הניסוי וביצועיו בו‬ ‫משפיעים על ביצועיו האמיתיים ומטים אותם‪ .‬מערך הניסוי למשל עשוי לרמוז לנבדקים גם כן‪ -‬אם מעבירים את אותו שאלון פעמיים‪ ,‬חלק‬ ‫מהנבדקים ישערו שמצפים שיחול שינוי בתגובותיהם‪ ,‬וחלק אחר ישערו שהמחקר בודק את עקיבותם לאורך זמן‪.‬‬ ‫הנבדק קולט את מאפייני הניסוי גם ללא מודעות אליהם‪ ,‬למשל – כשהיחס תגובות כן‪/‬לא בניסוי אינו ‪ ,50%‬זמני התגובה לנכון‪/‬לא נכון ישתנו‬ ‫כפונקציה של היחס בניסוי‪ ,‬מבלי שהנבדק בהכרח יוכל לדווח על כך‪ .‬כלומר‪ ,‬הניסוי מאופיין בהתפלגות סמויה של שכיחות תנאי הניסוי‪.‬‬ ‫קשה לבטל את מאפייני מצב הניסוי‪ .‬אך ניתן לחקור מתי יש לדרישות המצב משקל המעמיד בספק את תוצאות המחקר‪ .‬אפשר גם לפקח על חלק‬ ‫מהגורמים‪ ,‬אך פיקוח כזה אפשרי רק לגבי גורמים שהנסיין מכיר בהם מראש‪.‬‬ ‫הנבדק המשתדל להרשים‪:‬‬ ‫‪.ii‬‬ ‫החשש מההערכה‪ :‬הנבדק מתייחס לניסוי כאל מבחן בו החוקר מעריך את תכונותיו‪ ,‬מצבו הנפשי‪ ,‬הסתגלותו‪ ,‬האינטליגנציה שלו ועמדותיו‪ .‬לכן‬ ‫הוא שואף לזכות בהערכת החוקר ע"י תשובות שנראות לו נכונות‪ ,‬ו יחפש רמזים בהוראות ובתגובות החוקר‪ .‬מניע זה עלול לגרום להטיה‬ ‫שיטתית‪.‬‬ ‫ניסוי (רוזנברג)‪ :‬החשש מהערכה הופחת בקבוצה אחת‪ ,‬ובקבוצה השנייה הוגבר כשנאמר להם שתגובותיהם ילמדו על בריאות נפשם‪ .‬משתנה‬ ‫ב"ת נוסף‪ ,‬בעל ‪ 3‬ערכים‪ ,‬רמז לנבדקים מהי ההתנהגות המקובלת במצב הניסוי (מה אחרים נוהגים לעשות במצבם)‪.‬‬ ‫תוצאות‪ :‬בשתי הקבוצות המידע על תגובת הרוב המקובלת השפיע על התנהגותם‪ ,‬אך מידע זה השפיע יותר על קב' החשש הגבוה‪ .‬מסקנה‪:‬‬ ‫החשש מהערכה הוא ארטיפקט‪.‬‬ ‫בנוסף‪ ,‬שני המניעים (ממושמע ומשתדל להרשים) עשויים להשתלב‪:‬‬ ‫בניסוי עוררו בחלק מהנבדקים שני מניעים מנוגדים‪ :‬הם נתבקשו להעתיק מספרי טלפון‪ .‬בהפסקה שעשו באמצע‪ ,‬חילקו אותם ל‪ 4-‬קבוצות‪ ,‬ולכל‬ ‫קב' נמסר משוב שונה לגבי קצב ההעתקה‪ -1 :‬ביקורת (ללא משוב); ‪ -2‬משוב שלילי (איטיים); ‪ -3‬משוב חיובי (מהירים); ‪ -4‬משוב חיובי ‪+‬‬ ‫כפייתי (מהירים וזה מעיד על כפייתיות)‪.‬‬ ‫תוצאות‪ :‬קב' ‪ 2‬הגבירה את הקצב‪ .‬בכך התבטאו ‪ 2‬המניעים‪ -‬הם התאימו את עצמם לציפיות הנסיין (הנבדק הממושמע)‪ ,‬והעלו את דימויים‬ ‫(הרצון להרשים)‪ .‬קב' ‪ 4‬האטה את הקצב‪ .‬בכך התבטאו ‪ 2‬המניעים‪ -‬הם התאימו עצמם לציפיות‪ ,‬ונמנעו מדימוי של כפייתיות‪ .‬בקב' ‪ 3‬המניעים‬ ‫סתרו‪ -‬ציפיות הנסיין (להאט) היו מנוגדות לצורך הנבדק להרשים (למהר)‪ .‬במקרה זה גבר הצורך להרשים‪ ,‬והנבדקים הגבירו את קצבם‪.‬‬ ‫הנבדק הממושמע מעוניין לתרום למדע ולעשות מה שלדעתו נדרש ממנו‪ .‬הנבדק המרשים רוצה לזכות בהערכת החוקר ולהעלות את דימויו‬ ‫העצמי‪ .‬המניעים הסותרים הללו עלולים להשפיע על המחקר‪.‬‬ ‫הנבדק המתנדב‪:‬‬ ‫‪.iii‬‬ ‫יש הבדלים משמעותיים בין נבדקים מתנדבים לכאלה שאינם מתנדבים‪ .‬זה עלול לפגוע בתוקף החיצוני ‪ -‬יכולת הכללת תוצאות המחקר שנעשה‬ ‫במתנדבים לכלל האוכלוסייה; ובתוקפו הפנימי ‪ -‬ההסבר הסיבתי שניתן לתוצאות ניסוי שנערך במתנדבים בלבד‪.‬‬ ‫תוקף חיצוני‪:‬‬ ‫אפיוני מתנדבים לפי שלוש קבוצות‪-‬‬ ‫‪ .1‬קביעות בעלות בסיס אמפירי מוצק‪ :‬המתנדבים סיימו יותר שנות לימוד; הם בעלי מעמד מקצועי גבוה יותר; הם מקבלים ציונים גבוהים‬ ‫במבחני אינטליגנציה; הם פחות סמכותיים‪.‬‬ ‫‪ .2‬קביעות בעלות ביסוס אמפירי חלקי‪ :‬המתנדבים חברותיים יותר; יוצאי דופן יחסית ללא‪-‬מתנדבים; צעירים יותר‪.‬‬ ‫‪ .3‬קביעות שאינן מבוססות דיין‪ :‬גברים מתנדבים הם פחות קונפורמיים; יש יותר יהודים מתנדבים; יש יותר כפריים מתנדבים במשימות רגילות‬ ‫ויותר עירוניים במשימות שאינן רגילות‪.‬‬ ‫שימוש במתנדבים עלול לפגוע בתוקף החיצוני בעיקר בסקרים‪ ,‬שנועדו לאמוד פרמטרים (ממוצע‪ ,‬שונות וכו')‪ .‬היכולת להכליל מהאומדן במדגם‬ ‫לפרמטר באוכלוסיה מוטלת בספק‪.‬‬ ‫תוקף פנימי‪:‬‬ ‫האם תכונה מסוימת של המתנדבים היא המסבירה את הקשר שנמצא בין שני המשתנים‪ ,‬ולא המשתנה הב"ת‪ .‬הסבר חלופי זה מתחזק כשנמצא‬ ‫קשר בין המשתנה הב"ת לתלוי בניסוי מתנדבים‪ ,‬אך קשר זה נעלם כשהניסוי נערך על לא‪-‬מתנדבים‪.‬‬ ‫דוגמאות‪:‬‬ ‫‪ .1‬ישנם ממצאים סותרים לגבי הקשר בין שינוי עמדה לבין מידת האיום במסר שנועד לשנותה ("אם לא תשנה את עמדתך‪ ,‬יישרפו ילדיך בלבה‬ ‫רותחת!")‪ .‬במרבית הניסויים שגילו יחס ישר בין מידת החרדה לשינוי העמדה היו נבדקים מתנדבים‪ .‬בניסויים שמצאו יחס הפוך בין שני‬ ‫המשתנים הללו – היו נבדקים שאינם מתנדבים‪.‬‬ ‫‪ -”Zeigarnik effect" .2‬נבדקים התבקשו לבצע משימות בדרגות קושי שונות ולזכור אותן‪ .‬נמצא שמתנדבים זוכרים יותר את המשימות בהן‬ ‫נכשלו‪ ,‬ולא‪-‬מתנדבים זוכרים יותר את המשימות בהן הצליחו‪.‬‬ ‫דרכים להתגבר על הטיות הנבדק‪:‬‬ ‫חוקר טוב מנסה לברר את השאלות הבאות עוד בשלב תכנון המחקר‪( :‬א) אילו ממניעי הנבדק שמנינו רלוונטיים במחקר המתוכנן?‬ ‫(ב) איזו התנהגות יכול הנבדק לאמץ כדי לספק מניעים אלו וכיצד היא עלולה להטות את תוצאות המחקר? (ג) מה אפשר לעשות במערך המחקר‪,‬‬ ‫במשתנים הנבדקים ובהוראות הניתנות לנבדקים כדי למנוע התנהגות כזו?‬ ‫דרכי התמודדות‪:‬‬ ‫‪ .1‬הצגת השערה כוזבת לנבדק‪:‬‬ ‫מציגים לנבדקים השערה כוזבת באשר למטרת הניסוי‪ .‬גם אם הנבדק ינסה להתנהג בהתאם להשערה שהוצגה‪ ,‬לא תהיה לכך השפעה על הניסוי‪.‬‬ ‫כדי לבחון אילו השערות היו לנבדק במהלך הניסוי‪ ,‬אפשר לשאול זאת בתום המחקר‪ .‬בעייתיות – אתיקה‪ :‬השגת מידע מהנבדק שהוא לא התכוון‬ ‫למסור‪ ,‬פגיעה באמון הנבדק בחוקר‪.‬‬ ‫‪ .2‬הרחקת המשתנה התלוי ממערך הניסוי‪:‬‬ ‫משכנעים את הנבדקים שהם משתתפים ב‪ 2-‬ניסויים בלתי תלויים‪ ,‬כאשר למעשה בניסוי אחד בו נמדד המשתנה הב"ת‪ ,‬ובשני‪ -‬התלוי‪ .‬כך נמדד‬ ‫המשתנה התלוי ללא קשר לניסוי בו נעשתה המניפולציה‪ .‬יתרונות‪:‬‬ ‫א‪ .‬הקטנת הסיכוי שהנבדקים יקשרו בין שני המשתנים‪ ,‬וכך הקטנת הסיכוי שהשערותיהם ישפיעו על תגובותיהם‪.‬‬ ‫ב‪ .‬הקטנת השפעת רצון הנבדק להרשים את הנסיין‪ ,‬משום שהתגובות למשתנה התלוי ניתנות לחוקר אחר שלא נתפס כמעורב‪.‬‬ ‫‪ .3‬גיוס הנבדק כעוזר‪:‬‬ ‫משכנעים את הנבדק שאין הוא נבדק אלא נבחר כעוזר לנסיין‪ .‬דוגמא‪ :‬ניסוי בו הנבדקת בטוחה שהיא עוזרת לחוקר‪ .‬כחלק מהניסוי‪" ,‬נבדקת"‬ ‫שהיא משת" פית נותנת לה פידבקים‪ .‬נמצא שהנחקרות (שחשבו שהן עוזרות) חיבבו יותר את המשת"פית שפתחה בהערכות שליליות וסיימה‬ ‫בחיוביות מאשר את המשת"פית שהתמידה בהערכות חיוביות‪.‬‬ ‫‪ .4‬ניסוי מוסווה‪:‬‬ ‫מניעת הידיעה של הנבדק כי הוא שותף למחקר‪ .‬קל יותר להסוות ניסוי בתנאי שדה‪ ,‬אך אין בכך הבטחה שההסוואה תצליח‪ .‬במחקר שיערו‬ ‫שתפוקה תלויה בתנאי סביבה‪ .‬המחקר נעשה במפעל‪ ,‬אך הפועלים הגבירו את התפוקה ללא קשר לתנאי הסביבה‪ .‬הסיבה‪ -‬הם ידעו כי הם‬ ‫נבדקים במחקר‪ ,‬ותחושת ה"נבחרות" העלתה את רגשות האחווה ביניהם‪ ,‬וגרמה להם להגביר את תפוקתם‪.‬‬ ‫‪ .5‬השערות שאינן מובנות מאליהן‪:‬‬ ‫כך הנבדק יתקשה לזהותן ולא יתנהג לפיהן‪ .‬כדי לבחון אם השערתו עומדת בדרישה זו‪ ,‬על החוקר לשתף קבוצת ביקורת שבה יתבקשו הנבדקים‬ ‫לנחש מהי השערת החוקר ומהו כיוון התוצאות הצפוי‪ .‬הבעייתיות‪ :‬השערות שאינן אינטואטיביות לא נתפסות בהכרח כבעלות ערך רב יותר‬ ‫מהשערות הנתפסות כמובנות מאליהן; אנשים נבדלים במידה בה השערה מסוימת נתפסת בעיניהם כמובנת מאליה‪.‬‬ ‫‪ .6‬פנייה למצפון הנבדק‪:‬‬ ‫לאמץ גישה כנה ולפנות אל מצפונו של הנבדק‪ .‬פשוט לשכנע נבדקים שהדרך הטובה ביותר לשתף פעולה היא לתת תגובות כנות לחלוטין‪.‬‬ ‫הצלחת שיטה זו תלויה באיכות המשתנים המעורבים במחקר‪ ,‬וגם באופי החוקר ויכולתו להעביר את המסר באופן משכנע‪.‬‬ ‫‪ .7‬שימוש במדדים לא‪-‬תגובתיים‪:‬‬ ‫שיטות חקירה שבכולן המדדים אינם "מזוהמים" בגלל מודעות החוקר או הנחקר‪ ,‬מאחר שבמחקר המבוסס על מדדים כאלו אין שום קשר חברתי‬ ‫בין החוקר לנחקר‪ .‬השיטות מתגברות על הטיות חוקר ונחקר יחד‪.‬‬ ‫‪ .8‬איזון מוחלט של תנאי הניסוי‪ :‬של הסתברות להופעת תנאי הניסוי השונים על מנת של ייקלטו על ידי הנבדק וייעצבו את תגובותיו (הנבדק‬ ‫קולט את אפיוני הניסוי גם ללא מודעות אליהם לעיתים כאשר הם מופיעים בשכיחות שונה)‪.‬‬ ‫דברים שיש בספר ולא מופיעים בסיכום‪* :‬אני מצאתי שהם פחות חשובים בשביל הסיכום‪...‬‬ ‫שיטות לא תגובתיות‬ ‫דגימה‬ ‫איסוף נתונים‬ ‫מדידה‬ ‫תכנון ניסוי והרצתו‬ ‫נספח ‪3‬‬

סיכום למבחן בפסיכולוגיה ניסויית

Related documents

Products

Support

סיכום למבחן בפסיכולוגיה ניסויית

Related documents

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib