The Halpern Critical Thinking Assessment: Towards a Dutch Appraisal of Critical Thinking Hannie de Bie & Pascal Wilhelm1 Faculty of Behavioural Sciences, University of Twente, Enschede, The Netherlands Abstract When implementing critical thinking learning objectives in education, a valid and reliable instrument for assessing the level of critical thinking skills is needed. This study focuses on the psychometric properties of the Dutch version of the Halpern Critical Thinking Assessment (HCTA). A real-world outcomes inventory (RWONL) was developed to measure negative life events. The number of negative life events was hypothesized to be inversely related to critical thinking ability. The HCTA and RWO-NL were administered to university students in communication and psychology (N = 240). Reliability of the HCTA appeared sufficient (α = .75; λ2 = .77) and factor analysis indicated that the use of the constructed response and forced choice format each containing the five critical thinking subscales is an adequate method for assessing critical thinking ability. The total HCTA and weighted RWO-NL scores did not show a significant relationship, r = -.12, ns. Recommendations for improving the Dutch HCTA are discussed. Keywords: Halpern Critical Thinking Assessment, validity, reliability 1 Correspondence concerning this article should be addressed to Hannie de Bie or Pascal Wilhelm, University of Twente, Faculty of Behavioural Sciences, De Zul 10, 7522NJ, Enschede, The Netherlands. Phone: 0031 53 489 3562 E-mail: hannie112@hotmail.com or p.wilhelm@utwente.nl THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 2 There are many examples of thoughtless actions of people resulting from blindly accepting information or carelessness. One example is the outcome of an investigation of Professor Diederik A. Stapel of Tilburg University, the Netherlands. The press release that indicated that meat eaters are more selfish and less social, was well received, especially by vegetarians. Many people believed this without asking critical questions or consider how the study was designed. Fortunately, some reporters questioned the study and thoroughly checked the methods and conclusions (Hupkens, 2011, September 14) and chose not to publish the research. Later it became known that Stapel’s data was fictitious (TilburgUniversity, 2011) and eventually all Stapel’s publications were examined in search of scientific malpractice. How important is the skill of critical thinking within society? Quite important, according to the increasing focus in education on ‘21st century skills’ (Ananiadou & Claro, 2009). These skills, including critical thinking, communication, ICT literacy, social and/or cultural skills, creativity, collaboration and problem solving skills (Voogt & Roblin, 2010) are not new in their entirety (Rotherham & Willingham, 2010). However, due to economical and societal change (from an industrial- to a knowledge society) and ICT developments, having success on the labour market often depends on having these skills. This is one of the reasons why these skills have to be taught, beginning early in education (Voogt & Roblin, 2010, 2012). This study will focus on one of the 21st century skills, namely critical thinking. Despite many conflicting definitions (e.g. Black, 2012; Ennis, 1996; Facione, 1998; Halpern, 1998; Moseley et al., 2005; Sternberg, 1986), Butler (2012) concludes that most researchers agree that critical thinking “involves attempting to achieve a desired outcome by thinking rationally in a goal-oriented fashion” (p. 721). In accordance with this observation, the definition of Halpern (1998) will be used: The term critical thinking refers to the use of those cognitive skills or strategies that increase the probability of a desirable outcome. […] Critical thinking is purposeful, reasoned, and goal-directed. It is the kind of thinking involved in solving problems, formulating inferences, calculating likelihoods, and making decisions. Critical thinkers use these skills appropriately, without prompting, and usually with conscious intent in a variety of settings. (pp. 450-451) THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 3 If critical thinking becomes an educational objective, appropriate assessment is needed. Many critical thinking assessments have been studied thoroughly (e.g. Black, 2012; Hatcher, 2011; Ku, 2009; Spector, Schneider, Vance, & Hezlett, 2000; Stein & Haynes, 2011). This study focuses on the Halpern Critical Thinking Assessment (HCTA), which presents 25 everyday scenarios. These scenarios are derived from various domains in real life; issues like the lottery, the death penalty, and slimming programs are discussed. In each scenario, respondents are asked to answer an open-ended question to give a first reaction in their own words, which is followed by a forced choice question to choose the best response out of the possible answers. The HCTA is unique when it comes to the combination of these two formats in one assessment. The other advantages of the HCTA relative to other assessments is the use of a computerized grading system and the option for both offline and online administration. In the following, these differences and other characteristics of the HCTA will be discussed. The HCTA consists of five categories to measure critical thinking skills: (a) verbal reasoning skills (e.g. the ability to detect and defend against ubiquitous or deceptive language usage), (b) argument analysis skills (e.g. the ability to assess the strength of an argument), (c) skills in thinking as hypothesis testing (e.g. the ability to reason scientifically, to determine whether or not the given information confirms the hypotheses), (d) using likelihood and uncertainty (e.g. make use of the correct estimate of a probability), and (e) decision making and problem solving skills (e.g. the ability to define the problem, identify goals and weigh both positive and negative findings) (Halpern, 2012). The HCTA presents 25 scenario's respondents can encounter in daily life, each starting with an open-ended question, followed by forced choice questions. This is the first distinction between the HCTA and other assessments that are either based on a constructed response or a forced choice format. Ku (2009) advocated the use of a multi response format and emphasized that the conceptualization of critical thinking should be taken into account when developing a critical thinking assessment. She stated that there are two components of critical thinking: the dispositional component (e.g. intention and motivation to engage in critical thinking) and the cognitive component (e.g. a set of skills, rules of formal logic). Together, these components determine the actual critical thinking performance. Taube (1997) also investigated with a confirmatory factor analysis whether a two-factor model of critical thinking provided a better fit with the data than an one-factor model. The data consisted out of (a) the dispositional factor measured by assessments on tolerance of ambiguity, need for cognition, and intellectual THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 4 development, and (b) the cognitive factor was measured by SAT scores, grade point average scores, and scores on the Watson-Glaser Critical Thinking Appraisal (WGCTA: Watson and Glaser (1980)). The Ennis-Weir Critical Thinking Essay Test (EWCTET: Ennis and Weir (1985)), which consists out of a constructed response format, had a significant relationship with both factors (Taube, 1997). These components appear to be associated with different response formats, in which the constructed response format exposes more of the dispositional component than the forced choice format does (Ku, 2009). Both response formats are discussed below. Constructed response relies on free recall, the respondents have to search their memory and select the knowledge to construct an answer (Bridgeman & Morgan, 1996; Butler, 2012; Ku, 2009). A constructed response format takes more cognitive effort, but also reveals more of the dispositional part of critical thinking because of the opportunity for the respondent to display the appropriate skills. The motivational and intentional aspects of critical thinking will become more apparent, because answering open-ended questions shows to what extent the respondent is willing and able to engage into critical thinking at the right moment (Ku, 2009). However, in contrast to the forced choice format, an assessment with a constructed response format is much more time consuming and there is concern about the subjectivity of the scoring. The critical thinking assessments that rely solely on free recall, are for instance the EWCTET and the ICAT Critical Thinking Essay Examination (SonomaStateUniversity, 1996). A format based on forced choice requires less cognitive effort, because the respondents can rely on recognition; they have to identify the applicable response from a list of alternatives (Bridgeman & Morgan, 1996; Butler, 2012; Ku, 2009). The forced choice format gives the possibility to measure how well good use of critical thinking skills is recognized, it is a quick way to get an indication of one's critical thinking skills and an efficient way to reach many people. But it may reveal only the cognitive component, it is doubtful whether forced choice is suitable for measuring the disposition towards critical thinking. Responses do not indicate how the respondent operates in an unprompted context where they have to generate their own answers (Ku, 2009). The critical thinking assessments that rely solely on recognition memory, are for instance the California Critical Thinking Skills Test (CCTST: Facione (1990)) and the Cornell Critical Thinking Test (CCTT: Ennis, Millman, and Tomko (1985)). THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 5 Both response formats have their benefits and limitations, but the HCTA combines these two formats into one assessment (Halpern, 2012). The response formats combined should potentially give a more compatible assessment, since both formats are needed to measure the dispositional and cognitive components of critical thinking. There is a considerable amount of evidence indicating high reliability and validity of the HCTA (Halpern, 2012). Internal consistency (Cronbach’s Alpha) ranges from .85 to .97 and because of the scoring method that guides the grader with scoring the constructed response, the interrater reliability is high (Halpern, 2012). Because items are based on constructs that are most frequently mentioned in descriptions of critical thinking, content validity is presumably high (Halpern, 2012). Four small studies mentioned in Halpern (2012) reported correlations between scores on the constructed response items and forced choice items of .39, .49, .42, and .51. This suggests a reasonable relationship between the two formats, and simultaneously gives evidence for the separability of free recall and recognition (Halpern, 2012). The factor structure of the HCTA is evaluated in more detail in Halpern (2012) with a U.S. norm sample of 450 respondents collected by the test author. The author proposed three models and concluded that a two-factor model (comprising the constructed response and forced choice format) each containing the five categories of critical thinking skills, fits the data best. Hau et al. (2006, April) and Ku (2009) also evaluated the factor structure of the HCTA with a sample of respondents from the U.S. and Hong Kong and concluded that the same model represented the best fit. The constructed- and forced choice format are related, but also have separate characteristics. This supports the combined use in assessing critical thinking (Halpern, 2012; Hau et al., 2006, April; Ku, 2009). Regarding construct validity, positive correlations (r = .12 - .59) exist with level of education and academic ability tests like the SAT- and grade point average scores (Butler, 2012; Halpern, 2012; Ku, 2009), but the correlation with SAT scores appears higher (r = .50 .58) (Hau et al., 2006, April; Marin & Halpern, 2011). In addition, scores on need for cognition- and conscientiousness scales are moderately related to critical thinking skills (Clifford, Boufal, & Kurtz, 2004; Halpern, 2012; Ku, 2009; Ku & Ho, 2010; Spector et al., 2000). Several other countries have used a translated HCTA as a tool to assess critical thinking, including China, Ireland, Portugal, Belgium, Spain, United States, and Vietnam (Butler et al., 2012; Halpern, 2012). With respect to the total HCTA score, studies in Spain (M[355] = 106, SD = 16.1) and Belgium (M[173] = 113.15, SD = 11.5) found similar results THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 6 compared to the U.S. norm sample (M[450] = 109.71, SD = 18.23). The relatively constant scores illustrate the quality of the scenarios in the HCTA. Few changes by native translators were needed to make the assessment more culturally fair, perhaps because cultural differences are taken into account when developing the scenarios (Halpern, 2012). An interesting study on the external validity of the HCTA was conducted by Butler (2012). Instead of the more frequently studied relationship between academic performance and critical thinking, she studied the relationship between real-world outcomes and critical thinking level. The real-world outcomes were measured by an inventory (Decision Outcomes Inventory (DOI)) adapted from Bruine de Bruin, Parker, and Fischhoff (2007), that determines frequencies of negative life events in numerous domains, like finances, education, and relations over the past 6 months. Butler (2012) hypothesized that the respondents who score higher on the HCTA would report fewer negative life events than those who score lower on critical thinking. This hypothesis was based on the notion that critical thinkers transfer and exercise their critical thinking skills in multiple domains of life in order to be successful and avoid negative life events caused by poor decision making. As Halpern (1998) states: “critical thinkers will have more desirable outcomes than ‘noncritical’ thinkers (where ‘desirable’ is defined by the individual, such as making good career choices or wise financial investments)” (p. 450). This prediction was confirmed by Butler (2012), HCTA and DOI scores of 131 respondents showed a modest relationship (r = -.38, p = < .001) in the expected direction. Also, the assumption was made that the critical thinking assessment scores and real-world outcomes would yield similar results for three qualitatively different groups of respondents (community adults, state university students, and community college students). Butler (2012) reported no differences in the number of negative life events between the groups and differences among the groups of respondents in the relationship between the number of life events and the critical thinking assessment scores. The only difference found was the score on the critical thinking assessment; community college students scored significantly lower (M = 92.31, SD = 17.50) than state university students (M = 105.15, SD = 21.48) and community adults (M = 110.42, SD = 20.43). A replication of the above-mentioned study was carried out with an Irish sample of 70 respondents, which also participated in an online critical thinking course. This study confirmed the results of Butler’s research and showed that there was a low but significant correlation between critical thinking scores and real-world outcomes, r = -.28, p = .019 (Dwyer, Hogan, & Stewart, 2012). These outcomes are worth pursuing, because it provides THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 7 evidence for the external validity. If there is a relationship between critical thinking and decision making, critical thinking instruction may also yield benefits beyond the classroom. The HCTA was translated in Dutch and published by Schuhfried GmbH. However, little psychometric data is available about the Dutch edition. Therefore, this study explored the internal structure and reliability of the Dutch HCTA. Secondly, this study attempted to replicate the findings of Butler (2012), whose primary objective was to determine whether HCTA scores are related to a real-world outcomes inventory of everyday life. Like Halpern (2012), Hau et al. (2006, April), and Ku (2009), Cronbach's Alpha of the total item set is hypothesized to be .85 or higher and reliability of the subscale items should resemble those of the U.S. norm sample (constructed response format α = .84, and forced choice format α = .79). Additionally, it is expected that the factor analysis will show two related, but separable latent factors for the constructed- and forced choice format, each containing the five critical thinking categories. Finally, like Butler (2012), it is predicted that the correlation between HCTA scores and scores on a real world outcomes inventory shows a modest, but significant negative relationship. This prediction implies that the respondents who score higher on the HCTA will report fewer negative life events than those who score lower on critical thinking. To check for possible ambiguities in the HCTA encountered during administration, respondents indicated at the end of the test if and where they experienced problems in the comprehensiveness of the HCTA. The results of these observations are reported. Method Participants The respondents were first- and second year communication and psychology students from the University of Twente in the Netherlands, Enschede. For course credits, they are required to participate in research studies conducted at the Faculty of Behavioural Sciences. They signed up voluntarily and earned 1.5 points (out of 10 mandatory credits) by completing both the HCTA and RWO-NL. 258 respondents completed the Dutch HCTA and the Dutch version of the RWO (RWO-NL) adapted from Bruine de Bruin et al. (2007) and Butler (2012). Participants were excluded from analysis when their answers on both tests indicate that they did not take the assessment seriously or when they prematurely aborted the tests. Data from 18 respondents were excluded. Of the remaining 240 respondents, 80% was female (n = 191) and 20% was male (n = 49). This female/male distribution represents the population THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 8 of the concerning studies. The respondents were aged 18 - 32 (M = 20.53, SD = 2.07). Ethnic background was distributed as follows: 46% Dutch, 34% German, and 20% stated another ethnicity or refused to fill out this question. Materials Halpern Critical Thinking Assessment. The instrument used to measure critical thinking is the HCTA (Halpern, 2012). A few technical language errors were corrected before it was used, without affecting the meaning of the items (see Appendix A). Test form S1 and version A has been used in this study. The HCTA Form S1 presents 25 everyday scenario's accompanied by questions in two response formats: first a constructed response (open-ended) and then forced choice (e.g., multiple-choice, rating of alternatives or ranking) (See Appendix B for the HCTA used in this study). Form S2 only consists of the forced choice questions, and can be used as a short form. Version A and version B are parallel versions of the HCTA. This enables a repeated measures design, without possible memory bias for the items. The everyday scenarios were drawn from disciplines such as medical research, social policy analysis and other disciplines respondents may encounter in daily life. Five categories of critical thinking are measured with the HCTA: (a) verbal reasoning, (b) argument analysis, (c) thinking as hypothesis testing, (d) likelihood and uncertainty, and (e) decision making and problem solving. Each construct is examined with five everyday scenario's. An everyday scenario in the category of likelihood and uncertainty is for instance the following situation: "Ahmed has obtained the highest score on the first of three exams of a group of 120 students." The respondent is asked to indicate what expectation he or she has about how Ahmed will score at the end of the semester. They have to check a box whether Ahmed will score (a) "class average", (b) "above class average, but not the top of the class", or (c) "top of the class". The constructed response is composed by the next question: "Explain your answer in one or two sentences". The respondent continues on the next page with the forced choice question and has to check one of the next five response options which is the most likely explanation: (a) "Ahmed was probably lazy and studied not so hard after his first exam", (b) "Other students in his class learned how to study, so they got higher grades", (c) "An extreme score is usually followed by a score that is closer to the average", (d) "The law of averages predicts that all students will score close to average, regardless of their score on a single test", and (e) "Test scores are not independent, so the score of Ahmed at the end of the semester will depend on the performance of other students in the class". The answers to both the constructed response and forced choice questions must show that the respondent recognizes THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 9 the principle of regression to the mean and the improbability of an extreme score followed by another extreme score (correct answer: c). The administration of the HCTA (Form S1: constructed response and recognition items, Version A) took 45 to 80 minutes. The HCTA was provided within the Vienna Test System (VTS: Halpern, 2012), but in this study the HCTA and RWO-NL were administrated online with Thesistools1. With Thesistools, both tests could be administered online so that a large group of respondents could be reached. Scoring was derived from VTS which automatically calculates the forced choice response and guides scoring of the constructed responses. Guided grading uses computerized prompting of the grader. For example, in response to the answer to the constructed response question regarding the example of the score of Ahmed at the end of the semester described above, the grading system for example displays the following question: “Did the respondent recognize the principle of regression to the mean or the improbability of an extreme score followed by another extreme score?” By each question, the grader determines if the respondent’s answer: (a) clearly indicated this, (b) less clearly indicated this, or (3) did not indicate this at all (Halpern, 2012). By scoring in a standardized way with the use of computerized prompting, the concern for scoring bias can be reduced. Halpern (2012) reported a high (r = .83) inter-rater reliability for the constructed response, which indicates that scoring objectivity can be assumed. RWO-NL. The computerized inventory used to assess real-world outcomes is the RWO-NL, adapted from Bruine de Bruin et al. (2007) and Butler (2012). The items were translated and adapted for Dutch respondents by altering language use within certain expressions, culturally unfamiliar or uncommon terms, and economically different items (Butler et al., 2012). The respondents indicate whether or not they have experienced a particular event in the past six months by selecting a check box with ‘yes’ or ‘no’. The inventory contains items from a wide variety of domains, like finances, education, and relations. There are two types of items possible: items containing sub-questions, and items with no sub-questions. The items with sub-questions always start with an opportunity (e.g. "Gone shopping for food or groceries") that made the (several) negative event(s) possible. These negative events were measured by the sub-questions (e.g. "Threw out food or groceries you had bought, because they went bad"). Therefore this inventory considers the possibility of actually experiencing a negative life event due to a previous decision. Nine items have no 1 http://www.thesistools.com THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 10 preceding occurrence (e.g. "Been in a public fight or screaming argument"). See Appendix C for the complete list of 50 presented items. The total item set was created in three steps. First, 31 items and a total of 31 subquestions were adopted from the original inventory published by Bruine de Bruin et al. (2007). Of these items, 10 items and 12 sub-questions were modified for the Dutch population. Second, the adjustments made by Butler (2012) to make the items more applicable for university students were included, which resulted in nine additional items and 11 additional sub-questions. Of these items, one item and four sub-questions were modified for the Dutch population. Finally, the addition of 10 items and 19 sub-questions were made to make the inventory more suitable and culturally appropriate for the Dutch population. For example, an original item contained the words "Used checks". This was altered in "Used a debit card", because checks are rarely used in the Netherlands. In this way, the item was made more suitable for the Dutch population, without too much deviation from the original item. Additional items were created which nowadays play a greater role in the life of the Dutch students. For example: (a) "Had a mobile phone", with subsequent negative events: (b) "Lost a mobile phone" and (c) "Had to pay at least three times extra on your phone bills because you went over your call/text/data limit". These additional items all fit in the various domains used for the RWO. The administration of the RWO-NL took 5 to 15 minutes. The calculation of the total score of the RWO-NL was adapted from Bruine de Bruin et al. (2007) and Butler (2012). First, the total score is calculated by dividing the number of negative life events by the number of opportunities that can make a negative life event possible (Butler, 2012). This score represents the proportion of negative life events that the respondents experienced. Second, the negative outcomes are weighted which makes the calculations of the RWO-NL more fair (Bruine de Bruin et al., 2007). Some outcomes are in fact not as bad as others (e.g. taking the wrong train or bus vs. been in jail). Generally, bad outcomes probably happen to a few people. To weigh for severity, the proportion of avoided outcomes per item is computed (1 - proportion of experienced outcomes). Each respondents' weighted RWO-NL score is the sum of the weighted scores, divided by the total number of experienced opportunities to make bad decisions. This results in a score between 0 and 1, where 0 stands for making good decision making, and 1 for poor decision making. The respondents were able to not answer any uncomfortable questions by checking a third option. If the nonresponse was an opportunity that could make a negative life event possible but the respondent did answer "yes" to a subsequent negative life event, then the response does not THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 11 make sense. The opportunity, like driving a car, is necessary to experience a negative life event, like getting a speeding ticket. In these cases, it is assumed that the respondent has forgotten to answer the first question and therefore the nonresponse is changed to "yes". If the nonresponse was a negative life event, then the whole item is excluded from analyses by also excluding the opportunity that could make the negative life event possible from the proportion score. Procedure All respondents who participated in the study were presented with an informed consent statement describing the purpose of the study and stating confidentiality. All respondents received the same assessment and conducted this computerized assessment through an online questionnaire. After completion of the test, the outcomes were checked and the respondents received the compensation of 1.5 out of 10 participation points. After the total study was finished, the respondents received a debriefing by email which also included reading suggestions for students who are interested in learning more about critical thinking. Results The mean score on the HCTA (n = 240) was 108.23 (SD = 13.91) out of the maximum score of 194. The mean score on the weighted RWO-NL (wRWO-NL) was 0.14 (SD = 0.08). All measures met the criteria for univariate normality (skewness and kurtosis between -1 and 1). Different age groups were compared, including ≤ 19 years and ≥ 20 years, the age boundary was incremented twice, and finally the age groups of ≤ 26 years and ≥ 27 years were compared. There were, as predicted, no differences in HCTA scores based on age or gender (all ps > .05). Also, there were no differences observed in HCTA scores between Dutch and German students, t(189) = 1.52, p = .13, and between Dutch students and remaining students with other ethnicities, t(115) = 0.58, p = .57. It is therefore concluded that ethnicity had no effect on the HCTA scores, thus students with a native language other than Dutch were presumably able to correctly understand the content of the items. The exploration of the factor structure of the Halpern Critical Thinking Assessment Cronbach's Alpha measured for all items was α = .75 which seems to support the reliability of the HCTA (Kline, 2000). However, the large number of items and the use of multiple subscales within the HCTA raised concern about the interpretation of this value (Cortina, 1993; Field, 2009). Therefore, the Cronbach's Alpha was calculated for every subscale of both formats (see Table 1). As can be seen, total subscale scores had very low to THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 12 Table 1 Summary of the Cronbach's Alpha (sub)scale scores of the HCTA Cronbach's Alpha Guttman's Lambda Constructed Forced (Sub)scale Constructed Forced response choice Total response choice Total .61 .64 .75 .63 .67 .77 Verbal Reasoning .30 .19 .33 .33 .23 .37 Argument Analysis .24 .22 .38 .30 .26 .42 .29 .38 .53 .32 .42 .55 .31 .18 .39 .33 .20 .42 .30 .43 .52 .34 .47 .54 Critical Thinking Thinking as Hypothesis Testing Likelihood and Uncertainty Decision Making and Problem Solving Table 2 Model fit statistics of the measurement models in the HCTA sample χ2 df p CFI RSMEA ∆χ2 ∆df p ∆CFI M1 32.050 29 .318 .990 .021 - - - - M2 38.556 30 .136 .972 .035 6.506 1 .011 0.018 M3 95.614 30 < .001 .782 .096 63.564 1 < .001 0.208 Model poor values for Cronbach's Alpha. A better reliability estimation like Guttman's Lambda is endorsed by Sijtsma (2009). This analysis results in a slightly better overall reliability value, λ2 = .77, and subscale values. To further explore the factor structure of the HCTA, a confirmatory factor analysis was carried out with three measurement models specified in Halpern (2012). This analysis evaluated the goodness of fit of each model to the norm data. The first model (M1) constitutes two latent factors; the constructed response ("critical thinking - free recall") and the forced choice format ("critical thinking - recognition"), each containing the five sub-scale scores hypothesized to load on the associated factor. The correlated unique errors of the associated sub-scale scores were allowed to be freely estimated since items of both formats have the same origin. The latent factors were allowed to be correlated to test the hypothesis whether THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 13 Figure 1. Standardized factor loadings of measurement model 1. CTF = latent factor critical thinking - free recall, CTR = latent factor critical thinking - recognition, VRF = sub-scale score verbal reasoning - free recall, AAF = sub-scale score argument analysis - free recall, HTF = sub-scale score hypotheses testing - free recall, LUF = sub-scale score likelihood and uncertainty = free recall, PSF = sub-scale score decision making and problem solving - free recall, VRR = sub-scale score verbal reasoning - recognition, AAR = sub-scale score argument analysis - recognition, HTR = sub-scale score hypotheses testing - recognition, LUR = sub-scale score likelihood and uncertainty - recognition, PSR = sub-scale score decision making and problem solving recognition. there is a relationship between the two formats, and simultaneously gives evidence for the separability of free recall and recognition. The only change in the second model (M2) and the third model (M3) compared to M1, is that the standardized latent correlation of the two latent factors was set to respectively 1 and 0, to test the hypotheses whether both factors have indistinguishable- or completely separated characteristics. The calculations of the factor structure of the HCTA were carried out with IBM® SPSS® Amos(TM) 22 (Arbuckle, 2013). Maximum likelihood was used to estimate the model parameters, since the data is normally distributed. The following cut-off values were used to evaluate the goodness of fit of the models: non-significant χ2-test, CFI ≥ .95, and RMSEA < .05 (Jackson, Gillaspy Jr, & Purc-Stephenson, 2009; Marsh, Hau, & Wen, 2004).Also, to test whether model M2 and model M3 significantly differ from model M1, criteria of a significant ∆χ2 statistic and ∆CFI ≥ 0.01 (Cheung & Rensvold, 2002) are used. THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 14 The model fit statistics of the three measurements are summarized in Table 2. The statistics in Table 2 show a significantly better fit of model M1, ∆χ2 (1, N = 240) = 6.51, p = .01, which indicates that the latent factors of "Critical Thinking - free recall" and "Critical Thinking recognition" have a strong relationship (r = .785). However, the factors are separable because M2 (in which the standard latent correlation of the two factors was set to 1) gave a poorer fit than M1. The standardized factor loadings of the constructed- and multiple choice sub-scales on their associating latent factor were all significant (all ps < .001). The correlated unique errors between the associated sub-scales turned out to be rather small and only reached significance in "Hypothesis Testing" and "Decision Making and Problem Solving". The lack of significance indicates a good fit of the model, since the correlations between the latent variables and the associated subscales are preferred to explain all variance. The structural relations and standardized factor loadings are depicted in Figure 1. The Halpern Critical Thinking Assessment in relation with the Real World Outcomes inventory In contrast to what was expected, there was no significant relationship between the total HCTA score and the score on the RWO-NL, r = -.10, ns. Also, the total HCTA score and the weighted score on the RWO-NL did not result in a significant relationship, r = -.12, ns. The item nonresponse was not included in these calculations. Refusing to answer the question when uncomfortable could probably be the result of experiencing the outcome, but it might be too embarrassing to admit in the inventory. To find out how the relationship changes between the HCTA and RWO-NL when this consideration is taken into account, all unanswered questions were replaced by 'yes' (experiencing the outcome). Surprisingly, the relationship between the total HCTA score and the RWO-NL score appeared to be significant, r = -.16, p = .01. Also, the weighted score on the RWO-NL had a somewhat stronger relationship with the HCTA, r = -.17, p = .007. However, these correlations are small. This finding seems to support the hypothesis that a higher score on critical thinking is related to experiencing less negative events in daily life. But these results should be interpreted with caution, because of the alternative calculation of the item nonresponse. See Appendix C for the complete list of the 50 presented item sets and the corresponding response frequencies. Feedback of the respondents The option to provide feedback on the HCTA was used by 55 respondents, this is 23% of the total sample. Of these feedback, 37 respondents stated that complex and incorrect THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 15 syntax and the use of scientific language makes it difficult to comprehend the scenario's and questions of the HCTA. Also, seven respondents commented on the excessive length of the test, some said they spent three hours to complete the assessment. In order to maintain concentration and motivation, the sentences should be kept short and easy to understand. Although few respondents used the opportunity to give feedback about specific items, the comments still can be useful to give an indication of where bottlenecks are. Specific useful comments about ambiguities within certain items of the HCTA were mentioned with regard to the following items: 5, 7, 8, 14, 19, and 21. Each item will be discussed below (see Appendix B The Dutch HCTA for the display of the items). The following feedback of one respondent about item 5 summarizes the feedback of the other nine respondents. This respondent cites the following sentence derived from scenario 5: "After a year it was found that the average result of the at risk students was .2 higher than at risk student of the previous year." She comments: "This sentence is not clear. Is it about the average result, the number of current students that increased, or the students who have successfully completed the first year? Also, it was not clear to me what .2 exactly means. Is it that the grades increased by 0.2? Or did 20% of the students achieve the first year? Or is the result of the at risk students increased by 20%?" Seven of the respondents thought scenario 7 was too difficult. They felt they did not have enough knowledge for this question and would like to have had more explanation about terms like "diagnostic category". Another respondent thought the last question was too long and complex. All four of the respondents are not very clear about why they found scenario 8 difficult to understand. They used terms like "vague" to describe this item. Item 14 received feedback of five respondents. Four of these respondents even said that the correct answers were not among the forced choice response options. They probably did not understand that the response options included an underlying reasoning, instead they took it literally. Four respondents did not understand what was meant by "deficiencies" in scenario 19. One respondent posed the question: "Certain shortcomings of food?" This indicates a misinterpretation of the question. Instead, there should be looked at the shortcomings of the reasoning of the news article. Finally, nine respondents directed their feedback at scenario 21. This was mainly due to the question whether the respondents could formulate the problem in two ways. Also, the THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 16 question of part B, whether the respondents could assess the quality of several problems, was often not properly understood. Conclusions and Discussion The results of the present study partly replicate those reported by Halpern (2012). First, the confirmatory factor analysis revealed that the model which reflects two correlated latent factors (the constructed response and forced choice format) each containing the five subscales of the HCTA, best fits the factorial structure of the Dutch HCTA. This supports the findings of Halpern (2012), Hau et al. (2006, April), and Ku (2009) in which the same model fitted the data of a U.S. and Chinese sample. Most important, the analysis confirms that the latent factors of the constructed response and the forced choice format are closely related, yet separate in their properties. The separability could reflect the difference between measuring more of the dispositional component with the constructed response format, and measuring the cognitive component with the forced choice format. This indicates that the use of both response formats in the HCTA is a valid method to obtain an accurate indication of the ability in critical thinking. However, the estimated value of Cronbach's Alpha did not confirm the hypothesis of α ≥ .85, neither did the value of the subscale scores (constructed response format α = .61 in lieu of α = .84, and forced choice format α = .64 in lieu of α = .79). Still, the overall values of Cronbach's Alpha (α = .75) and Guttman's Lambda (λ2 = .77) indicate good reliability of the Dutch HCTA. Taken together, these results not only confirm the quality of the Dutch translation, but also the universality of the two factor model each containing five subscales. This justifies the use of the Dutch version of the HCTA in the Netherlands, despite the fact that respondents still reported ambiguities in the scenarios. Once these issues have been resolved, further research on the Dutch HCTA will probably yield more reliable results. Finally, the third aim was to assess the relationship between HCTA and RWO-NL scores. The analysis showed a non-significant relationship, while Butler (2012) found a modest relationship, r(131) = -.38, p < .001. The relation between the HCTA and RWO-NL could possibly be compromised because of the use of self-report. For example, having a higher score on the HCTA could influence the RWO-NL score by giving more social desirable answers. Also, the inclusion of only university students could have influenced the RWO-NL scores, because it is possible that university students are more likely to display themselves as good decision-makers compared to students from other educational levels. Like Butler (2012), respondents were given the opportunity to not answer any uncomfortable THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 17 questions to lessen this concern during administration of the RWO-NL. When the item nonresponse was replaced with an affirmative answer (that the respondent actually experienced the outcome), a significant negative relationship between the HCTA and the (w)RWO-NL appeared, r = -.17. This relationship is still relatively weak compared to the findings of Butler (2012) and Dwyer et al. (2012), who found correlations of respectively r = .38 and r = -.28. But that aside, when not answering the question is caused by the embarrassment to admit experiencing the outcome, the hypothesis that a higher score on critical thinking is related to experiencing less negative events in daily life is supported. However, this assumption can not be determined with this study. A closer look at the item nonresponse revealed a significant relationship between HCTA scores and the number of unanswered questions on the RWO-NL in the opposite direction, r(239) = -.20, p = .002. This does not correspond with the proposition that respondents with a higher critical thinking score gave also more social desirable answers and thus caused more item nonresponse on the RWONL. It could be that respondents with a lower HCTA score were perhaps less motivated to seriously complete the RWO-NL, and therefore did not answer all questions. Or that respondents with a higher HCTA score are more aware of the anonymity of the RWO-NL, and therefore answered more questions even when they felt embarrassed. Nevertheless, further development and validation of the RWO-NL can possibly give a more reliable tool for measuring negative life events. This study also has its limitations. First, the sample of respondents consists of only university students from the same university who have chosen to participate in this study. There was no random selection, although the sample is rather large and will at least be representative for students from this Faculty. Second, in line with previous research, it is assumed that the constructed response format measures more of the dispositional aspect of critical thinking. The argument that the constructed response format gives the opportunity to come up with self-generated solutions, think critically in an unprompted context, and show the extent to which someone will think critically makes sense. But the evidence of the assertion that it measures the dispositional aspect of critical thinking is scarce. Bridgeman and Morgan (1996) indicate that constructed response and forced-choice questions measure separate cognitive abilities and Martinez (1999) adds that the range of cognitions needed for answering constructed response questions is larger than the range of cognitions for answering forced choice questions. Further research should investigate this issue more precisely for critical thinking. For instance other methods of measuring the disposition towards critical THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 18 thinking, like in the California Critical Thinking Disposition Inventory (CCTDI) (Facione, 2000), can provide further evidence. The CCTDI uses seven elements of the overall disposition (inquisitiveness, systematicity, analyticity, open-mindedness, maturity of judgment, truth-seeking, self-confidence, and their negative poles) and these elements are measured using 75 Likert style items. Comparing scores on the CCTDI and scores on the constructed response format of the HCTA may shed some light on whether the disposition is revealed in the constructed response. Third, the online administration of the test was unproctored. There are mixed opinions about this method of administration within the cognitive domain; proctored and unproctored conditions may be equivalent (Lievens & Burke, 2011), or the unproctored condition yields higher test scores than the proctored conditions because of the presence of a proctor (Carstairs & Myors, 2009). This effect does not seem to occur in the present study, because no inflation of the unproctored test scores is observed compared with the mean of the U.S. norm sample (M = 109.71, SD = 18.23) (Halpern, 2012). Just the opposite, a lower mean of 108.23 (SD = 13.91) was found. The U.S. norm sample has a wider spread in terms of age (M = 29, SD = 12.53), thus this could mean that these respondents had more years of education. More years of education is related to the level of critical thinking (Butler, 2012), which can explain the lower mean in comparison with the U.S. norm sample. But, as a fourth limitation, the lower mean may also be caused by the translation of the HCTA, where cultural differences could have influenced the test score. The Netherlands are a welfare state, where different opinions about politics, diets, drugs and alcohol could distort the score on these particular items. Respondents may for example react more lenient towards the scenario about alcohol abuse due to a lower age at which alcohol may be consumed in the Netherlands, making alcohol more socially accepted. This mildness may cause Dutch respondents to not easily report the alcohol abuse to an authority figure in that particular scenario, possibly making them to score lower on this item. Another drop in the score on the HCTA could be due to incorrect syntax. Respondents had the possibility to give feedback on the HCTA after completion of the assessment. Based on this feedback, we infer that the complex and incorrect sentence structure and scientific questioning could have affected the comprehensibility of some of the items. We suggest that these issues are addressed before further research is done. This study has established a solid foundation for future validation research on the HCTA in the Netherlands. The hypothesized factor structure was confirmed, which justifies the Dutch version of the HCTA. Also, recommendations have emerged out of the respondents' THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 19 feedback and a thorough review of the authors. Because our sample of respondents had a smaller spread regarding age and educational level, it is recommended to include a larger and more diverse sample of respondents. The supervision of a proctor could give more control over the behaviour of the respondents during the completion of the tests. In addition, another method for measuring negative life events can be introduced. For instance, an unobtrusive experiment could be developed to observe actual behaviour that indicates good or bad decision making. For example, the respondent is approached by an aggressive seller and the researcher scores whether the respondent uses good or bad decision making. Although this is a very laborious method to collect data, it can circumvent the social desirability issue. Based on these observations, it is recommended to re-examine the relationship between HCTA and RWO-NL scores. Finally, with a legitimate Dutch critical thinking assessment instrument, it is possible to examine the effectiveness of critical thinking instruction. Gains in critical thinking can be measured by an increase in HCTA scores from pretest to posttest. The repeated measures design requires the use of version B of the HCTA, which in turn should also be subject of validation studies for the Dutch population. However, further validation research is needed. Still, a thoroughly researched HCTA is a promising tool to assess the 21st century skill of critical thinking among Dutch learners. Acknowledgements This research was conducted for the master thesis of Hannie de Bie, supervised by Pascal Wilhelm and Hans van der Meij. The authors would like to thank Diane F. Halpern and Heather A. Butler for their knowledge and helpful suggestions, and Schuhfried GmbH and Science Plus Group BV for their practical support. THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 20 References Ananiadou, K., & Claro, M. (2009). 21st century skills and competences for new millennium learners in OECD countries. OECD Education Working Papers, 41. doi: 10.1787/218525261154 Arbuckle, J. L. (Ed.). (2013). Amos 22 Reference Guide. Crawfordville, FL: Amos Development Corporation. Black, B. (2012). An overview of a programme of research to support the assessment of Critical Thinking. Thinking Skills and Creativity, 7(2), 122-133. doi: 10.1016/j.tsc.2012.04.003 Bridgeman, B., & Morgan, R. (1996). Success in college for students with discrepancies between performance on multiple-choice and essay tests. Journal of Educational Psychology, 88(2), 333. doi: 10.1037/0022-0663.88.2.333 Bruine de Bruin, W., Parker, A. M., & Fischhoff, B. (2007). Individual differences in adult decisionmaking competence. Journal of personality and social psychology, 92(5), 938. doi: 10.1037/0022-3514.92.5.938 Butler, H. A. (2012). Halpern Critical Thinking Assessment Predicts Real-World Outcomes of Critical Thinking. Applied Cognitive Psychology, 26(5), 721-729. doi: 10.1002/acp.2851 Butler, H. A., Dwyer, C. P., Hogan, M. J., Franco, A., Rivas, S. F., Saiz, C., & Almeida, L. S. (2012). The Halpern Critical Thinking Assessment and real-world outcomes: Cross-national applications. Thinking Skills and Creativity, 7(2), 112-121. doi: 10.1016/j.tsc.2012.04.001 Carstairs, J., & Myors, B. (2009). Internet testing: A natural experiment reveals test score inflation on a high-stakes, unproctored cognitive test. Computers in Human Behavior, 25(3), 738-742. doi: 10.1016/j.chb.2009.01.011 Cheung, G. W., & Rensvold, R. B. (2002). Evaluating goodness-of-fit indexes for testing measurement invariance. Structural Equation Modeling, 9(2), 233-255. doi: 10.1207/S15328007SEM0902_5 Clifford, J. S., Boufal, M. M., & Kurtz, J. E. (2004). Personality Traits and Critical Thinking Skills in College Students Empirical Tests of a Two-Factor Theory. Assessment, 11(2), 169-176. doi: 10.1177/1073191104263250 Cortina, J. M. (1993). What is coefficient alpha? An examination of theory and applications. Journal of applied psychology, 78(1), 98-104. doi: 10.1037/0021-9010.78.1.98 Dwyer, C. P., Hogan, M. J., & Stewart, I. (2012). An evaluation of argument mapping as a method of enhancing critical thinking performance in e-learning environments. Metacognition and Learning, 7(3), 1-26. doi: 10.1007/s11409-012-9092-1 Ennis, R. H. (1996). Critical thinking. Upper Saddle River, NJ: Prentice Hall. Ennis, R. H., Millman, J., & Tomko, T. N. (1985). Cornell Critical Thinking Tests Level X & Level Z: Manual. Boise, ID: Midwest Publications. THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 21 Ennis, R. H., & Weir, E. E. (1985). The Ennis-Weir Critical Thinking Essay Test: An Instrument for Teaching and Testing. Boise, ID: Midwest Publications. Facione, P. A. (1990). The California Critical Thinking Skills Test: College Level. Millbrae, CA: California Academic Press. Facione, P. A. (1998). Critical thinking: What it is and why it counts. Millbrae, CA: California Academic Press. Facione, P. A. (2000). The disposition toward critical thinking: Its character, measurement, and relationship to critical thinking skill. Informal Logic, 20(1), 61-84. Field, A. (2009). Discovering statistics using SPSS. Thousand Oaks, CA: Sage publications. Halpern, D. F. (1998). Teaching critical thinking for transfer across domains: Disposition, skills, structure training, and metacognitive monitoring. American Psychologist, 53(4), 449-455. doi: 10.1037/0003-066X.53.4.449 Halpern, D. F. (2012). Halpern Critical Thinking Assessment: Test Manual. Mödling, Austria: Schuhfried GmbH. Hatcher, D. L. (2011). Which test? Whose scores? Comparing standardized critical thinking tests. New Directions for Institutional Research, 2011(149), 29-39. doi: 10.1002/ir.378 Hau, K. T., Halpern, D. F., Marin-Burkhart, L., Ho, I. T., Ku, K. Y. L., & Chan, N. M. (2006, April). Chinese and United States students’ critical thinking: Cross-cultural construct validation of a critical thinking assessment. Paper presented at the Paper presented at the American Educational Research Association Annual Meeting, San Fransisco, CA. Hupkens, J. (2011, September 14). Veel media trappen in vals wetenschapsnieuws [Media are misled by false science news], nrc.next. Retrieved from http://www.nrcnext.nl Jackson, D. L., Gillaspy Jr, J. A., & Purc-Stephenson, R. (2009). Reporting practices in confirmatory factor analysis: an overview and some recommendations. Psychological methods, 14(1), 6-23. doi: 10.1037/a0014694 Kline, P. (2000). The handbook of psychological testing. London: Routledge. Ku, K. Y. L. (2009). Assessing students’ critical thinking performance: Urging for measurements using multi-response format. Thinking Skills and Creativity, 4(1), 70-76. doi: 10.1016/j.tsc.2009.02.001 Ku, K. Y. L., & Ho, I. T. (2010). Dispositional factors predicting Chinese students’ critical thinking performance. Personality and Individual Differences, 48(1), 54-58. doi: 10.1016/j.paid.2009.08.015 Lievens, F., & Burke, E. (2011). Dealing with the threats inherent in unproctored Internet testing of cognitive ability: Results from a large-scale operational test program. Journal of Occupational & Organizational Psychology, 84(4), 817-824. doi: 10.1348/096317910x522672 THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 22 Marin, L. M., & Halpern, D. F. (2011). Pedagogy for developing critical thinking in adolescents: Explicit instruction produces greatest gains. Thinking Skills and Creativity, 6(1), 1-13. doi: 10.1016/j.tsc.2010.08.002 Marsh, H. W., Hau, K.-T., & Wen, Z. (2004). In search of golden rules: Comment on hypothesistesting approaches to setting cutoff values for fit indexes and dangers in overgeneralizing Hu and Bentler's (1999) findings. Structural Equation Modeling, 11(3), 320-341. doi: 10.1207/s15328007sem1103_2 Martinez, M. E. (1999). Cognition and the question of test item format. Educational Psychologist, 34(4), 207-218. Moseley, D., Baumfield, V., Elliott, J., Higgins, S., Miller, J., Newton, D. P., & Gregson, M. (2005). Frameworks for thinking: A handbook for teaching and learning. Cambridge, UK: Cambridge University Press. Rotherham, A. J., & Willingham, D. T. (2010). 21st century skills the challenges ahead. Educational Leadership, 67(1), 16-21. Sijtsma, K. (2009). On the Use, the Misuse, and the Very Limited Usefulness of Cronbach’s Alpha. Psychometrika, 74(1), 107-120. doi: 10.1007/s11336-008-9101-0 SonomaStateUniversity. (1996). ICAT Critical Thinking Essay Test. Rohnert Park, CA: Sonoma State University. Spector, P. E., Schneider, J. R., Vance, C. A., & Hezlett, S. A. (2000). The relation of cognitive ability and personality traits to assessment center performance. Journal of Applied Social Psychology, 30(7), 1474-1491. doi: 10.1111/j.1559-1816.2000.tb02531.x Stein, B., & Haynes, A. (2011). Engaging faculty in the assessment and improvement of students' critical thinking using the critical thinking assessment test. Change: the magazine of higher learning, 43(2), 44-49. doi: 10.1080/00091383.2011.550254 Sternberg, R. J. (1986). Critical Thinking: Its Nature, Measurement, and Improvement. Washington, DC: National Inst. of Education. Taube, K. T. (1997). Critical thinking ability and disposition as factors of performance on a written critical thinking test. The Journal of General Education, 46(2), 129-164. TilburgUniversity. (2011). Interim Report Regarding the Breach of Scientific Integrity Committed by Prof. D. A. Stapel. Retrieved from http://www.tilburguniversity.edu/nl/nieuws-en- agenda/commissie-levelt/interim-report.pdf. Voogt, J., & Roblin, N. P. (2010). 21st Century Skills: Discussion paper. University of Twente. Retrieved from http://onderzoek.kennisnet.nl/onderzoeken-totaal/21stecentury Voogt, J., & Roblin, N. P. (2012). A comparative analysis of international frameworks for 21st century competences: Implications for national curriculum policies. Journal of Curriculum Studies, 44(3), 299-321. doi: 10.1080/00220272.2012.668938 THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 23 Watson, G., & Glaser, E. M. (1980). Manual for the Watson Glaser critical thinking appraisal. Cleveland, OH: Psychological Corporation. THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 24 Appendix A Corrections of the Dutch HCTA before administration Location Instructie Probleem 1: Deel B Probleem 1: Deel B Incorrect text Corrected text We willen graag begrijpen hoe je denkt We willen graag begrijpen hoe je denkt over complexe dagdagelijkse situaties. over complexe dagelijkse situaties. Je baserend op deze informatie, welk Je baserend op deze informatie, welk van onderstaande stellingen is het van onderstaande stellingen is het meest meest plausibel? aannemelijk? Schoolresultaten zullen waarschijnlijk Schoolresultaten zullen waarschijnlijk verbeteren als we adolescenten verbeteren als we adolescenten verhinderen van te roken, ... (zo ook in verhinderen te roken, ... optie 2 en 4) Situatie en probleem 4 Beide programma's kosten evenveel. Beide programma's kosten evenveel geld. Probleem 4: Deel B Situatie en probleem 5 Situatie en probleem 6 Welk percentage van de deelnemers Welk percentage van de deelnemers weegt binnen het jaar terug evenveel weegt binnen een jaar weer evenveel als als zijn begingewicht? zijn of haar begingewicht? "Zoals men kan afleiden uit de "Zoals men kan afleiden uit de verhoging in gemiddeld resultaat bij de verhoging in gemiddeld resultaat bij de studenten, was dit programma was een studenten, was dit programma een gigantisch succes." gigantisch succes." Als leerlingen in je tekenlessen Als leerlingen in je tekenlessen dezelfde dezelfde tekeningen maken als ze tekeningen maken als ze gemaakt zouden gemaakt hebben als ze thuis zouden hebben als ze thuis waren waren gebleven of niet begeleid gebleven of niet begeleid werden, ... werden, ... Probleem 6: Deel B Leerkrachten zitten vaak reeds voor het Leerkrachten zitten vaak door hun schooljaar ten einde is doorheen hun materiaalvoorraad voor tekenlessen heen materiaalvoorraad voor tekenlessen. voor het schooljaar ten einde is. THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 25 Appendix A (continued) Location Probleem 7: Deel B Incorrect text Corrected text Het gebruik van deze term suggereert Het gebruik van deze term suggereert dat het slachtoffer van mishandeling er dat het slachtoffer van mishandeling er in zekere zin zelf voor in zekere zin zelf voor verantwoordelijk verantwoordelijk is dat hij mishandeld is dat zij mishandeld wordt. wordt. Situatie 8: Deel A Beoordeel de redenering van de Beoordeel de redenering van de minister-president over deze kwestie, minister-president over deze kwestie, gebruik maken van een 7-puntenschaal gebruik makend van een 7-puntenschaal. waarin. Probleem 8: Deel B Welke veronderstelt de baas wanneer Welke veronderstelling maakt de hij deze analogie maakt? minister-president wanneer hij deze analogie maakt? Probleem 9: Deel B Probleem 9: Deel B Situatie en probleem 10 Als de ouders erin slagen in hun opzet Als de ouders slagen in hun opzet en hun en hun voorstel wordt een nieuwe regel voorstel wordt een nieuwe regel in de in de schoolgemeenschap, wat is dan schoolgemeenschap, wat is dan waarschijnlijk het grootste probleem waarschijnlijk het grootste probleem waarmee ze zullen geconfronteerd waar ze mee geconfronteerd zullen worden? worden? Sommige ouders zijn nalatig en leren Sommige ouders zijn nalatig en leren hun kinderen niet van vriendelijk te hun kinderen niet vriendelijk te zijn zijn tegen anderen. tegen anderen. Een politicus werd gevraagd om zijn Een politicus werd gevraagd om zijn standpunt uit te leggen over het standpunt uit te leggen over het wetsvoorstel dat voorziet dat de staat wetsvoorstel dat voorziet dat de staat propere naalden zou geven aan schone naalden zou geven aan drugsverslaafden, om de verspreiding drugsverslaafden, om de verspreiding van ziekten als aids tegen te gaan. Hij van ziekten als aids tegen te gaan. Hij antwoordde dat hij zich verzet tegen antwoordde dat hij zich verzet tegen een een ‘propere naalden’-programma ‘schone naalden’-programma omdat dit omdat dit verkeerd is. verkeerd is. THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 26 Appendix A (continued) Location Probleem 10: Deel B Situatie en probleem 12 Probleem 12: Deel B Situatie 14: Deel A Situatie en probleem 16 Probleem 16: Deel B Probleem 18: Deel B Incorrect text Corrected text Hij heeft niet duidelijk gemaakt of hij Hij heeft niet duidelijk gemaakt of hij voor of tegen een ‘propere naalden’- voor of tegen een ‘schone naalden’- programma is. programma is. Natuurlijk is het geen goede keuze als Natuurlijk is het geen goede keuze als je je schrik hebt voor wiskunde of graag angst hebt voor wiskunde of graag buiten werkt. buiten werkt. Computerwetenschappen is geen goede Computerwetenschappen is geen goede keuze als je schrik hebt voor wiskunde keuze als je angst hebt voor wiskunde Beschrijf het redeneerwijze van de Beschrijf de redeneerwijze van de Immigratiedienst. Immigratiedienst. Ann Marie, een Amerikaanse vrouw, Ann Marie, een Amerikaanse vrouw, wil wilt naar Hollywood verhuizen ... naar Hollywood verhuizen ... De kans dat ze om het even welke at De kans dat een willekeurig random geselecteerde vrouw een geselecteerde vrouw een succesvolle succesvolle actrice zal worden actrice zal worden Welke van de volgende stellingen over Welke van de volgende stellingen over de kans dat om het even welke zes de winkans van een getallenreeks van de nummers de winnende getallen van de Lotto, zijn waar? Lotto zijn, is waar? Probleem 21: Deel B Situatie en probleem 23 De vriendin zou van school kunnen De vriendin zou van school gestuurd gestuurd worden als ze zich zo vaak kunnen worden als ze zich zo vaak blijft blijft bezatten. bezatten. Je maakt een toets in de les Je maakt een toets in de les natuurkunde natuurkunde en je stoot op een en je stuit op een probleem waarvoor je probleem waarvoor je geen antwoord geen antwoord kan bedenken. kan bedenken. THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 27 Appendix A (continued) Location Probleem 23: Deel B Probleem 24: Deel B Incorrect text Corrected text Schrijf in een gemene nota aan de Schrijf een brief aan de leerkracht leerkracht omdat hij zo'n moeilijk waarin je aangeeft dat hij te moeilijke probleem gebruikt. vragen of sommen gebruikt. Laat de pil op de grond liggen en kijk Laat de pil op de grond liggen en kijk of of de hond hem opeet. de hond hem op eet. THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING Appendix B The Dutch HCTA With respect to copyright, only the first five questions are shown. 28 THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 29 Instructie We willen graag begrijpen hoe je denkt over complexe dagelijkse situaties. Alle vragen starten met een korte situatieschets. Nadat je de situatieschets hebt gelezen, krijg je hierover verschillende vragen. Bij sommige vragen moet je zelf een kort antwoord formuleren. Bij andere vragen moet je tussen een aantal alternatieven kiezen. Hier is een voorbeeldvraag waar je zelf een kort antwoord moet formuleren. Voorbeeld van een situatieschets: Na afloop van een televisiedebat over de doodstraf, werden de kijkers aangemoedigd om naar de website van de zender te surfen en online te stemmen of ze "voor" of "tegen" de doodstraf zijn. Binnen het eerste uur "stemden" bijna 1000 mensen op de website, waarbij ongeveer de helft "voor" en de helft "tegen" de doodstraf stemde. Het nieuwsanker van deze zender maakte de resultaten de volgende dag bekend. Hij concludeerde dat de inwoners van het land evenredig verdeeld waren over het al dan niet toepassen van de doodstraf. Hier is een voorbeeldvraag waar je zelf een kort antwoord moet formuleren: Ben je het op basis van deze gegevens eens met de conclusie van het nieuwsanker? ja nee Geef twee suggesties om deze studie te verbeteren: Eerste suggestie: Tweede suggestie: Het antwoord dat bij deze voorbeeldvraag verwacht wordt: Ben je op basis van deze gegevens eens met de conclusie van het nieuwsanker? ja nee Geef twee suggesties om deze studie te verbeteren: Eerste suggestie: Ik zou een steekproef proberen samen te stellen die meer representatief is voor het land - niet alleen mensen die het internet kunnen gebruiken om vragen te beantwoorden. Tweede suggestie: Ik zou de keuze van de kijker niet veralgemeniseren naar de mening van de inwoners van het land. THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 30 Instructie Nu krijg je een voorbeeldvraag waar je moet kiezen tussen de aangeboden alternatieven. Deze voorbeeldvraag gaat over dezelfde situatieschets beschreven op de vorige pagina. Tracht eerst zelf een antwoord op de vraag te formuleren. Denk op basis van de informatie in de situatieschets na over elk van de volgende alternatieven en beslis of het alternatief waar of waarschijnlijk waar is. Kruis alle stellingen aan die juist of wellicht juist zijn. Laat de andere blanco. Veel mensen gingen kort na het einde van de show achter hun computer zitten om te "stemmen". Ongeveer de helft van alle vrouwen en de helft van alle mannen zijn voorstander van de doodstraf. Zowel het standpunt pro als het standpunt contra de doodstraf waren even overtuigend in het debat. Mensen die naar deze show gekeken hebben en vervolgens gestemd hebben op hun computer zijn mogelijk niet representatief voor alle mensen in dit land. Mensen die gestemd hebben, voelen zich waarschijnlijk sterker betrokken bij deze kwestie (in positieve of negatieve zin) dan degenen die niet gestemd hebben. Het antwoord dat bij deze voorbeeldvraag verwacht wordt: Veel mensen gingen kort na het einde van de show achter hun computer zitten om te "stemmen". Dit is niet juist. Verklaring: We weten dat voor elke positie telkens de helft van alle mensen gestemd Ongeveer de helft van alle vrouwen en de helft van alle mannen zijn voorstander van de heeft, maar we weten niets over de proportie vrouwen of mannen die voor elke positie gestemd doodstraf. hebben. Dus kunnen we niet concluderen dat deze stelling waar of waarschijnlijk waar is. Zowel het standpunt pro als het standpunt contra de doodstraf waren even overtuigend in Dit is niet juist. Verklaring: We weten dat voor elke positie telkens de helft van alle mensen gestemd het debat. wetenshow niets over hoe overtuigend posities warengestemd in het debat, omdat er Mensenheeft, diemaar naarwedeze gekeken hebben beide en vervolgens hebben opgeen hun meting was van de positie van de stemmers voor de show werd uitgezonden. Het is mogelijk dat de computer zijn mogelijk niet representatief voor alle mensen in dit land. meeste mensen voorstander waren van één positie, maar dat bijna de helft van hen van mening Mensenveranderde die gestemd waarschijnlijk sterker betrokken bij deze kwestie na hethebben, debat. Dusvoelen kunnenzich we niet concluderen dat het waar of waarschijnlijk waar is dat (in positieve zin) daneven degenen die niet gestemd hebben. het pro-ofennegatieve de contrastandpunt overtuigend waren. THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 31 Instructie Nu weet je wat je verondersteld wordt te doen. Het is de bedoeling dat alle vragen duidelijk zijn. Er zijn geen strikvragen. Denk eraan om je redenering zo kort en duidelijk mogelijk weer te geven. Gelieve niet vooruit te bladeren voor alle vragen zijn beantwoord in het belang van het onderzoek! Er zijn in totaal 25 verschillende situaties. Je mag zolang werken als je wilt. Overhaast je dus niet. THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 32 Situatie 1: Deel A In een tijdschrift voor ouders en leerkrachten verscheen recent een rapport dat duidelijk maakte dat adolescenten die sigaretten roken ook geneigd zijn lage resultaten te halen op school. Naarmate het aantal sigaretten dat per dag gerookt werd toenam, daalde het gemiddelde schoolresultaat. Een suggestie die in dit rapport werd gemaakt, was dat we de schoolprestaties zouden kunnen verbeteren door te verhinderen dat adolescenten roken. Je baserend op deze informatie, zou je dit idee ondersteunen als een manier om de schoolprestaties van rokende adolescenten, te verbeteren? ja nee Leg a.u.b. uit waarom wel of waarom niet. Verklaring: THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 33 Probleem 1: Deel B - Vraag 1 van 1 In een tijdschrift voor ouders en leerkrachten verscheen recent een rapport dat duidelijk maakte dat adolescenten die sigaretten roken ook geneigd zijn lage resultaten te halen op school. Naarmate het aantal sigaretten dat per dag gerookt werd toenam, daalde het gemiddelde schoolresultaat. Een suggestie die in dit rapport werd gemaakt, was dat we de schoolprestaties zouden kunnen verbeteren door te verhinderen dat adolescenten roken. Je baserend op deze informatie, welk van onderstaande stellingen is het meest aannemelijk? Schoolresultaten zullen waarschijnlijk verbeteren als we adolescenten verhinderen te roken, omdat de onderzoekers vaststelden dat als het roken toeneemt, de resultaten dalen. Schoolresultaten zouden kunnen verbeteren als we adolescenten verhinderen te roken, maar we kunnen hier niet zeker van zijn omdat we alleen weten dat de resultaten verslechteren wanneer het roken toeneemt, maar niet wat er gebeurt wanneer het roken vermindert. Je kan niet weten of de schoolresultaten zullen verbeteren als we adolescenten verhinderen te roken, want we weten alleen dat er een verband is tussen roken en schoolresultaten, niet of roken een verandering in schoolresultaten veroorzaakt. Er zal waarschijnlijk geen effect zijn op de schoolresultaten als we adolescenten verhinderen te roken omdat het tijdschrift geschreven is voor ouders en leerkrachten, dus het is waarschijnlijk bevooroordeeld tegen het roken van adolescenten. THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 34 Situatie 2: Deel A Een gerenommeerde krant uit je buurt publiceert verschillende verhalen over criminelen die gruwelijke misdrijven gepleegd hebben nadat ze door de Commissie voor Voorwaardelijke Invrijheidstelling vervroegd werden vrijgelaten uit de gevangenis. Eén boze lezer wil dat alle leden van de Commissie ontslagen worden omwille van de slechte beslissingen die ze nemen. Stel dat jij zou moeten oordelen over het ontslag van de commissieleden, op welke twee vragen zou je dan een antwoord willen zien om een gefundeerde beslissing te kunnen nemen? Eerste vraag: Tweede vraag: THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 35 Probleem 2: Deel B - Vraag 1 van 2 Een gerenommeerde krant uit je buurt publiceert verschillende verhalen over criminelen die gruwelijke misdrijven gepleegd hebben nadat ze door de Commissie voor Voorwaardelijke Invrijheidstelling vervroegd werden vrijgelaten uit de gevangenis. Eén boze lezer wil dat alle leden van de Commissie ontslagen worden omwille van de slechte beslissingen die ze nemen. Hieronder staan enkele vragen die je misschien zou willen stellen om een gefundeerde beslissing te kunnen nemen. Duid voor elke vraag aan hoe belangrijk ze is voor het nemen van je beslissing. Welk percentage van degenen die vrijgelaten worden, pleegt nooit een ander ernstig misdrijf? helemaal van zeer een klein van niet weinig beetje middelmatig heel extreem belangrijk belang belangrijk belang belangrijk belangrijk belangrijk helemaal niet belangrijk Bestaat de Commissie uit links- of rechtsdenkende leden? van zeer een klein van weinig beetje middelmatig heel belang belangrijk belang belangrijk belangrijk extreem belangrijk Heeft iemand van de Commissieleden familieleden die in de gevangenis zitten? helemaal van zeer een klein van niet weinig beetje middelmatig heel extreem belangrijk belang belangrijk belang belangrijk belangrijk belangrijk Welk percentage van vrijgelaten gevangenen die nooit een ander ernstig misdrijf plegen, kennen ze in landen die vergelijkbaar zijn met het onze? helemaal van zeer een klein van niet weinig beetje middelmatig heel extreem belangrijk belang belangrijk belang belangrijk belangrijk belangrijk THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 36 Probleem 2: Deel B - Vraag 2 van 2 Vervolg... Welk soort informatie gebruikt de Commissie om haar beslissingen te nemen? helemaal van zeer een klein van niet weinig beetje middelmatig heel extreem belangrijk belang belangrijk belang belangrijk belangrijk belangrijk helemaal niet belangrijk Zijn de leden van de Commissie politiek benoemd? van zeer een klein van weinig beetje middelmatig heel belang belangrijk belang belangrijk belangrijk extreem belangrijk Heeft iemand van de Commissieleden familieleden die ooit in de gevangenis hebben gezeten? helemaal van zeer een klein van niet weinig beetje middelmatig heel extreem belangrijk belang belangrijk belang belangrijk belangrijk belangrijk THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 37 Situatie 3: Deel A Een kruidenierswinkel is onlangs een gigantische reclamecampagne gestart om haar imago van eerder dure winkel te veranderen in dat van een winkel met lage prijzen. Televisie-, kranten- en radioadvertenties overspoelden de buurt, met als slogan: "De Voedselwereld, kampioen in lage prijzen!". Een maand nadat de reclamecampagne van start ging, werd een studie uitgevoerd in de lokale gemeenschap, waarbij aan de klanten die buitenkwamen bij De Voedselwereld het volgende werd gevraagd: "Welke winkel heeft volgens u de laagste prijzen?" Het onderzoek toonde aan dat meer dan 60% van de respondenten De Voedselwereld als antwoord gaven. De PR-verantwoordelijke rapporteerde overtuigd aan de algemeen directeur van de firma dat de campagne erin geslaagd was om de perceptie die de lokale gemeenschap heeft van De Voedselwereld, te veranderen van "dure supermarkt" in "kampioen in lage prijzen". Als jij de algemeen directeur was van De Voedselwereld, welke twee veranderingen zou jij dan aanbrengen in deze studie om te bepalen of de reclamecampagne heeft gewerkt? Eerste verandering: Tweede verandering: THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 38 Probleem 3: Deel B - Vraag 1 van 1 Een kruidenierswinkel is onlangs een gigantische reclamecampagne gestart om haar imago van eerder dure winkel te veranderen in dat van een winkel met lage prijzen. Televisie-, kranten- en radioadvertenties overspoelden de buurt, met als slogan: "De Voedselwereld, kampioen in lage prijzen!". Een maand nadat de reclamecampagne van start ging, werd een studie uitgevoerd in de lokale gemeenschap, waarbij aan de klanten die buitenkwamen bij De Voedselwereld het volgende werd gevraagd: "Welke winkel heeft volgens u de laagste prijzen?" Het onderzoek toonde aan dat meer dan 60% van de respondenten De Voedselwereld als antwoord gaven. De PR-verantwoordelijke rapporteerde overtuigd aan de algemeen directeur van de firma dat de campagne erin geslaagd was om de perceptie die de lokale gemeenschap heeft van De Voedselwereld, te veranderen van "dure supermarkt" in "kampioen in lage prijzen". Lees elk van de volgende voorstellen. Duid alle voorstellen aan die de studie volgens jou zouden verbeterd hebben. Laat de andere voorstellen blanco. Vraag de klanten of ze graag hun inkopen doen bij De Voedselwereld. Bevraag de klanten voor de advertenties plaatsvinden en bevraag ze nadien opnieuw. Bevraag de klanten alvorens ze de winkel binnengaan en niet wanneer ze hem verlaten. Bevraag ook de klanten die hun inkopen in andere supermarkten doen. Bel willekeurig gekozen mensen uit de buurt op en vraag hen naar de 'kampioen in lage prijzen'. Achterhaal het percentage van mensen uit de buurt die hun inkopen doen in supermarkten. Vraag respondenten of ze de advertenties gehoord of gezien hebben. Vraag de respondenten of ze liever televisie kijken, de krant lezen of naar de radio luisteren. Bevraag de buurt om te bepalen hoeveel mensen de voorkeur geven aan merkproducten. THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 39 Situatie 4: Deel A Je probeert te beslissen welk van twee afslankingsprogramma's het beste is om een zwaarlijvige vriend van je definitief van zijn overgewicht af te helpen. Je beschikt over de brochures van twee programma's die allebei een goede naam hebben. Het eerste programma beweert dat het gemiddelde gewichtsverlies 12 kilo is. Het tweede programma beweert dat het gemiddelde gewichtsverlies 15 kilo is. Beide programma's kosten evenveel geld. Welke twee vragen zou je aan de vertegenwoordigers van elk programma stellen om te bepalen welk programma je zal adviseren aan je vriend? Eerste vraag: Tweede vraag: THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 40 Probleem 4: Deel B - Vraag 1 van 2 Je probeert te beslissen welk van twee afslankingsprogramma's het beste is om een zwaarlijvige vriend van je definitief van zijn overgewicht af te helpen. Je beschikt over de brochures van twee programma's die allebei een goede naam hebben. Het eerste programma beweert dat het gemiddelde gewichtsverlies 12 kilo is. Het tweede programma beweert dat het gemiddelde gewichtsverlies 15 kilo is. Beide programma's kosten evenveel geld. Geef elk van de volgende vragen een score volgens hoe bruikbaar de informatie zou zijn voor je beslissing. Hoeveel mensen volgen uw programma? een klein van beetje middelmatig belangrijk belang belangrijk helemaal niet belangrijk van zeer weinig belang heel belangrijk extreem belangrijk helemaal niet belangrijk Maakt u reclame voor uw programma in de lokale media? van zeer een klein van weinig beetje middelmatig heel belang belangrijk belang belangrijk belangrijk extreem belangrijk helemaal niet belangrijk Wordt het programma onderschreven door een filmster of model? van zeer een klein van weinig beetje middelmatig heel belang belangrijk belang belangrijk belangrijk extreem belangrijk Wat is het gemiddelde gewicht van de deelnemers voor en na het programma? helemaal van zeer een klein van niet weinig beetje middelmatig heel extreem belangrijk belang belangrijk belang belangrijk belangrijk belangrijk THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 41 Probleem 4: Deel B - Vraag 2 van 2 Vervolg... helemaal niet belangrijk Welke soort training of opleiding krijgt het begeleidend personeel? van zeer een klein van weinig beetje middelmatig heel belang belangrijk belang belangrijk belangrijk extreem belangrijk Hoeveel deelnemers stoppen met het programma voor ze het voltooid hebben? helemaal van zeer een klein van niet weinig beetje middelmatig heel extreem belangrijk belang belangrijk belang belangrijk belangrijk belangrijk Welk percentage van de deelnemers weegt binnen een jaar weer evenveel als zijn of haar begingewicht? helemaal van zeer een klein van niet weinig beetje middelmatig heel extreem belangrijk belang belangrijk belang belangrijk belangrijk belangrijk THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 42 Situatie 5: Deel A Een grote universiteit in de VS heeft het moeilijk om studenten uit een bepaald deel van de bevolking aan te trekken en te behouden. Er werd een 'Ga voor de onderscheiding!'-programma ontworpen om het gemiddelde resultaat van deze risicostudenten te verhogen zodat er meer van hen een diploma zouden behalen. Een groot 'Ga voor de onderscheiding'-symbool werd uitgestald bij de dienst waar deze studenten geholpen worden. De studenten kregen ook elk trimester een nieuwsbrief toegezonden vol studietips, verhalen over succesvolle studenten en een groot 'Ga voor de onderscheiding'-logo. Na één jaar werd vastgesteld dat het gemiddelde resultaat van de risicostudenten .2 hoger was dan dat van de studenten die het jaar voordien als risicostudenten geïdentificeerd waren. De directeur van het 'Ga voor de onderscheiding'-programma zei: "Zoals men kan afleiden uit de verhoging in gemiddeld resultaat bij de studenten, was dit programma een gigantisch succes." Welke informatie uit de situatiebeschrijving ondersteunt het sterkst de bewering van de directeur? Welke informatie uit de situatiebeschrijving weerlegt het sterkst de bewering van de directeur? THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 43 Probleem 5: Deel B - Vraag 1 van 2 Een grote universiteit in de VS heeft het moeilijk om studenten uit een bepaald deel van de bevolking aan te trekken en te behouden. Er werd een 'Ga voor de onderscheiding!'-programma ontworpen om het gemiddelde resultaat van deze risicostudenten te verhogen zodat er meer van hen een diploma zouden behalen. Een groot 'Ga voor de onderscheiding'-symbool werd uitgestald bij de dienst waar deze studenten geholpen worden. De studenten kregen ook elk trimester een nieuwsbrief toegezonden vol studietips, verhalen over succesvolle studenten en een groot 'Ga voor de onderscheiding'-logo. Na één jaar werd vastgesteld dat het gemiddelde resultaat van de risicostudenten .2 hoger was dan dat van de studenten die het jaar voordien als risicostudenten geïdentificeerd waren. De directeur van het 'Ga voor de onderscheiding'-programma zei: "Zoals men kan afleiden uit de verhoging in gemiddeld resultaat bij de studenten, was dit programma een gigantisch succes." Geef voor elk van de volgende stellingen aan of de stelling de bewering van de directeur ondersteunt, de bewering van de directeur afzwakt of niet relevant is voor de bewering van de directeur. De directeur behaalde nooit een universitair diploma. ondersteunt de zwakt de is niet relevant stelling stelling af voor de stelling In interviews die volgden, beweerden studenten dat ze gemotiveerd werden door het 'Ga voor het onderscheiding'-programma. ondersteunt de zwakt de is niet relevant stelling stelling af voor de stelling Door de nadruk die gelegd werd op academische prestaties, spraken de studiebegeleiders van de dienst de studenten vaker aan over hun academische vooruitgang. ondersteunt de zwakt de is niet relevant stelling stelling af voor de stelling THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 44 Probleem 5: Deel B - Vraag 2 van 2 Vervolg... Het programma werd gesteund door de rector van de universiteit. ondersteunt de zwakt de is niet relevant stelling stelling af voor de stelling ondersteunt de stelling Er was een verbetering van .2 voor alle studenten. zwakt de is niet relevant stelling af voor de stelling Het gemiddelde resultaat van de risicostudenten van het vorige jaar was het laagste in vijf jaar. ondersteunt de zwakt de is niet relevant stelling stelling af voor de stelling De directeur hield geen rekening met het aantal studenten uit het programma dat het jaar daarop terugkeerde naar de universiteit. ondersteunt de zwakt de is niet relevant stelling stelling af voor de stelling ondersteunt de stelling Veel oud-studenten moedigden het programma aan. zwakt de is niet relevant stelling af voor de stelling THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING With respect to copyright, the remainder of the test is not shown. 45 THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 46 Appendix C The Dutch Real World Outcomes inventory (RWO-NL) with response frequencies Item Percentage Percentage who who made experienced the decision outcome Heb je, of ben je in de afgelopen 6 maanden … 1a) Een boek geleend bij de bibliotheek? 43.5 b) Een boek geleend bij de bibliotheek zonder het te lezen? 45.2 c) Een boete moeten betalen, omdat je een geleend boek te laat 24.0 inleverde? 2a) Nieuwe kleding of schoenen gekocht? b) Nieuwe kleding of schoenen gekocht die je nooit hebt 96.7 31.2 gedragen? 3a) Boodschappen gedaan? b) Boodschappen weggegooid, omdat het over datum was? 4a) Zelf je was gedaan? b) Je kleding beschadigd, omdat je de wasinstructie op het label 99.6 77.7 68.2 12.3 niet had opgevolgd? 5a) Een opleiding gevolgd? b) Een les of college gemist, omdat je door de wekker heen was 97.5 30.5 geslapen of was vergeten om een wekker te zetten? c) Een hele nacht doorgewerkt om huiswerk af te maken of een 33.5 toets voor te bereiden? d) Een school- of studieopdracht vergeten te maken? 22.3 e) Vergeten dat je een toets of tentamen had en daar op de dag zelf 3.9 achter kwam? f) Een dag weggestuurd of geschorst van school of van je 24.9 opleiding om welke reden dan ook? 6a) Je verslapen waardoor je ergens te laat voor kwam? 40.2 7a) Een (bij)baan gehad? b) Na een week ontslag genomen van een (bij)baan? 2.8 c) Ontslag genomen zonder dit minstens twee weken van tevoren 6.9 60.7 aan te geven? 8a) Op een fiets gereden? 94.6 b) Een valpartij met de fiets gehad? 19.9 c) Een boete gekregen in het verkeer met je fiets? 3.1 9a) Op een brommer of scooter gereden? b) Een opgevoerde brommer of scooter gehad? 11.7 32.1 THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 47 Appendix C (continued) Item Percentage Percentage who who made experienced the decision outcome Heb je, of ben je in de afgelopen 6 maanden … c) Een valpartij met de brommer of scooter gehad? 3.6 d) Een boete gekregen in het verkeer met je brommer of scooter? .0 10a) In een auto gereden? b) Beschuldigd van het veroorzaken van een auto-ongeluk? 1.0 c) Parkeerboetes gekregen? 8.7 d) Boetes voor te hard rijden gekregen? 14.6 e) Meer dan 10 minuten lang verdwaald geweest of de verkeerde 39.8 86.2 weg gereden met de auto? f) De autosleutels achtergelaten in je auto? 11a) Een rijbewijs gehad? b) Een rijbewijs gehad dat werd ingenomen door de politie? 12a) Een auto gekocht? b) Minstens €400,- moeten betalen voor een reparatie aan een auto 4.4 75.3 .0 6.3 13.3 die je minder dan een half jaar in je bezit had? 13a) Met het vliegtuig gereisd? b) Een vlucht gemist van een vliegtuig? 14a) De trein of de bus genomen? b) De verkeerde trein of bus genomen? 15a) Een identiteitsbewijs (rijbewijs, paspoort, ID-kaart) in je bezit 33.1 6.3 93.7 21.0 97.9 gehad? b) Een identiteitsbewijs moeten vervangen omdat je het kwijt was 3.4 geraakt? 16a) In een gehuurde woning of kamer gewoond? b) Uit een gehuurde woning of kamer gezet? 17a) Een eigen huissleutel gehad? b) Een huissleutel moeten laten bijmaken, omdat je de sleutel was 72.0 7.0 96.2 5.7 verloren? c) Jezelf buiten je huis gesloten? 16.1 d) Per ongeluk de voordeur niet op slot gedaan? 16.5 18a) Rekeningen voor elektriciteit, internet, telefoon, gas of water 58.6 moeten betalen? b) Elektriciteit, internet, telefoon, gas of water niet op tijd betaald waardoor je een betalingsherinnering hebt ontvangen? 12.1 THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 48 Appendix C (continued) Item Percentage Percentage who who made experienced the decision outcome Heb je, of ben je in de afgelopen 6 maanden … c) Elektriciteit, internet, telefoon, gas of water niet op tijd betaald 2.1 waardoor je een brief (aanmaning) van een incassobureau hebt ontvangen? d) Elektriciteit, internet, telefoon, gas of water niet op tijd betaald 1,4 waardoor iets werd afgesloten? 19a) Een lening gehad of iets op afbetaling gekocht? b) Een aflossing van je lening of afbetaling te laat betaald waardoor je 17.6 14.3 een betalingsherinnering hebt ontvangen? c) Een aflossing van je lening of afbetaling te laat betaald waardoor je 7.1 een brief (aanmaning) van een incassobureau hebt ontvangen? 20a) Huur of hypotheek moeten betalen? b) De huur of hypotheek te laat betaald, waardoor je een 51.9 10.5 betalingsherinnering hebt ontvangen? c) De huur of hypotheek te laat betaald, waardoor je een brief 1.6 (aanmaning) van een incassobureau hebt ontvangen? 21a) Een kaartje voor een loterij gekocht? 14.2 22a) Een betaalpas (PIN-pas) gebruikt? b) Langer dan twee maanden rood gestaan? 7.1 c) Niet meer kunnen pinnen aan de kassa omdat je je limiet had 14.2 94.6 bereikt? 23a) Een mobiele telefoon gehad? 99.6 b) Een mobiele telefoon verloren? 6.3 c) Minimaal drie keer buiten je mobiele telefoon bundel gebeld? 26.5 24a) Een credit card gehad? b) Meer dan €4000,- schuld gehad op een credit card? 25a) Geld ingezet bij een gokspel (bijvoorbeeld bij een gokkast, in een 21.8 1.9 15.9 casino of een online spel)? b) Meer dan €250,- verloren bij het gokken? 26a) Naar een café, restaurant of hotel geweest? b) Naar een café, restaurant of hotel geweest en daar vervolgens 10.5 97.1 2.6 uitgezet door iemand die daar werkte? 27a) Iemand meer dan €40,- geleend? b) Iemand meer dan €40,- geleend en het niet meer teruggekregen? 31.8 13.2 THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 49 Appendix C (continued) Item Percentage Percentage who who made experienced the decision outcome Heb je, of ben je in de afgelopen 6 maanden … 28a) Meer dan €40,- van iemand geleend? b) Meer dan €40,- van iemand geleend en dit nooit terugbetaald? 29a) Een relatie gehad? b) Een relatie verbroken? 30a) Met iemand naar bed geweest? b) Een geslachtsziekte (SOA) opgelopen? 2.3 c) Zelf een ongeplande zwangerschap gehad of iemand per ongeluk .0 18.8 2.2 67.4 21.1 72.4 zwanger gemaakt? 31a) Een relatie van minstens 1 jaar gehad? b) Vreemd gegaan in een relatie die al langer dan een jaar duurde? 32a) Een condoom gebruikt tijdens seks? b) Een condoom gebruikt dat brak, scheurde of afgleed tijdens seks? 33a) Een alcoholische drank gedronken? b) Zo veel alcohol gedronken dat je moest overgeven? c) Een boete gekregen voor rijden onder invloed? 34a) In de zon gezeten? b) Flink verbrand door de zon? 35a) Een product gekocht via een thuiswinkelprogramma op de 54.0 4.7 51.5 15.5 95.0 33.5 .0 88.3 30.3 1.7 televisie? b) Een product gekocht via een thuiswinkelprogramma op de televisie 50.0 zonder vooraf informatie te lezen over de effectiviteit van dit product? 36a) Je horoscoop gelezen? 59.4 b) Je horoscoop gelezen en geconcludeerd dat het klopte? 37a) Een nacht in een politiecel gezeten om welke reden dan ook? 38a) Verzeild geraakt in een gevecht of schreeuwende ruzie? 19.7 39a) Een verjaardag vergeten van een vriend(in) of naast familielid en 30.5 40.8 .4 daar pas de volgende dag of later achter gekomen? 40a) Overgewicht gehad waardoor je gezondheidsproblemen kreeg 2.9 (bijvoorbeeld kortademigheid, diabetes type 2, hartklachten, hoge bloeddruk)? 41a) Iets gebroken omdat je viel, uitgleed of je verstapte? 7.9 THE HCTA: TOWARDS A DUTCH APPRAISAL OF CRITICAL THINKING 50 Appendix C (continued) Item Percentage Percentage who who made experienced the decision outcome Heb je, of ben je in de afgelopen 6 maanden … 42a) Iets dat geluk brengt in je bezit gehad (bijvoorbeeld een 34.3 konijnenpootje, gelukspoppetje, etc.)? 43a) Betaald voor een gesprek met een helderziende of medium 2.1 (persoonlijk of via de telefoon)? 44a) Een dieet gevolgd waar je snel van af zou vallen? b) Na afloop van een dieet weer aangekomen, waardoor je uiteindelijk 15.5 56.8 weer op je oorspronkelijke gewicht zat? 45a) Iets via Marktplaats gekocht? 24.3 b) Vooraf betaald voor iets via Markplaats maar niets gekregen? 5.2 46a) Natuurgeneesmiddelen gekocht die het geheugen of het denken 9.2 verbeteren? 47a) Iets met genezende kracht in je bezit gehad (bijvoorbeeld 4.6 genezende kristallen, magnetische armbanden, mystieke stenen, etc.)? 48a) Een kettingmail of –brief ontvangen? b) Een kettingmail of –brief doorgestuurd? 49a) Een abonnement afgesloten (bijvoorbeeld voor een tijdschrift, 48.5 11.2 31.0 krant, telefoon, etc.)? b) Een abonnement afgesloten (bijvoorbeeld voor een tijdschrift, 12.2 krant, telefoon, etc.) waar je na een tijdje vanaf wilde, maar waar je voor langere tijd aan vast bleek te zitten? 50a) Ingegaan op een aanbod van een verkoper op straat of aan de deur 2.1 (met uitzondering van goede doelen)? b) Ingegaan op een aanbod van een verkoper op straat of aan de deur 20.0 (met uitzondering van goede doelen) waar je later spijt van had? Note: Item nonresponse is not included in the calculation of the percentage of decisions or the percentage of experienced outcome.