Covarying collexemes in the Korean Auxiliary Verb, -e/a twu- and –e/a nohBumyong Choi University of Hawaii bumyong@hawaii.edu Collocation, Construction, and Collostruction Collocation (연어) disregard syntactic structure • “word that occur with a frequency that is significantly above chance-level in a given span around the node word” e.g.,) Collocations of auxiliary verb 두- (+/- 4어절 span): 어, 아, 고, ㄴ, 었, 하, 에, 을, 를, 는… (http://rocker.snu.ac.kr:8080/search 세종말뭉치검색기) • If we can identify collocations of an auxiliary verb construction – 어 두-: • 내버리, 남기, 넣, 세우, 쌓, 접, 묻, 숨기, 모으, 제치… (Choi, forthcoming) provide finer-grain analysis Collostruction (연구문) • starts with a particular construction and investigates which lexemes are strongly attracted or repelled by a particular slot in the construction” Collocation of words and syntactic structure Collostructional analysis Collexeme analysis (Stefanowitsch & Grise 2003) • measures the degree of attraction/repulsion of a lemma to a slot in one particular construction • –어 두-: 내버리, 남기, 넣, 세우, …… Distinctive collexeme analysis (Gries & Stefanowitsch 2004) • measures the preference of a lemma to one particular construction over another, functionally similar construction • -어 두-: 내버리, 놓, 보, 남기, 알, ….. • -어 놓-: 내리, 내, 털, 올리, 늘, …… Covarying collexeme analysis (Stefanowitsch & Gries 2005) • measures the degree of attraction of lemmas in one slot of a construction to lemmas in another slot of the same construction • slot1-어 두(놓)-slot2: collocation between slot1 and slot2 Covarying collexeme analysis (CCA) It measure strength of association between V1stem and V2suffix in a particular auxiliary verb construction (-어 두/놓- 구문). [slot1] 어두[slot2] The distribution of cechi- and –ko in the –e/a twu- construction -ko “and” other suffix Column total ceychi “clear away” 45 (9) 8 (44) 53 other verbs 711 (747) 3622 (3586) 4333 Row total 756 3630 4386 Fisher’s exact test (statistical probability of error) p=3.11E-26 ( the association between ceychi and the conjunctive suffix –ko is very strong ) Transform p value to Log10-value : 25.6 Why CCA for Korean AVCs? No studies focus either on the suffixes of V2 or on the interaction between V1 and suffixes of V2. • [V1stem]-e [V2stem]+[V2suffixes] (1) The earlier discussion on AVCs mainly focus on the semantic and syntactic features of V2(stem), or covers the qualities and features of V1(stem) (Sohn, 1999; Kang, 2006) (2) The role of V2(suffix) is disregarded or marginally considered. 수미가 예뻐 놔서(*둬서), 모든 남자들이 만나고 싶어 했다. Most data are from researcher’s creation or based on their intuition • Some studies are based on real language use in corpus data (Kang, 1996; Ho, 2003; Strauss 2002) but very few studies on quantitative analysis of V1-e V2 constructions (Park, 2003) Purpose of this study To investigate whether there are interaction between V1 and suffixes of V2 in a particular Korean AVC (i.e. –어 두- and -어 놓-) To identify certain grammatical units (or conventionalized forms) from the target AVC which consist of a certain main verb and a suffix. To examine how the distinctive semantic features of two auxiliary verbs, -어 두- and –어 놓- manifest in the choice of the main verbs and suffixes of the target AVC using corpusbased analysis Korean Auxiliary Verb Constructions, –어 두다 and –어 놓다 Korean Auxiliary verb construction(AVC)s • Developed from the corresponding main verbs through syntactic and semantic changes (i.e. grammaticalization) • SVCAVC (Oh, 1998; Rhee, 1996; Sohn, 1999; You, 1996) When –어 두 and –어 놓 is used as SVC • Both verbs have a semantic feature of “placement” • 존이 컵을 찬장에 올려 두었다 / 존이 컵을 찬장에 올려 놓았다. • -어 두- has a semantic features of “preservation” When –어 두 and –어 놓 is used as AVC • Both verbs have a semantic feature of “completion” and “maintaining the result”. • 존이 숙제를 해 놓았다. / 존이 숙제를 해 두었다. • 어 두 has a semantic feature of “preparedness”. Method Corpus: Sejong SEM-tagged corpus • 13,000,000 ecel • Semantic & Part-of-Speech Tagged corpus Procedure and Tools • Extract target constructions: “Hanmaru” • “두/vx” or “놓/vx” (vx: auxilairy verb, vv: verb) • “두”: 4238 tokens / “놓”: 9715 tokens • Modify the extracted data secondary corpus • Extract “collexeme” (“main verbs and suffixes.”): • “TEXTSTAT2.1” using “Regular Expression” Covarying Collexeme Analysis (Running statistics): “R” with the script “Coll.Analysis 3.1” Sejong Sem-tagged corpus First extracted data with Hanmaru Modified secondary corpus Second extracted data with Textstat 2.1 Result: Covarying collexeme of –어 두-and –어 놓- 구문 -어 두- 구문 coll.strength 제쳐 두고 25.859 남겨 두고 19.682 알아 둬야 12.051 세워 둔 10.054 해 두자 9.041 모아 둔 9.008 밝혀 둔다 8.563 말해 두지만 7.796 내버려 두지 7.629 접어 두고 7.519 믿어 두고서 6.002 해 둬야 5.61 쌓아 둔 5.495 말해 두거니와 5.477 내버려 둬 5.28 숨겨 둔 4.989 덥어 두기 4.716 강조해 두고자 4.548 묶어 두려 4.196 덥어 두려 4.079 -어 놓-구문 coll.strength 빼 놓을 25.653 드러내 놓고 12.47 바꿔 놓을 11.886 앉혀 놓고 11.129 불러 놓고 10.475 말해 놓고 10.448 세워 놓고 10.35 제쳐 놓고 9.149 파 놓은 8.382 되어 놔서 8.243 시켜 놓고 8.183 옮겨 놓으면서 8.085 이뤄 놓은 7.846 끝내 놓고 7.7 바꿔 놓는 7.387 제쳐 놓더라도 6.966 정해 놓고 6.723 쏟아 놓는 5.64 내려 놓으시 5.539 옮겨 놓다가 5.363 coll.strength>4 p<0.0001 Result: Covarying collexeme of –어 두-and –어 놓- 구문 -어 두- 구문 coll.strength 제쳐 두고 25.859 남겨 두고 19.682 알아 둬야 12.051 세워 둔 10.054 해 두자 9.041 모아 둔 9.008 밝혀 둔다 8.563 말해 두지만 7.796 내버려 두지 7.629 접어 두고 7.519 믿어 두고서 6.002 해 둬야 5.61 쌓아 둔 5.495 말해 두거니와 5.477 내버려 둬 5.28 숨겨 둔 4.989 덥어 두기 4.716 강조해 두고자 4.548 묶어 두려 4.196 덥어 두려 4.079 -어 놓-구문 coll.strength 빼 놓을 25.653 드러내 놓고 12.47 바꿔 놓을 11.886 앉혀 놓고 11.129 불러 놓고 10.475 말해 놓고 10.448 세워 놓고 10.35 제쳐 놓고 9.149 파 놓은 8.382 되어 놔서 8.243 시켜 놓고 8.183 옮겨 놓으면서 8.085 이뤄 놓은 7.846 끝내 놓고 7.7 바꿔 놓는 7.387 제쳐 놓더라도 6.966 정해 놓고 6.723 쏟아 놓는 5.64 내려 놓으시 5.539 옮겨 놓다가 5.363 coll.strength>4 p<0.0001 -어두고: 제쳐두고, 남겨두고, 접어두고 Suffix-고: connect two events AVC-어 두: preparedness “예비성” Main Verb 제치다, 남기다, 접다: separation “대상물에 대한 분리” • “ 그 선수는 골키퍼를 제치고 골을 넣었다.” 주어가 목적어를 분리 • “배가 불러서 밥을 남겼다” 전체에서 부분의 분리 • “대통령이 되고자 하는 생각을 접었다.” 상황의 중단 제쳐두고, 남겨두고, 접어두고: exclusiveness “제외/제거” • “나는 방학이 되면 공부는 제쳐두고 신발공장에서 아르바이트를 하며…” • • ( 주로 일과 관련된 목적어) 조선 성종 때 윤석보 군수는 부인을 남겨 두고 임지로 떠났다. ( 주로 사람과 단체) Note: 남겨두고 있다(19): 절차, 일정을 vs 남기고 있다: 글, 기록을 내일 만나면 그런 핑계는 접어두고 우리 솔직한 얘기만 하자. (문제, 불만, 기쁨 등 추상명사) -어둔: 세워둔, 모아둔, 쌓아둔, 숨겨둔 Suffix ‘-ㄴ’: past tense noun modifying form SVC /AVC–어 두: “preservation” Main Verb 세우다, 모으다, 쌓다, 숨기다: 대상물의 위치 변화와 관련 세워둔, 모아둔, 쌓아둔, 숨겨둔: “대상물의 위치를 바꿔 preserve 한” 대상물이 해당동사와 직접 관련이 있는 구체물 • • • • 세워둔 차량, 세워둔 채 모아둔 돈 쌓아둔 볏집, 짚단 숨겨둔 재산, 돈 Perception verbs+어두:알아두어야, 알아둘, 확인해두어야 Perception verbs: “-어 두-” 와 “-어 놓-”의 distinctive collexeme • 두-놓: 알아 (111-8), 익혀 (22-2), 확인해(13-1)) 주로 deontic meaning으로 사용 • 알아두어야(27), 확인해두어야: -어야 (당위) • 알아둘 (필요) • 알아둘 필요가 있다 • 익혀두는 (선호) • 익혀 두는 것이 좋다/낫다/바람직하다 V1의 의미적 특성이 전체 구문의 의미적 특성에 영향을 받고 결과적으로 구문구조에 제약을 갖게 됨 Communication verbs + 어 두: 밝혀 둔다, 말해 두지만, (밝혀 두고자, 강조해 두고자) 밝혀 둔다(12): “to express”(11), “to light”(1) • [ ]ㅁ을 밝혀둔다 (8) • “대부분 가명을 사용하였음을 밝혀둔다” 밝혀두고자(3)와 강조해 두고자(3) • [ ]ㅁ을 밝혀/강조해두고자 한다 • “강력히 투쟁해 갈 것임을 분명히 밝혀 두고자 한다” 특정한 화용적 상황에서 사용되고 있으며 이들 모두 plain style ending으로 사용되고 있다. (formal writing format) 말해 두지만(5) • “미리 말해 두지만(4)”, “분명히 말해 두지만(1)”과 같이 하나의 고정된 표현으로 사용. -어 놓을:빼 놓을, 바꿔 놓을, (뒤바꿔 놓을) 빼 놓을(24/47), • 빼 놓을 수 없- (22): 없는(18), 없다(4) • “또 하나 그녀의 얼굴 중에서 빼 놓을 수 없는 것이 보조개” • “초등학교시절, 기억에 남는 일 가운데 가을 운동회를 빼 놓을 수 없다.” 바꿔 놓을(27/221) 뒤바꿔 놓을 (6/23) • 바꿔 놓을 “수/것/터/줄” • “바꿔 놓을 수 있다” • 누군가의 사소한 행동 하나가 인류의 미래를 바꾸어 놓을 수도 있는 • 것이다. 경영자의 하나의 결단이 기업의 미래를 완전히 뒤바꿔 놓을 수도 있다. 어 놓고: 드러내, 앉히, 부르, 말하, 세우, 제치, 시키, 끝내, 정하 두 사건의 순차적 연결: 앉혀놓고, 불러놓고, 말해놓고, 세워놓고, 시켜놓고, 끝내놓고, 정해놓고 • 두다(preservation), 놓다(placement)의 원형적 의미의 차이가 반영 • ‘두다’가 가지는 “preservation”의 의미가 연결어미 ‘-고’와 연결시 단순한 쓰임 이상의 의미를 부여 제쳐두고 vs. 제쳐놓고, 제쳐놓더라도 • “앞뒤 문맥은 제쳐놓고(두고) 문장 하나를 뚝 떼어 가지고” 드러내 놓고: lexicalization • “군은 잘못을 드러내 놓고 용서를 구할 때 국민의 신뢰를 얻을 것이다.” • “북한이 영변에서 드러내 놓고 고폭실험을 한 흔적을 남기고…” • “덮어 놓고”, “대 놓고” Violation of selectional restriction: 자동사/형용사의 경우 Selectional restriction (-어 두-, -어 놓-): V1 = transitive verb 자동사: 되어 놔서 • 워낙 낮게 지은 집이 되어 놔서 천정도 답답할 정도로 낮았다. (원인) 형용사 • • • • “이렇게 늦어 놓고서도 비 핑계나 대고” (양보) “거기다 책마다 얘기가 달라 놔서” (원인) “요즘엔 주변에 이혼하는 사람들이 하도 많아 놔서” (원인) “날씨가 워낙 추어 놓으니 아이들도 소풍이고 뭐고 집에 가기를 좋아했다.” (원인) -어 두-는 자동사와 형용사 결합이 거의 나타나지 않음 (1회) • “왜 미리 친해 두지 그랬어?” (“예비성”의 강화) Summary In the Korean AVC, main verbs and the suffixes of auxiliary verbs interact each other in some ways. CCA can be used to detect grammatical units and direction to grammaticalization/lexicalization. (e.g., 제쳐두고, 말해 두지만, 빼 놓을 수 없는 것이, 드러내 놓고…) CCA shows that the selection of the main verb and suffixes of the auxiliary verb are closely related to the prototype meaning of the auxiliary verb. (제쳐두고, 남겨두고, 접어두고 / 앉혀두고, 불러두고, 모아두고, 시켜두고…) With the suffixes such as –어서 and -으니 “since,” the selectional restriction of main verb in an AVC can be unconfined. (많아 놔서, 추워 놓으니) Pedagogical Implication CCA can be used to detect conventionalized expressions or emergenting grammatical units. • Other AVC, SVC • 명사구 보문 구문: Vㄴ/ㄹ/는+의존명사/명사+조사 • 기타: N1적인 N2, V1도록 V2 Teaching Korean AVCs: -어 두- and –어 놓- construction • Teaching as a chunk: “만사 제쳐 두고,” “미리 말해 두지만”, “~중에 빼 놓을 수 없는 것은 ~이다”, “드러내 놓고”… • Some expressions are not fixed but still shows preference in the choice of lexeme. Use them as examples in developing teaching material. (차를 세워둔 채, 숨겨둔 돈을, 아들을 앉혀놓고 이야기를 시작했다, 자장면을 시켜놓고 전화를 걸었다) Thank you References Choe, H. (1965). Urimalpon (Our Grammar). Seoul: Cengumsa. Choi, S. (2003). Serial verbs and the empty category. Paper presented at the Proceedings o f the workshop on Multi-Verb constructions, Norwegian University of Science and Technolo gy, Trondheim. Jang, M.-r. (2000). Hankwuke poco yongenui sangcek yangthaycek uimi kinungkwa thongs acek thukcing (The aspectual & modal meaning of Korean auxiliary verbs and their syntacti c properties). Paytalmal, 38, 33-59 Lee, H.-S. (2001). kwukeui sang cheykyeywa poco yongenui sangcek uimi (On the aspectual system and aspectual meaning of auxiliary verbs in Korean). kwunehak, 38, 209-253. Lee, K.-D. (1979). cotongsa 'nohta'ui uimi yenku (A study of the Korean auxiliary verb 'noht a'). Hangul, 163, 465-496. Lee, K.-D. (1993). A Korean Grammar on Semantic-Pragmatic Principles. Seoul: Hankwu kmwunhwasa. Martin, S. E. (1992). A reference grammar of Korean : a complete guide to the grammar a nd history of the Korean language (1st ed.). Rutland, Vt. ; Tokyo: C.E. Tuttle. Oh, S.-s. (1998). A syntactic and semantic study of Korena auxiliaries: a grammarticaliza tion perspective. University of Hawaii, Honolulu, HI. Rhee, S. (1996). Semantics of Verbs and Grammaticalization: The Development in Korean from a Cross-linguistics Perspective. University of Texas at Austin Sohn, H.-M. (1999). The Korean language. Cambridge, U.K. ; New York: Cambridge Univer sity Press. Sohn, S. (1994). poco yongenui uimiey kwanhan yenku (A study of the meaning auxiliary pr edicate). Hangul, 223(107-223). Stefanowitsch, A., & Gries, S. T. (2003). Collostructions: Investigating the interaction betwe en words and constructions. International Journal of Corpus Linguistics, 8(2), 209-243. You, S.-H. (1996). Argument licensing in complex verbal constructions in Korean. Unpubli shed Ph.D., University of Hawai'i, United States -- Hawaii. Semantic features of 두다 and 놓다 Shared semantic features of 두다 and 놓다 The distinctive meaning of 두다 • “movement and placement of the patient” • ‘to place something where under agent’s control’ (Lee 1993) • Focus is on the goal argument: ‘to place something for future use or with agent’s intention’ (e.g., 컵을 찬장에 두다) • ‘to keep’ 보유하다 Prototype meaning The distinctive meanings of 놓다 • ‘to release something’ (out of agent’s control) (Lee 1993; Jung 2007) (e.g., 컵을 손에서 놓다) • Focus is on the source argument Prototype meaning ‘to release’ 벗어나게 하다 • ‘to place something onto a place’ (with the goal argument) • Focus is on the goal argument (e.g., 컵을 책상 위에 놓다) ‘to place’ 있게 하다. Extended meaning Result: Covarying collexeme of –어 두- construction -e twu제쳐 두고 남겨 두고 알아 둬야 세워 둔 해 두자 모아 둔 밝혀 둔다 말해 두지만 내버려 두지 접어 두고 해 두어야 쌓아 둔 내버려 둬 숨겨 둔 덥어 두기 묶어 두려 덥어 두려 묶어 둘 알아 둘 받아 두었 # of main verb 53 257 111 120 199 89 42 41 287 72 199 87 287 69 76 71 76 71 111 20 # of suffix 756 756 206 772 33 772 133 10 147 756 206 772 52 772 133 14 14 241 241 750 joint feq 45 107 27 52 13 41 12 5 30 33 26 34 14 28 11 4 4 13 17 11 log10 -value 25.859 19.682 12.051 10.054 9.041 9.008 8.563 7.796 7.629 7.519 6.002 5.61 5.495 5.477 5.28 4.989 4.716 4.548 4.196 4.079 Result: Covarying collexeme of –어 놓- construction -e twu빼 놓을 드러내 놓고 바꿔 놓을 앉혀 놓고 불러 놓고 말해 놓고 세워 놓고 제쳐 놓고 파 놓은 돼 놔서 시켜 놓고 옮겨 놓으면서 이뤄 놓은 끝내 놓고 바꿔 놓는 제쳐 놓더라도 정해 놓고 쏟아 놓는 내려 놓으시 옮겨 놓다가 # of main verb 47 78 201 87 44 63 256 70 42 6 45 175 28 17 201 70 120 76 23 175 # of suffix 236 3229 236 3229 3229 3229 3229 3229 2172 42 3229 16 2172 3229 325 7 3229 325 41 7 joint feq 24 59 27 62 37 48 141 50 28 4 35 7 21 17 25 4 70 13 4 4 log10 -value 25.653 12.47 11.886 11.129 10.475 10.448 10.35 9.149 8.382 8.243 8.183 8.085 7.846 7.7 7.387 6.966 6.723 5.64 5.539 5.363