Introduction to UNICODE (ஒருங்குறி) T.N.C.Venkata Rangan, Blog: www.venkatarangan.com Introduction • Computers at their most basic level just deal with numbers. They store letters, numerals and other characters by assigning a number for each one. • In the pre-Unicode environment, we had single 8-bit characters sets, which limited us to 256 characters max. No single encoding could contain enough characters to cover all the languages. • So hundreds of different encoding systems were developed for assigning numbers to characters. குறியாக்க (Encoding ) முறற: • ஆஸ்கி முறை (ASCII - American standard code for Information Interchange) • இஸ்கி (ISCII ) • தகுதரம் (திஸ்கி) (TSCII) • டேம் (TAM), டேப் (TAB) – Govt. of Tamilnadu • ஒருங்குறி குறியாக்க முறற (Unicode Encoding) Universal Character Encoding Linguistic Diversity in India • According to Census 2001 India has 122 major languages and 2371 dialects • One Language –many script • Many Language –one script • Out of 122 languages 22 are constitutionally recognized languages • All 22 Languages including Tamil has represented and included in UNICODE by TDIL, Govt. of India • Declared as Text Encoding Standard for all E-Governance applications by Govt. of India What is UNICODE? • Provides a unique number for every character, for any – Platform – Program – Language • The globalization solution for scripts and languages • Simple and consistent manner • Supported by other standards bodies including ISO, W3C, IETF, ELRA and BIS • Compatible with ISO 10646 • Unicode is an encoding independent of font variations ஒருங்குறி • ம ொத்த எண்கள்: 65,536. 107,000 எழுத்துக்கள் (covering 90 scripts) • த ிழ்: எண் 2944 முதல் எண் 3071 • 16 பிட்(16 BIT) • ம க்ர ொசொப்ட் நிறுவனம் - ‘லதொ’, லினக்ஸ், அப்பிள் • ஏ ொள ொன எழுத்துருக்கள் - இலவச, தனியொர் பயன்பொட்டுச் மசயலிகள் ஏ ொளம் ஒருங்குறியினொல் உண்டொகும் பயன்கள் • த வுகள் பொி ொற்றம் • ரதடுதல் மபொறி, ின் – அஞ்சல், இமையம் • ற்ற ம ொழி ரதடுதல் • த ப்படுத்துதல் • சொர்புச்ரசமவ (Support Service) • பலப்பல பயன்நி ல்கள் (User Programs) • மசல்ரபசிகள் கல்விக்கூடங்களில் பயன்பொடு • பல்லொயி க்கைக்கொன கைினிகமள உடனடி தகவல் பொி ொற்றத்திற்கு தயொர் மசய்ய இயலும். • ஆயி க்கைக்கொன பள்ளி ற்றும் கல்லூொிகள், ற்றும் அமனத்துப் பல்கமலக்கழகங்கள் ஆகியவற்றில் உள்ள கைினிகமள த ிழ் உபரயொகத்திற்கு ஏற்றதொகச் மசய்ய இயலும். க்களுக்கு பயன்பொடு • இமைய தளங்களிலும், ின் அஞ்சல், கைினியிலும் த ிழிரலரய த ிழ் ம ொழியில் உருவொன ஆவைங்கள் (Documents), த வுகள் (Data) ஆகியவற்மறத் ரதட, உருவொக்க ற்றும் பொி ொறிக்மகொள்ள இயலும். • ஆ ொய்ச்சி, ஆய்வுக் கட்டும கள், பொடங்கள் ற்றும் அமனத்து ஆவைங்கமள ஒன்றிமனக்கும் வழிமுமறகள் ஆகியவற்மற வம யறுப்பதன் வழிவமககமள உருவொக்க இயலும். அ சுக்கு பயன்பொடு • ஒருங்குறி முமறயில் உருவொக்கப்பட்ட ஆவைங்கமள எந்தவித பிற ம ன்மபொருட்கள், தனி எழுத்துருக்கள் (Fonts) இன்றி படிக்க இயலும். • எதிர்கொல சந்ததியினருக்கு த ிழின் அமனத்து ஆவைங்களும் பொதுகொப்பொகச் மசன்றமடயும் வழிவமகமய ஏற்படுத்தல்.