குறியீட்டு முறைகளில் உள்ள நடைமுறைச் சிக்கல்கள் – பகுதி 2
-பேரா. முனைவர். வெ.இராமன்
ஒருங்குறியில் எழுத்துக்களைச் சேர்க்க, அவை அச்சிலும் புழக்கத்திலும் இருந்ததற்கான ஆதாரம் இருந்தால் போதுமானது. சில அகராதிகளில் மட்டும் உள்ள பொதுப்பயன்பாட்டில் இல்லாத எழுத்துக்களெல்லாம் ஒருங்குறியில் ஏறி உள்ளன. இத்தனைக்கும், ஹிந்து சாத்திர, ஸ்தோத்திர நூல்களை அச்சிடுவோர் பல்லாண்டுகளாக பெரும்பான்மையாகத் துணை எண்களுடன் கூடிய எழுத்துக்களைப் பயன்படுத்துகின்றனர்.
இதன் அடிப்படையில்தான், தமிழிலும் 2,3,4 ஆகிய துணைக்குறிகள் அடங்கிய எழுத்துக்களுக்கு தனி இடம் கேட்டு, “Extended Tamil” என்ற பகுதியை ஒதுக்கி, அதில் இவ்வெழுத்துக்களை சேர்க்க ஒருங்குறி நிறுவனத்திடம் வேண்டுகோள் விடுக்கப்பட்டது. எழுத்துமுறையும் மொழியும் ஒன்றல்ல. ஒரு மொழியானது பல்வேறு எழுத்துமுறைகளில் எழுதப்படலாம், அதே போல ஒரு எழுத்துமுறையானது பல்வேறு மொழிகளை எழுதப் பயன்படலாம். உதாரணமாக, செர்பிய மொழியானது இலத்தீன், சிரில்லிக் என்ற இரு எழுத்துமுறைகளிலும் எழுதப்படுகிறது. தேவநாகரி எழுத்துமுறையானது மராட்டி, ஹிந்தி, நேபாளம் முதலிய மொழிகளை குறிக்கப்பயன்படுகிறது. ஆகவே, ஒரு எழுத்துமுறையானது அதைச்சார்ந்த மொழியும் கூடுதலாக பிற மொழிகளையும் குறிக்கும் வேளைகளில், பல்வேறு புதிய எழுத்துக்கள் துணைக்குறிகளுடன் நீட்சியாக எழுகின்றன. இது உலகின் அனைத்து எழுத்துமுறைகளுக்கும் பொருந்தும்.
பிற இந்திய மொழிகளை மூலபாடம் மாறாமல் தமிழ் எழுத்துமுறையில் எழுத இந்தத் துணை எண்களுடன் கூடிய எழுத்துக்கள் நிச்சயமாக உபயோகப்படும். நம்முடைய பாரம்பரிய பண்டைய சூத்திர, சாத்திர, உரைகளில் இருந்து தமிழ் நூல்களில் உச்சரிப்பும் மூலமும் மாறாமல், மேற்கோளாக காட்ட இவ்வெழுத்துக்கள் மிகவும் பயன்படும். இந்த எழுத்துக்களை பயன்படுத்த விரும்பாதவர்கள், பயன்படுத்த வேண்டாம். ஜ, ஹ, ஷ, ஸ போன்ற எழுத்துக்கள் இருந்தும் சிலர் பயன்படுத்தாதது போலத்தான் இதுவும்.
இது போன்ற கூடுதல் எழுத்துக்கள், உதாரணமாகத் தற்காலத்தில் தமிழில் இல்லாத dha ध என்ற எழுத்துக்கூட மிக முன்னதாகவே 2000 காலத்துக்கு முற்பட்ட தமிழ் பிராமி கல்வெட்டில் காணப்படுகின்றன. இது ஜைன சமயக் கல்வெட்டு, धम्मम् த⁴ம்ம்ம் என்ற பிராகிருத சொல்லை குறிக்க இவ்வெழுத்து பயன்படுத்தப்பட்டுள்ளது. இந்தப் பழமையான தமிழ்க்கல்வெட்டை தற்காலத்தில் மொழிப்பெயர்க்க வேண்டுமென்றாலும் கூட த⁴ என்ற எழுத்து வேண்டும். மயிலையாரின் கூற்றுப்படி பௌத்த ஜைன சமயத்தவர்கள் தான் மணிப்பிரவாளத்தையே உருவாக்கியவர்கள். ஏதோ தமிழ் – வடமொழி தொடர்பு என்றாலே ஹிந்து மதச் சம்பந்தம் உடையது என்று கூறுபவர்கள் நிச்சயம் கருத்தில் கொள்ள வேண்டிய விஷயம் இது.
துணை எண்களுடன் கூடிய எழுத்துக்களைச் சேர்ப்பதற்கான முன்மொழிவு ஒருங்குறி அமைப்பிடம் அளிக்கப்பட்டது. நம்முடைய சாத்திரங்கள் கிரந்தங்கள் முதலியவற்றை மூலபாடம் தவறாது தமிழ் எழுத்துமுறையில் எழுதக்கூடிய நுட்பத்தேடல் காரணங்களுக்காகவே இம்முறை கோரப்படுவதாகவும் தெரிவிக்கப்பட்டது.
இதற்குத் தமிழ்கூறும் நல்லுலகத்துக் கணினி உபயோகிப்பாளர்களிடமிருந்து பலத்த எதிர்ப்பும் எழுந்தது. பேராசிரியர் இ.அண்ணாமலை[1] போன்றோர் இதற்கு விரிவான விளக்கமும் தெரிவித்தனர்.
ஒருங்குறியில் சீன மொழிக்கு 25000 (சரியான எண்ணிக்கை 20902) குறியீட்டு இடங்கள், சிங்களத்திற்கு 400 (சரியான எண்ணிக்கை, தமிழைப் போல், 128) இடங்கள், செம்மொழித் தமிழுக்கு 128 இடங்கள்தானா?” என்ற கேள்வியுடன் துவங்குகிறது. இந்தக் கேள்வி, ஒருங்குறி பற்றிய அடிப்படையான புரிதல் இல்லை என்பதைக் காட்டுகிறது. ஒருங்குறி ஒரு கருவி, உலகத்து மொழிகளை அவற்றின் எழுத்தில் கணினியில் கையாள உதவும் கருவி, எழுதுவதைத் தரப்படுத்தும் கருவி. ஒரு வரிசையில் ஒவ்வொரு மொழிக்கும் அதன் எழுத்துகளின் எண்ணிக்கையின் அடிப்படையில் இடம்கொடுத்து, ஒவ்வொரு எழுத்துக்கும் தனிக் குறியீட்டு எண் (code point) கொடுக்கிறது ஒருங்குறிக் கூட்டமைப்பு. சொல்லை அலகாகக் கொண்டு எழுத்து முறை அமைந்த சீன மொழியில் எழுத்துகள் அதிகமாக இருப்பது இயற்கை. தமிழ், ஒலியின் அடிப்படையில் குறைந்த எழுத்துகளைக் கொண்டு எல்லாச் சொற்களையும் படைக்கிறது. எழுத்துகள் குறைவாக இருப்பதால், தமிழுக்கு ஒருங்குறியில் குறைந்த இடங்கள். ஒருங்குறியில் இடம், மொழியின் தகுதியைப் பொறுத்து அமைவதல்ல. அதனால் குறைந்த இடங்கள் தமிழின் தரத்தைத் தாழ்த்துவது ஆகாது.
தமிழ் எழுத்துகளுக்கு அதிக இடம் வேண்டும் என்று கணித்தமிழ் சங்கம் முதலான அமைப்புகளும், தமிழக அரசும் கேட்டது தொழில்நுட்ப அடிப்படையில். தற்போது ஒருங்குறியில் தமிழ் உயிரெழுத்துகளும் அகரமேறிய மெய்யெழுத்துகளும் தனித்தனியே குறியீட்டு எண்கள் பெறுகின்றன. உயிர்மெய் எழுத்துகளுக்குத் தனிஎண் கிடையாது. தமிழ் எழுத்துகளின் எண்ணிக்கையைச் சொல்லும் தொல்காப்பியம் உயிர்மெய்யெழுத்துகளைச் சேர்க்கவில்லை என்பதை இங்கே மனத்தில் கொள்ளலாம். உயிர்மெய் எழுத்துகளைக் கணினி ஒரு மென்பொருளால், (இதற்கு rendering engine என்று பெயர்), அகரமேறிய மெய்யையும் உயிர்க்குறியையும் சேர்த்து, உருவாக்குகிறது. உயிர்மெய் எழுத்துகளுக்குத் தனியே குறியீட்டு எண்கள் ஒதுக்க வேண்டும் என்பதே மேலே சொன்ன கோரிக்கையின் மூலக் கருத்து.
தமிழ் எழுத்துகளுக்குக் குறியீட்டு எண், ஒருங்குறியில், மற்ற இந்திய மொழிகளைப் போல, 7 பிட் அலகைப் பயன்படுத்தித் தரப்பட்டிருக்கிறது. (இது எல்லா இந்திய மொழிகளுக்கும் இந்திய அரசு அங்கீரித்த ISCII எனப்படும் குறியீட்டு முறை). அதாவது, 0, 1 என்ற இரண்டே எண்களைப் பயன்படுத்தி எந்தத் தகவலையும் எண்வயப்படுத்தும் கணினியில், 27 தகவல்களை இந்த அலகால் எண்வயப்படுத்த முடியும். கணினித் துறையில் இந்த அலகு காலாவதி ஆகி வருகிறது. இப்போது 16 பிட் அலகே (216) பரவலாகப் பயன்படுத்தப்படுகிறது. தமிழ் எழுத்துகளை எண்வயப்படுத்த இந்த விரிந்த அலகை வேண்டுகிறது மேலே சொன்ன கோரிக்கை. தமிழ் எழுத்துகளின் விரிந்த எண்வய முறைக்கு TACE (Tamil All Character Encoding) என்று பெயர் கொடுக்கப்பட்டிருக்கிறது. தற்போது இது ஒருங்குறியில் தனியார் பயன்படுத்த மட்டுமே ஒதுக்கப்பட்டுள்ள பகுதியில் இடப்பட்டிருக்கிறது.
ஒருங்குறிக் கூட்டமைப்பு, இப்போது தமிழ் எழுத்துகளுக்குக் கொடுத்துள்ள எண்வய முறையை மாற்ற விரும்பவில்லை. ஏற்கனவே முடிவு செய்த தமிழ் எழுத்துக்கான எண்வய முறையை மாற்றுவதால் எழும் நடைமுறைச் சிக்கல்களே இதற்குக் காரணம். முதலாவது, ஒருங்குறியில் ஒரே மாதிரியாக இந்திய மொழிகளுக்குக் கொடுக்கப்பட்டுள்ள உள்ளமைப்பை இந்த மாற்றம் பாதிக்கும். இரண்டாவது, விரிந்த எண்வய முறை அமுலுக்கு வந்தால், தமிழில் பழைய முறையில் கோக்கப்பட்ட ஆவணங்களை எளிதாகப் படிக்க முடியாது. மூன்றாவது, புதிய எண்வயமுறை இல்லாமல், சில பயனேற்ற மென்பொருள்களை (application software) – குறுஞ்செய்தி அனுப்ப, அச்சிடத் தேவையானவை – தமிழில் பிசிறில்லாமல் பயன்படுத்த முடியாது என்று சொல்லும் குறை ஒரு தொழில்நுட்பப் பிரச்சனை; கணினி வல்லுநர்கள் தீர்வு காணக் கூடிய பிரச்சனை. ஒருங்குறிக் கூட்டமைப்பின் இந்தச் சிந்தனை, தமிழின் தகுதி பற்றியது அல்ல.
ஒருங்குறியில் தமிழுக்கு ஒதுக்கப்பட்டுள்ள 128 இடங்களில் 41 இடங்கள் கிரந்தத்தோடு பகிர்ந்துகொள்ளப்படும் என்பது அழைப்பில் காணப்படும் மற்றொரு தவறான விபரம். வழக்கில் உள்ள சில கிரந்த எழுத்துகளோடு சேர்த்துத் தமிழ் எழுத்துகளுக்குக் கொடுக்கப்பட்டுள்ள இடங்கள் 48. மீதியுள்ள இடங்கள் தமிழ் எண்களுக்கும் வேறு சில குறிகளுக்கும் கொடுக்கப்பட்டு, சில இடங்கள் எதிர்காலத்தில் தேவைப்படலாம் என்பதற்காகக் காலியாக விடப்பட்டுள்ளன. 41 இடங்களில் புதிய கிரந்த எழுத்துகள் இல்லை.
டாக்டர் ஸ்ரீரமண சர்மாவின் நீட்டித்த தமிழ்[2] (Extended Tamil) பற்றிய முன்வரைவில் கிரந்த எழுத்துகளை அப்படியே தமிழ் எழுத்துகளோடு சேர்த்து எழுதும்படிச் சொல்லவில்லை. சமஸ்கிருதத்தைத் தமிழ் எழுத்துகளைக் கொண்டு எழுதும்போது, அதில் உள்ள, ஆனால் தமிழில் இல்லாத, வர்க்க எழுத்துகளையும் வேறு சில எழுத்துகளையும் (மொத்தம் 26 எழுத்துகள்) இணையான தமிழ் எழுத்துகளில் மேல்குறியிட்டு (super script) எழுதலாம் என்றே சொல்லியிருக்கிறார். அதாவது, சமஸ்கிருதத்தில் உள்ள kha, ga, gha போன்ற வர்க்க ஒலிகளை க2 க3, க4 என்றும் உயிர்ப்புடைய ரு, லு போன்ற ஒலிகளை ரு2, ல2 என்றும் எழுதலாம் என்றே சொல்கிறார். சமஸ்கிருதத்தின் இந்த ஒலிகளை கிரந்த எழுத்துகளால் எழுதும் சாத்தியத்தோடு ஒப்பிட்டு, எண்குறியிட்ட தமிழ் எழுத்துகளே ஏற்றவை என்ற தன் முடிவைச் சொல்கிறார்.
சர்மாவின் விரிவுத் தமிழ் பரிந்துரை, சமஸ்கிருதத்தைத் தமிழ் எழுத்துகளைக் கொண்டு எழுதும், இன்றும் உள்ள, ஒரு மரபிற்குக் கணினியின் துணையை நாடுகிறது. புதிதாக ஒரு எழுத்து வழக்கைப் பரிந்துரைக்கவில்லை. இந்த மரபில் தமிழ் எழுத்துகளில் எண்குறியிட்டு எழுதும் வழக்கம் இருக்கிறது. சமஸ்கிருதத்தைத் தமிழ் எழுத்துகளைக் கொண்டு எழுதும் மரபு, அதை கிரந்த எழுத்துகளில் எழுதும் மரபிலிருந்து வேறுபட்டது.
இந்தப் பரிந்துரை சமஸ்கிருதத்தை, தேவநாகரியில் அல்லாமல், தமிழ் எழுத்துகளில் எழுதும் முறை பற்றிய பிரச்சனை. இங்கு மொழிவேறு, எழுத்துரு வேறு என்ற உண்மையைச் சுட்ட வேண்டும். தேவநாகரி, ரோமன் போன்ற எழுத்துருக்கள் ஒன்றுக்கு மேற்பட்ட மொழிகளை எழுதப் பயன்படுவது பலரும் அறிந்த உண்மை. ஒரு மொழி ஒன்றுக்கு மேற்பட்ட எழுத்துருக்களில் எழுதப்படுவதும் உண்மை. வலைப்பதிவில் கருத்துத் தெரிவிக்கும் சிலர், தமிழ் எழுத்துரு அவர்களுக்குக் கிடைக்காததால், தமிழை ரோமன் எழுத்துகளில் எழுதினாலும் அது தமிழ் மொழிதான். சமஸ்கிருதத்தை, தமிழ் எழுத்துரு உட்பட, இந்தியாவின் வெவ்வேறு பகுதிகளில் வழங்கும் பல எழுத்துருக்களில் எழுதுவது வரலாறு காட்டும் உண்மை.
சமஸ்கிருதத்தைத் தமிழ் எழுத்துருவில் எழுதுவதைத் தமிழ்மொழியின் பிரச்சனையாகப் பார்ப்பது, அது தமிழ் நெடுங்கணக்கை நீட்டிக்கிறது என்ற எண்ணத்தால், தமிழ் மக்கள் (தோசை, தலித், போகம் (‘crop’) போன்று) தாங்கள் பேசும் சொற்களில் உள்ள ஒலிப்புடைய (voiced) எழுத்துகளை (ga, da, dha, ba என்ற அவற்றின் உச்சரிப்பைக் காட்டும் முறையில்) எழுத விரும்பி, கிரந்த எழுத்துகளை (அல்லது எண் மேலேற்றிய தமிழ் எழுத்துகளைப் (க2, ட2, த2, ப2)) பயன்படுத்திவிடலாம் என்னும் பயத்தால்.
சர்மாவின் முன்வரைவை உத்தமம் (INFITT) என்னும் தமிழைக் கணினியில் பயன்படுத்தும் முயற்சிகளில் முன்னணியில் நிற்கும் அமைப்பும், சில நிறுவனங்களும், சில தமிழ் அறிஞர்களும் ஒப்புக்கொள்ளவில்லை. இவர்கள் விரிவுத் தமிழ் ஒருங்குறியில் இடம்பெற வேண்டாம் என்று ஒருங்குறிக் குழுமியத்திற்குக் கோரிக்கை அனுப்பினார்கள்.
இரண்டாயிரம் ஆண்டுப் பாரம்பரியம் உள்ள தமிழ் நெடுங்கணக்கை இது மாற்றுகிறது என்னும் வாதம், சமஸ்கிருதத்தைத் தமிழ்நாட்டில் எழுதும் மரபில் உள்ள பிரச்சனையைத் தமிழ் நெடுங்கணக்கிற்குள் கொண்டுவர வேண்டாம் என்னும் எண்ணத்தை அடிப்படையாகக் கொண்டது.
விரிவுத் தமிழை எதிர்க்கும் வாதத்தின் நிலைப்பாடு இதுவே. “தமிழுக்குப் புதிய எழுத்துகள் தேவை இல்லை; தமிழர்கள் தங்கள் தமிழ் உச்சரிப்பில் காட்டும் சில புதிய ஒலிகளை வடிக்க எழுத்து வேண்டாம். தமிழ்நாட்டில் வழங்கும் தமிழல்லாத எந்த மொழியையும் தமிழ் எழுத்துகளைக் கொண்டு எழுதத் தேவை இல்லை. அதனால், ஒன்றுக்கு மேற்பட்ட மொழிகளை எழுதப் பயன்படும் ரோமன், தேவநாகரி போன்ற எழுத்து முறைகளுக்கு விரிவாக்கப்பட்ட எழுத்து (Extended Roman, Extended Devanagari) இருப்பது போல், தமிழுக்கு எழுத்துமுறை விரிவு, கணினிக்கு மட்டுமே என்றாலும், தேவை இல்லை.”
ஒருங்குறிக் கூட்டமைப்பு, சர்மாவின் விரிவுத் தமிழ் பரிந்துரையை ஏற்றுக்கொள்ளவில்லை. இதற்குக் காரணம் தொழில்நுட்ப ரீதியில் தேவை இல்லை என்பதே. புதிய ஒலிகளை எண் குறியீடாக ஒருங்குறியில் ஏற்கனவே இருக்கும் எண்களை வைத்தே எழுதலாம் என்பது அதன் கருத்து.
தமிழ் எழுத்துகளுக்கு யாரும் எண்குறியிட்டுப் புதிய உச்சரிப்புகளைக் காட்ட விரும்பினால், கிரந்தம் தேவை இல்லை. இப்போது ஒருங்குறியில் உள்ள எண்களை வைத்தே, விரிவுத் தமிழ் இல்லாமலே, எழுதலாம். ஒருங்குறியில் கிரந்தத்தைத் தடுத்தாலும் இதைத் தடுக்க முடியாது.
கிரந்த எழுத்துகளுக்கு ஒருங்குறியில் தனி இடம் ஒதுக்க வேண்டும் என்பது தனியான வேறு கோரிக்கை. ஒருங்குறியில் உள்ள எத்தனையோ எழுத்துருக்களைப் போல, கிரந்தத்திற்கும் இடம் வேண்டும் என்பதே இந்தக் கோரிக்கை. இந்தக் கோரிக்கையை இந்திய அரசு, கிரந்த எழுத்து முறை வல்லுநர் குழுவின் பரிந்துரையின் பேரில், ஒருங்குறிக் குழுமியத்திற்கு அனுப்பியது.
கிரந்த எழுத்துக்கள் அட்டவணை[3]
கிரந்தக் கோரிக்கையில் சில தமிழ் எழுத்துகளைக் கிரந்த நெடுங்கணக்கில் சேர்த்திருப்பதை மறுபரிசீலனை செய்யத் தமிழக அரசு நேரம் கேட்டதால், இதன் மீது முடிவெடுப்பதைக் கூட்டமைப்பு தள்ளிவைத்திருக்கிறது. இந்திய அரசின் பார்வையில் இது தமிழ் பற்றிய பிரச்சனை அல்ல. கிரந்தம் பற்றிய பிரச்சனை. எனவே, இது தமிழைப் பாதிக்கும் என்ற வாதத்தை ஒப்புக்கொள்ளாது.
ஒருங்குறியில் கிரந்த எழுத்துகள் இடம்பெறும் தேவைக்கான பல காரணங்களில் சமஸ்கிருத்தைக் கிரந்த எழுத்துகளில் எழுதும் மரபு ஒன்று. சர்மா இந்த மரபின் தேவைக்காகவே ஒருங்குறியில் கிரந்தத்தைச் சேர்ப்பது பற்றித் தனியாக வேறு ஒரு முன்வரைவு அனுப்பினார். டாக்டர் நா. கணேசன் ஒரு முன்வரைவை அனுப்பினார். ஒருங்குறிக்கு யாரும் பரிந்துரைகள் அனுப்பலாம். தமிழும் தகவல் தொழில்நுட்பமும் அறிந்த சிலர் அனுப்புகிறார்கள். கூட்டமைப்பு தொழில்நுட்ப அடிப்படையில் பரிந்துரைகளைப் பரிசீலித்து முடிவெடுக்கிறது. அது நடைமுறைச் சிக்கல் உட்பட எல்லாவற்றையும் சீர்தூக்கி முடிவுசெய்யும். அரசின் பலமோ, அரசியல் விளைவுகளோ அந்த முடிவில் முக்கிய இடம் வகிப்பதில்லை.
தமிழுக்கே உரிய மூன்று (ழ, ற ன) எழுத்துக்களையும், எ, ஒ என்ற இரண்டு உயிர்கள் மெய்யோடு சேரும்போது எழுதும் இரண்டு உயிர்க்குறிகளையும் விரிவாக்கப்பட்ட கிரந்தத்தில் சேர்க்கும் பரிந்துரை, இந்திய அரசின் கோரிக்கையில் இருக்கிறது. (எ, ஒ என்ற இரண்டு உயிர் எழுத்துகளுக்கு கிரந்த எழுத்திலேயே கூடுதல் குறியிட்டு (diacritic marks) எழுதவே பரிந்துரை இருக்கிறது). இது, கிரந்த வல்லுநர்கள் பலர் சேர்ந்த ஒரு குழு செய்த முடிவு. ‘தமிழ் வரிவடிவம் கிரந்த வரிவடிவத்திற்குள் ஒரு சிறு பகுதியாக அடங்கிவிடுகின்றது’ என்று தவறாகவும் மிகைப்படுத்தியும் கூறுவது இதைத்தான்.
சர்மாவின் முன்வரைவில் தமிழுக்கே உரிய ஐந்து எழுத்துகளைக் கிரந்த எழுத்துகளோடு சேர்க்கும் பரிந்துரை இல்லை. அவர் நவீன சமஸ்கிருத்தில் தமிழ் உட்பட பிறமொழிச் சொற்களை, முக்கியமாகப் பெயர்களை (names), எழுதும் தேவை ஏற்படும். அந்தத் தேவையை நிறைவு செய்யக் கிரந்த விரிவு (Extended Grantha) தேவைப்படும். அதில் கூடுதல் குறி சேர்த்த கிரந்த எழுத்துகளைச் சேர்க்கலாம் என்று சொல்கிறார். எடுத்துக்காட்டாக, z என்ற ஒலியுள்ள Xerox, zebra என்ற ஆங்கிலச் சொற்களை ஜ-இன் கீழ் இருபுள்ளி இட்டுக் காட்டலாம் என்று சொல்கிறார். தொல்காப்பியர், தமிழ் என்ற தமிழ்ச் சொற்களைச் சமஸ்கிருத்தில் எழுதும்போது, தமிழ்நாட்டில் கிரந்தம் படிக்கத் தெரிந்தவர்களுக்குத் தமிழும் படிக்கத் தெரியும் என்பதால், கிரந்தத்தில் இல்லாத எழுத்துகளையும் உயிர்க் குறிகளையும் ஒருங்குறியில் உள்ள தமிழ் எழுத்துப் பகுதியிலிருந்து இறக்கிக்கொள்ளலாம் என்று சொல்கிறார். ஆனால், இது ஒருங்குறிக் கூட்டமைப்பின் ஒவ்வொரு எழுத்து முறைக்கும் தனிப்பகுதி (block) இருக்க வேண்டும் என்னும் கொள்கைக்கு முரணானது. எனவே, இந்திய அரசின் கோரிக்கையில் தமிழில் உள்ள மூன்று எழுத்துகள் கிரந்தப் பகுதியிலேயே சேர்க்கப்பட்டிருக்கின்றன. கிரந்த எழுத்துகளில் பல காலமாகத் தமிழ் எழுத்துகளோடு ஒரே அல்லது ஒத்த வரிவடிவம் உடைய உ, ஊ, ய, வ, ண, (த, ந) என்ற எழுத்துகள் இருந்து வருகின்றன. இந்தக் கோரிக்கையின்படி மூன்று எழுத்துகள் அதிகமாக இருக்கும்.
கிரந்த எழுத்து முறை பற்றிய பிரச்சனையைத் தமிழின் பிரச்சனை ஆக்கத் தேவை இல்லை. இது கிரந்த எழுத்து முறையை நவீனமாக்கும் முயற்சி. தமிழ் நெடுங்கணக்கின் சில எழுத்துகள் கிரந்த எழுத்து முறையில் சேர்வது தமிழைக் கெடுப்பது ஆகாது. தமிழ் என்ற சொல்லை ஆங்கிலத்தில் ஆங்கிலேயர் உச்சரிப்பில் Tamil என்று எழுதுகிறார்கள்; தமிழ் உச்சரிப்பின்படி எழுத வேண்டும் என்றால் Thamizh என்று எழுதலாம். ஓர் ஆங்கிலேயர் Thamil என்று எழுதலாம் என்று சொன்னால், தமிழ் கெட்டுப் போகும் என்று சொல்ல மாட்டோம், அல்லவா? ஆங்கிலத்தைக் கெடுக்கிறது என்று ஆங்கிலேயர்கள் சொல்லலாம். இதேபோல், புதிய எழுத்துகள் கிரந்தத்தைக் கெடுக்கிறது என்று பழமையைப் போற்றும் சில கிரந்தவாதிகள் சொல்லலாம்.
தமிழ் எழுத்துகளும் ரோமன் எழுத்துகளும் ஒருங்குறியில் தனித்தனியே இருந்தும், தமிழில் எழுதும்போது ரோமன் எழுத்துகளைச் சேர்க்க முடிவதுபோல, தமிழ் எழுத்துகளும் கிரந்த எழுத்துகளும் தனித்தனியே இருந்தாலும், தமிழர்கள் தமிழில் எழுதும்போது கிரந்த எழுத்துகள் சேர்ப்பதைத் தடுக்க முடியாது. அதைத் தடுக்க வேண்டுமென்றால், தொழில்நுட்பத்தை முடக்குவது வழி அல்ல, அவர்களுடைய மொழி நடத்தையை மாற்ற இசைவு வழியில் முயலுவதே வழி.
இதுதவிர பல்வேறு குறியீட்டு முறைகள் புழங்கிய காலத்தில் தமிழக அரசு அலுவலகங்களில் வானவில் என்ற தனியார் அளித்த குறியீட்டு முறையையும் அதன் எழுத்துருக்களையும் பயன்படுத்தினர். அதன்பிறகு குறியீட்டு முறைகள் தரப்படுத்தத் துவங்கியபோதும் தமிழக அரசு அலுவலகங்கள் அதே வானவில் குறியீட்டையே பயன்படுத்தின. பின் டேம், டேப் குறியீட்டு முறையை அதிகாரப்பூர்வ குறியீட்டு முறையை அரசு அறிவித்தது. ஆனாலும் தமிழக அரசு அலுவலகங்கள் அதே வானவில் குறியீட்டையே பயன்படுத்தின. பிறகு ஒருங்குறிக்கு உலகமே மாறிய போதிலும், அரசு 2010-ல் ஒருங்குறியை அதிகாரபூர்வ குறியீட்டு முறையாக அறிவித்தபோதிலும் தற்போது வரை வானவில் முறையே பல அரசு அலுவலகங்களில் நடைமுறையில் உள்ளது. இதற்குக் காரணம் வானவில் முறை அவர்களுக்கு பழகிவிட்டது மற்றும் புதிய செயலைக் கற்றுக்கொள்ள அவர்கள் காட்டும் சோம்பலும் தான் எனலாம். அதுதவிர பழைய கோப்புகளை புதிய முறையில் மாற்றும்போது வேலைப்பளு அதிகரிக்கும் என்ற தவறான எண்ணமும்தான் காரணம் என்கிறார்கள் வல்லுநர்கள். இம்முறையிலிருந்து அதிகாரபூர்வ குறியீட்டுமுறைக்கு மாற்றுவதற்கு சரியான அதிகார பலத்துடன் ஆணையிடும் அதிகாரிகள் இல்லை என்பதும் தொழில்நுட்ப வல்லுநர்களின் கருத்தாக உள்ளது.
மேலும் பல்வேறு பல்கலைக்கழகங்கள், கல்லூரிகள், அரசு அலுவலகங்கள், பொதுமக்கள் ஆகியோரிடம் ஒருங்குறி, குறியீட்டு முறைகள் மற்றும் கணினியில் தமிழ் உபயோகம் குறித்த விழிப்புணர்வு இன்னமும் ஏற்படவில்லை என்பதே தொழில்நுட்ப வல்லுநர்களின் கருத்து. தமிழ் தட்டச்சு என்பது மிகப்பெரிய கடினமான பணி என்றே பலரும் கருதுகிறார்கள். கணினியும், தமிழும் தெரிந்தவர்கள் சில மணித்துளிகளிலேயே தமிழ்த் தட்டச்சு முறையைக் கற்றுக்கொள்ளலாம் என்பதே பலருக்கும் தெரியாத ஒன்று. இவ்வகையில் கற்றறிந்தவர்களிடையேயும் அறியாமை நிலவுகிறது என்பதற்கு இது ஒரு சரியான சான்று என்கிறார்கள் கல்வியாளர்கள். எனவே பல்கலைக்கழகங்கள், உயர்கல்விக்கூடங்களில் ஆய்வுப்பணிகள் ஒன்றிணைக்கப்படாமலேயே இன்னும் சிதறிக்கிடக்கின்றன.
இவ்வகையில் குறியீட்டு முறைகள், எழுத்துருக்கள், விசைப்பலகைகள் என மூவகைப் பணிகளையும் போதிக்கத் தேவையான மனித ஆற்றல் ஏறக்குறைய தமிழகத்தில் மிக மிகக்குறைவாகவே உள்ளது எனலாம். இத்தகைய ஆற்றல் தமிழர்கள் வாழும் அனைத்து தேசங்களிலும் பரவினால் தமிழ்க்கணினியானது உலகெங்கும் மிக அதிகமான பயன்பாட்டில் வரும் என்பதில் ஐயமில்லை.
இங்ஙனம் பல்வேறு வகைகளில் உள்ள நடைமுறைச் சிக்கல்கள் குறியீட்டு முறைகளைச் சிக்கலில் வைத்துள்ளன எனலாம்.
*****
குறிப்புகள்
[1] http://tdil.mit.gov.in/Standards/ISCII.aspx
[2] http://www.tscii.org/
[3] http://www.tamilvu.org/Tamilnet99/index.htm
[4] Tamilnadu Government, Information Technology Department, GO (Ms) No.29, dated 23.06.2010
[5] http://unicode.org/
[6] http://www.tamilvu.org/Tamilnet99/order.htm
[7] கணினியில் தமிழ் நிகழ்வுகள் அமைப்பதில் உள்ள சிக்கல்கள், பக். 876 – 878
[8] Tamilnadu Government, Information Technology department, GO (Ms) No.13, dated 10.11.2006
[9] http://www.unicode.org/L2/L2008/08101-tace-report.pdf
[10] Ibid
[11] http://www.sangatham.com/news/grantha-whats-happening.html/comment-page-1
[12] https://www.vallamai.com/?p=1666
[13] http://tamil.oneindia.com/news/2010/10/28/insert-sanskrit-unicode-font-tamil.html
[14] http://unicode.org/charts/
“கணினியில் தமிழ் எழுத்துருக்களும், குறியீட்டு முறைகளும்” வெ.இராமன் (2016) மதுரை காமராசர் பல்கலைக்கழக முனைவர் பட்ட ஆய்வேடு.
*****
கட்டுரையாளர்
முதன்மையர், இரத்தினம் கலை அறிவியல் கல்லூரி, கோயம்புத்தூர் – 641021
மின்னஞ்சல்: raman600@gmail.com
