கணினித்தமிழின் இன்றைய வளர்ச்சி
( ந. தெய்வ சுந்தரம் – என் டி எஸ்
லிங்க்சாப்ட் சொலூஷன்ஸ்)
1. எழுத்துருக்கள் ( Fonts) :
டேம் , டேப் ( TAM, TAB) : கணினியில் பயன்படும் தமிழ் எழுத்துருக்களே இல்லாத
ஒரு காலம் 25 ஆண்டுகளுக்குமுன்
நீடித்தது. பின்னர் அஸ்கி ( ASCII – American Standard Code for Information
Interchange) ) குறியீட்டுமுறையில் தமிழ்
எழுத்துருக்கள் உருவாக்கப்பட்டன. இதிலும் ஒரு சிக்கல் நீடித்தது. ஒரு நிறுவனம்
தயாரித்து அளித்த தமிழ் எழுத்துருக்களை மற்றொரு நிறுவனத்தின் எழுத்துருக்கள்கொண்டு
பதிப்பிக்கமுடியாத சூழல் நிலவியது. இச்சிக்கலைத் தீர்க்க, டேம் ( Tamil Monolingual) , டேப் ( Tamil Bilingual) என்ற தரப்படுத்தப்பட்ட தமிழ் எழுத்துருக்கள் 1999 ஆம் ஆண்டு அறிமுகப்படுத்தப்பட்டன.
ஒருங்குறி ( Unicode) : தற்போது உலக அளவில்
ஒருங்குறி ( யூனிகோடு ) குறியேற்றமுறை உருவாக்கப்பட்டு, நடைமுறையில்
செயல்படுத்தப்பட்டுவிட்டது. இதன் பயனாக, பன்மொழி ஆவணங்களை உருவாக்கவும் , தடையின்றிக்
கணினியில் உலகெங்கும் எந்தவொரு மொழியையும் பயன்படுத்தவும் வாய்ப்பு ஏற்பட்டுள்ளது.
தமிழுக்கும் ஒருங்குறி சேர்த்தியம் 128 இடங்களை UTF-8 அடிப்படையில் அளித்துள்ளது. தற்போது ஒருங்குறி
தமிழ் எழுத்துருக்கள் ஏராளமாக மக்கள் பயன்பாட்டுக்குக் கிடைக்கின்றன.
டேஷ் ( TACE) : தற்போது தமிழுக்கு
அளிக்கப்பட்டுள்ள ஒருங்குறி எழுத்துரு வசதி 8 பிட் அமைப்பை அடிப்படையாகக் கொண்டது.
தமிழின் அனைத்து எழுத்துகளுக்கும் தனித்தனி ஒருங்குறிக் குறியீட்டு எண்கள்
அளிக்கப்படவில்லை. தமிழில் 247 எழுத்துகள் உள்ளன. கிரந்த எழுத்துகளான ஸ, ஷ, ஜ, ஹ
க்ஷ ஸ்ரீ எழுத்துதமிழ் எண்கள் , சில குறியீடுகள் ஆகியவற்றைச் சேர்த்தால் 380
குறியீட்டு எண்கள் தமிழுக்குத் தேவைப்படுகின்றன. இந்தத் தேவையின் அடிப்படையில்
தற்போது டேஷ் (
Tamil All Character Encoding – TACE) என்ற ஒருங்குறி குறியீட்டு முறையை UTF -16 அடிப்படையில்
வல்லுநர்கள் உருவாக்கி, பரிந்துரைத்துள்ளனர். இது இன்னும் ஒருங்குறி
சேர்த்தியத்தால் முறையாக ஏற்றுக்கொள்ளப்படவில்லை.
தற்போது தமிழின் ஒருங்குறி எழுத்துருக்களுக்கு பேஜ்மேக்கர்
போன்ற பன்னாட்டு மென்பொருள் நிறுவனங்கள் தங்கள் மென்பொருள்களில் வசதி
அளிக்கவில்லை. இதனால் அச்சுத் துறைகளில் இன்னும் பழைய டேம், டேப் அடிப்படையிலான
எழுத்துருக்களே பயன்படுத்தப்படுகின்றன. தற்போது இன்-டிசைன் என்ற
மென்பொருளில் ஒருங்குறித் தமிழும் இடம்பெற்றுள்ளது குறிப்பிடத்தக்கது. தமிழகத்திலும்,
மலேசியாவிலும் பல தனியார் நிறுவனங்களும் தனிநபர்களும் ஒருங்குறித் தமிழ் எழுத்துருக்களை
உருவாக்கியுள்ளனர்.
2. விசைப்பலகைகள் :
தமிழ் எழுத்துருக்களில் நிலவிய சிக்கல்போன்றே தமிழ்விசைப்பலகைகளிலும் நீடித்தது. கணினி நிறுவனங்கள் ஒவ்வொன்றும் வெவ்வேறுவகையில் விசைப்பலகையை வடிவமைத்திருந்தனர். இச்சிக்கலைத் தீர்க்கத் தரப்படுத்தப்பட்ட தமிழ்இணையம்99 என்ற விசைப்பலகை தமிழ்நாடு அரசால் அறிமுகப்படுத்தப்பட்டது. இத்தோடு, தமிழ்த்தட்டச்சு , ரோமன் விசைப்பலகை ஆகியவையும் தற்போது பயன்பாட்டில் உள்ளன.
தமிழ்நாடு அரசின் தமிழ் இணையக் கல்விக்கழகம், ஐந்து ஒருங்குறி எழுத்துருக்களையும் தமிழ் விசைப்பலகைகளையும் உருவாக்கி, இணையதளத்தில் இட்டுள்ளது. கட்டணமில்லாமல் பயனர்கள் இவற்றைத் தரவிறக்கம்செய்து பயன்படுத்தலாம்.
3. சொல்லாளர் ( Word Processor) :
தமிழில் தட்டச்சு செய்த ஆவணங்களின்
மொழிநடைகளைச் சீரமைக்கவும், பிற பதிப்புப் பணிகளை மேற்கொள்ளவும் மைக்ரோசாப்ட் வோர்ட் போன்ற
மென்பொருட்கள் தமிழுக்குத் தேவை. ஆவணங்களில் உள்ள சொற்பிழைகள், ஒற்றுப் பிழைகள், இலக்கணப் பிழைகள்
ஆகியவற்றைத் திருத்தித் தரும் தமிழ்மொழிசார்ந்த பதிப்புக்கருவிகள், அகராதிகள்
போன்றவற்றை உள்ளடக்கிய சொல்லாளர் தமிழுக்குத் தேவையான இன்றியமையாத ஒரு
மென்பொருளாகும். இம்முயற்சியில் சில மென்பொருட்கள் தமிழுக்கு உருவாக்கப்பட்டு
வெளிவந்துள்ளன. எங்கள் குழுவினர் ( என்
டி எஸ் லிங்க்சாஃப்ட் சொலூஷன்ஸ்) ‘மெனதமிழ்
– தமிழ்ச்சொல்லாளர் ‘ என்ற மென்பொருளை உருவாக்கியுள்ளனர். இதற்கு அண்மையில் தமிழ்நாடு
அரசின் ‘ முதலமைச்சர் கணினித்தமிழ் விருது (2013) ‘ வழங்கப்பட்டுள்ளது. அண்ணா பல்கலைக்கழகத்தின்
மேனாள் பேராசிரியர் வி. கிருஷ்ணமூர்த்தி ( லேர்ன்ஃபன் சிஸ்டம்ஸ்) அவர்களது குழுவினர்
‘பொன்மொழி’ என்ற மென்பொருளை உருவாக்கியுள்ளனர். மலேசியாவைச் சேர்ந்த முரசு அஞ்சல் நிறுவனத்தின்
தலைவர் திரு. முத்து நெடுமாறன் அவர்கள் ‘ முரசு அஞ்சல்’ என்ற ஒரு மென்பொருளை வெளியிட்டுள்ளார்.
நீச்சல்காரன் என்று தன்னை அழைத்துக்கொள்ளும் திரு. இராஜாராமன் அவர்களும் ‘நாவி’ ( சந்திப்பிழைதிருத்தி)
‘ வாணி’ ( சொற்பிழைதிருத்தி) என்ற இணையத்தில் செயல்படும் இரண்டு மென்பொருள்களை வெளியிட்டுள்ளார்.
4. ஒளிவழி எழுத்தறிவான் ( OCR – Optical Character Recognizer) :
அச்சில் உள்ள தமிழ் ஆவணங்களைப் மின்படிமக்
கருவிகள்மூலம் படியெடுத்துப் பதிப்பிக்க உதவும் மென்பொருள் உருவாக்கம் தமிழில் உருவாக்கப்பட்டுவருகிறது.
பங்களூர் இந்திய அறிவியல் கழகத்தின் பேராசிரியர்
ஏ ஜி இராமகிருஷ்ணன் அவர்களும் அண்ணா பல்கலைக்கழகத்தின் மேனாள் பேராசிரியர் வி.
கிருஷ்ணமூர்த்தி அவர்களும் இம்முயற்சியில் ஈடுபட்டு, இரண்டு மென்பொருள்கள் வெளிக்கொண்டுவந்துள்ளனர்.
அண்மையில் கூகில் நிறுவனமும் ஒரு சிறந்த மென்பொருளை இணையத்தின்வழியே தந்துள்ளது.
5. எழுத்து – பேச்சுமாற்றி ( Text To Speech – TTS) : கணினிபோன்ற மின்னணுக் கருவிகளில் உருவாக்கப்படுகிற தமிழ் ஆவணங்களை வாசித்துத் தரும் மென்பொருள் உருவாக்க முயற்சியும் தற்போது நடைபெற்றுவருகின்றன. இந்த முயற்சி இன்னும் பல படிகளைத் தாண்டவேண்டியுள்ளது. பங்களூர் இந்திய அறிவியல் கழகத்தின் பேராசிரியர் ஏஜி இராமகிருஷ்ணன் அவர்களும் சென்னை எஸ் எஸ் என் பொறியில் கல்லூரியின் பேராசிரியர் டி. நாகராஜன் அவர்களும் தங்கள் குழுவினருடன் இணைந்து இரண்டு மென்பொருள்களை இணையச் செயல்பாட்டு மென்பொருள்களாக வெளியிட்டுள்ளனர். இவை இன்னும் முழுமையான மென்பொருள்களாகப் பயன்பாட்டுக்கு வரவில்லை.
6. செல்பேசியில் தமிழ் : செல்பேசியில் தமிழ் எழுத்துருக்களைக் கொண்டுவருவதிலும் பல முயற்சிகள் மேற்கொள்ளப்பட்டுவருகின்றன. மலேசியாவைச் சேர்ந்த முரசு அஞ்சல் நிறுவனத்தின் தலைவர் திரு. முத்து நெடுமாறன் அவர்கள் ‘செல்லினம்’ என்ற ஒரு மென்பொருளை வெளியிட்டுள்ளார். உலகில் பரவலாகப் பயனர்கள் இந்த மென்பொருளைத் தங்களது செல்பேசியில் பயன்படுத்திவருகின்றனர். டாவுல்சாப்ட் நிறுனத்தின் கீமேன் என்ற தமிழ் மென்பொருளும் வெளிவந்துள்ளது.
7. தமிழ்மயமாக்கம் ( Localization ) : மைக்ரோசாஃப்ட் போன்ற பன்னாட்டு மென்பொருள் தயாரிப்பு நிறுவனங்கள், தங்கள் மென்பொருட்களை ஆங்கிலம் அல்லாத பிறமொழியினரும் பயன்படுத்தும் நோக்கில், உள்ளூர்மொழிமயமாக்கம் முயற்சியை மேற்கொண்டுவருகின்றன. தங்களது மென்பொருட்களின் மெனுக்களை உள்ளூர் மொழிகளில் மொழிபெயர்த்து அளித்துவருகின்றன. தமிழுக்கும் இதுபோன்ற முயற்சிகள் சில நடைபெற்றுள்ளன.
தமிழ்க்கணினிமொழியியல் ஆய்வு :
கணினிமொழியியல், மொழித்தொழில்நுட்ப அறிவியலை முறைசார் கல்வியாக 2003 ஆம் ஆண்டுமுதல் 2010 ஆம் ஆண்டுவரை சென்னைப் பல்கலைக்கழகத்தின் தமிழ்மொழித்துறையில் செயல்பட்ட மொழியியல் ஆய்வுப்பிரிவில் பேரா. ந. தெய்வ சுந்தரம் அறிமுகப்படுத்தினார். இத்துறையில் தமிழ் உருபன் பகுப்பாய்வி, தொடரியல் பகுப்பாய்வி உட்பட பல தமிழ்க்கணினிமொழியியல் பயிற்சிகள் அளிக்கப்பட்டுவந்தன. முதுகலைப் பட்டம், எம்ஃபில் பட்டம், முனைவர் பட்டம் ஆகியவற்றிற்கான படிப்புகளில் பலர் இணைந்து இத்துறையில் பயிற்சிபெற்றனர். 2010 ஜூன் மாதம் பேரா. ந. தெய்வ சுந்தரம் பணி ஓய்வுபற்றபின்னர், அப்படிப்புகளை மேற்கொள்ளப் பல்கலைக்கழகம் எவ்வித முயற்சியும் மேற்கொள்ளவில்லை. நிறுவப்பட்டிருந்த கணினிமொழியியல் ஆய்வுக்கூடம் ( Computer assisted Language Technology Lab – CALT) மூடப்பட்டது.. பல இலட்சம் மதிப்புள்ள கணினிமொழியியல் நூல்கள் கேட்பாரற்று, ஒரு மூலையில் குவிக்கப்பட்டுள்ளன.
அண்ணா பல்கலைக்கழகத்தின் கணினியியல் பேராசிரியர்கள் முனைவர் கீதா, முனைவர் இரஞ்சனி பார்த்தசாரதி ஆகியோர் தங்கள் குழுவினருடன் பல ஆய்வுகளை மேற்கொண்டுள்ளனர்.
அண்ணா
பல்கலைக்கழகத்தின் AU-KBC மையத்தில் முனைவர் ஷோபா உட்பட பலர் இத்துறையில் பல ஆய்வுகளை
மேற்கொண்டுவருகின்றனர்.
கோவை அமிர்தா பல்கலைக்கழகத்தின் பேராசிரியர் சோமன் அவர்களின் தலைமையிலும் இயந்திரமொழிபெயர்ப்பு உட்பட பல தமிழ்க்கணினிமொழியியல் பணிகள் மேற்கொள்ளப்பட்டுவருகின்றன. தஞ்சைப் பல்கலைக்கழகத்தின் மேனாள் பேராசிரியர் இராஜேந்திரன் போன்றோரும் அங்கே தற்போது கணினித்தமிழ் ஆய்வுகளை மேற்கொண்டுவருகின்றனர்.
மைசூரில் இயங்கும் இந்தியமொழிகள் நடுவண் நிறுவனத்தில் தமிழுக்கான தரவக உருவாக்கம், உருபன்பகுப்பாய்வி போன்ற ஆய்வுப்பணிகள் பேராசிரியர் ல. இராமமூர்த்தி அவர்களின் தலைமையிலான குழுவினர் மேற்கொண்டுவருகின்றனர்.
அண்ணாமலைப் பல்கலைக்கழக மேனாள் பேராசிரியர் ம. கணேசன், ஹைதாராபாத் பல்கலைக்கழகப் பேராசிரியர் முனைவர் அருள்மொழி, செம்மொழித் தமிழ் மத்திய ஆய்வு நிறுவனத்தின் ஆய்வாளர்கள் முனைவர் செல்வதுரை, திரு. அகிலன், திரு. கார்த்திக் சுப்பிரமணியம் ,மேனாள் ஆய்வாளர் முனைவர் பழனிராஜன் ( தற்போது காசர்கோடு மையப் பல்கலைக்கழகம்) ஆகியோரும் பல பணிகளை மேற்கொண்டுவருகின்றனர்.
பேரா. ந. தெய்வ சுந்தரம் சென்னைப் பல்கலைக்கழகத்தில் தனது பணி ஓய்வுக்குப்பிறகு, என் டி எஸ் லிங்கசாஃப்ட் சொலூஷன்ஸ் என்ற ஒரு நிறுவனத்தைத் தொடங்கி, தனது தமிழ்க்கணினிமொழியியல் பணிகளைத் தொடர்ந்துவருகிறார். இன்றைய தமிழுக்கான உருபன் பகுப்பாய்வி, தொடர்ப்பகுப்பாய்வி, இயந்திரமொழிபெயர்ப்பு, மின்னகராதி, தரவக உருவாக்கம், தரவக ஆய்வு மென்பொருள் போன்ற மென்பொருள்களை உருவாக்கிவருகிறார். இவரது குழுவில் மொழியியலாளர்கள், மென்பொருள் நிரலாக்கர்கள் பலர் இணைந்து பணிமேற்கொண்டுவருகின்றனர். ‘மென்தமிழ் – தமிழ்ச்சொல்லாளர்’, ‘மென்தமிழ் ஆய்வுத்துணைவன்’, ‘ மென்தமிழ் – சந்தித்துணைவன் ‘ என்ற மூன்று மென்பொருள்கள் உருவாக்கப்பட்டுள்ளன.
அண்மையில் தமிழ்நாடு அரசின் தமிழ் இணையக்கல்விக்கழகமும் தமிழ்க்கணினிமொழியியல் ஆய்வுக்கான பணிகளைத் தொடங்கியுள்ளது. பேராசிரியர்கள் ஜேம்ஸ், உமாராஜ், தனலட்சுமி ஆகியோர் இணைந்து இதற்கான பணிகளைத் தீவிரப்படுத்திவருகின்றனர்.
மதுரையைச் சேர்ந்த கணினியியல் பேராசிரியர் ப. பாண்டியராஜா அவர்கள் தமிழ் இலக்கியங்களுக்கான தொடரடைவு மென்பொருளை உருவாக்கியுள்ளார்.
அமெரிக்காவில் பென்சில்வேனியா பல்கலைக்கழகத்தில் பணியாற்றும் மொழியியலாளர் திரு. வாசு ரங்கநாதன் அவர்கள் தமிழ்க்கணினிமொழியியலில் பல ஆய்வுகளை மேற்கொண்டு, மென்பொருள்களையும் உருவாக்கி, இணையத்தில் இட்டுள்ளார். ஆஸ்திரேலியாவில் பணியாற்றிவரும் கணினியியல் துறை அறிஞர் திரு. முகுந்த் அவர்கள் பல ஆண்டுகளாகக் கட்டற்ற மென்பொருள் உருவாக்கத்தில் தன்னை ஈடுபடுத்திக்கொண்டு, பல குறிப்பிடத்தக்க பணிகளை வெற்றிகரமாகச் செய்துமுடித்துள்ளார். கலிஃபோர்னியாவில் பணியாற்றிவரும் கணினியியல் அறிஞர் திரு. வேல்முருகன் சுப்பிரமணியன் அவர்களும் அண்மையில் தமிழ்க்கணினிமொழியியல் ஆய்வில் ஈடுபட்டுவருகிறார்.
எனக்குத் தெரிந்தவரையில் தமிழ்க்கணினிமொழியியலில் இதுவரை மேற்கொள்ளப்பட்டுள்ள பணிகளைத் தொகுத்துள்ளேன். மேலும் பலர் இத்துறையில் ஈடுபட்டிருக்கலாம். நண்பர்கள் இதுபற்றி விவரங்கள் தெரிந்தால், தயவுசெய்து தெரியப்படுத்தவும்.
1 கருத்துகள்:
மிகச்சிறந்த தகவல்கள். மேலும் இதுபோன்ற ஆய்வுகள் வளர தாங்கள்தான் முன்நின்று செயல்படவேண்டும். ஐந்து தலைமுறையை இணைக்கும் பாலமாக இருக்கிறீர்கள். தங்கள் கணினிமொழி ஆய்வு வளர பல்வேறு கல்லூரிகள் பல்கலைக்கழங்கங்களில் கணினிமொழி ஆய்வு தொடர்பாக ஒரு தனித்துறை உருவாக்கினால்தான் இது நிறைவேறும்.
கருத்துரையிடுக