ஞாயிறு, 8 நவம்பர், 2015

கணினித்தமிழின் இன்றைய வளர்ச்சி

கணினித்தமிழின் இன்றைய வளர்ச்சி
( ந. தெய்வ சுந்தரம் – என் டி எஸ் லிங்க்சாப்ட் சொலூஷன்ஸ்)
1. எழுத்துருக்கள் ( Fonts)  :
டேம் , டேப் ( TAM, TAB) :  கணினியில் பயன்படும் தமிழ் எழுத்துருக்களே இல்லாத ஒரு காலம் 25 ஆண்டுகளுக்குமுன் நீடித்தது. பின்னர் அஸ்கி ( ASCII – American Standard Code for Information Interchange) )  குறியீட்டுமுறையில் தமிழ் எழுத்துருக்கள் உருவாக்கப்பட்டன. இதிலும் ஒரு சிக்கல் நீடித்தது. ஒரு நிறுவனம் தயாரித்து அளித்த தமிழ் எழுத்துருக்களை மற்றொரு நிறுவனத்தின் எழுத்துருக்கள்கொண்டு பதிப்பிக்கமுடியாத சூழல் நிலவியது. இச்சிக்கலைத் தீர்க்க, டேம் ( Tamil Monolingual) , டேப் ( Tamil Bilingual)  என்ற தரப்படுத்தப்பட்ட தமிழ் எழுத்துருக்கள் 1999  ஆம் ஆண்டு அறிமுகப்படுத்தப்பட்டன.

ஒருங்குறி ( Unicode) : தற்போது உலக அளவில் ஒருங்குறி ( யூனிகோடு ) குறியேற்றமுறை உருவாக்கப்பட்டு, நடைமுறையில் செயல்படுத்தப்பட்டுவிட்டது. இதன் பயனாக, பன்மொழி ஆவணங்களை உருவாக்கவும் , தடையின்றிக் கணினியில் உலகெங்கும் எந்தவொரு மொழியையும் பயன்படுத்தவும் வாய்ப்பு ஏற்பட்டுள்ளது. தமிழுக்கும் ஒருங்குறி சேர்த்தியம் 128 இடங்களை UTF-8 அடிப்படையில் அளித்துள்ளது. தற்போது ஒருங்குறி தமிழ் எழுத்துருக்கள் ஏராளமாக மக்கள் பயன்பாட்டுக்குக் கிடைக்கின்றன.

டேஷ் ( TACE) : தற்போது தமிழுக்கு அளிக்கப்பட்டுள்ள ஒருங்குறி எழுத்துரு வசதி 8 பிட் அமைப்பை அடிப்படையாகக் கொண்டது. தமிழின் அனைத்து எழுத்துகளுக்கும் தனித்தனி ஒருங்குறிக் குறியீட்டு எண்கள் அளிக்கப்படவில்லை. தமிழில் 247 எழுத்துகள் உள்ளன. கிரந்த எழுத்துகளான ஸ, ஷ, ஜ, ஹ க்ஷ ஸ்ரீ எழுத்துதமிழ் எண்கள் , சில குறியீடுகள் ஆகியவற்றைச் சேர்த்தால் 380 குறியீட்டு எண்கள் தமிழுக்குத் தேவைப்படுகின்றன. இந்தத் தேவையின் அடிப்படையில் தற்போது டேஷ் ( Tamil All Character Encoding – TACE) என்ற ஒருங்குறி குறியீட்டு முறையை UTF -16 அடிப்படையில் வல்லுநர்கள் உருவாக்கி, பரிந்துரைத்துள்ளனர். இது இன்னும் ஒருங்குறி சேர்த்தியத்தால் முறையாக ஏற்றுக்கொள்ளப்படவில்லை.   
தற்போது தமிழின்  ஒருங்குறி எழுத்துருக்களுக்கு பேஜ்மேக்கர் போன்ற பன்னாட்டு மென்பொருள் நிறுவனங்கள் தங்கள் மென்பொருள்களில் வசதி அளிக்கவில்லை. இதனால் அச்சுத் துறைகளில் இன்னும் பழைய டேம், டேப் அடிப்படையிலான எழுத்துருக்களே பயன்படுத்தப்படுகின்றன. தற்போது இன்-டிசைன் என்ற மென்பொருளில் ஒருங்குறித் தமிழும் இடம்பெற்றுள்ளது குறிப்பிடத்தக்கது. தமிழகத்திலும், மலேசியாவிலும் பல தனியார் நிறுவனங்களும் தனிநபர்களும் ஒருங்குறித் தமிழ் எழுத்துருக்களை உருவாக்கியுள்ளனர்.

2. விசைப்பலகைகள்

தமிழ் எழுத்துருக்களில் நிலவிய சிக்கல்போன்றே தமிழ்விசைப்பலகைகளிலும் நீடித்தது. கணினி நிறுவனங்கள் ஒவ்வொன்றும் வெவ்வேறுவகையில் விசைப்பலகையை வடிவமைத்திருந்தனர். இச்சிக்கலைத் தீர்க்கத் தரப்படுத்தப்பட்ட  தமிழ்இணையம்99 என்ற விசைப்பலகை தமிழ்நாடு அரசால் அறிமுகப்படுத்தப்பட்டது. இத்தோடு, தமிழ்த்தட்டச்சு , ரோமன் விசைப்பலகை ஆகியவையும் தற்போது  பயன்பாட்டில் உள்ளன.

தமிழ்நாடு அரசின் தமிழ் இணையக் கல்விக்கழகம், ஐந்து ஒருங்குறி எழுத்துருக்களையும் தமிழ் விசைப்பலகைகளையும் உருவாக்கி, இணையதளத்தில் இட்டுள்ளது. கட்டணமில்லாமல் பயனர்கள் இவற்றைத் தரவிறக்கம்செய்து பயன்படுத்தலாம்.

3. சொல்லாளர் ( Word Processor)
தமிழில் தட்டச்சு செய்த ஆவணங்களின் மொழிநடைகளைச் சீரமைக்கவும், பிற பதிப்புப் பணிகளை மேற்கொள்ளவும் மைக்ரோசாப்ட் வோர்ட் போன்ற மென்பொருட்கள் தமிழுக்குத் தேவை. ஆவணங்களில் உள்ள சொற்பிழைகள், ஒற்றுப் பிழைகள், இலக்கணப் பிழைகள் ஆகியவற்றைத் திருத்தித் தரும் தமிழ்மொழிசார்ந்த பதிப்புக்கருவிகள், அகராதிகள் போன்றவற்றை உள்ளடக்கிய சொல்லாளர் தமிழுக்குத் தேவையான இன்றியமையாத ஒரு மென்பொருளாகும். இம்முயற்சியில் சில மென்பொருட்கள் தமிழுக்கு உருவாக்கப்பட்டு வெளிவந்துள்ளன.  எங்கள் குழுவினர் ( என் டி எஸ் லிங்க்சாஃப்ட் சொலூஷன்ஸ்)  ‘மெனதமிழ் – தமிழ்ச்சொல்லாளர் ‘ என்ற மென்பொருளை உருவாக்கியுள்ளனர். இதற்கு அண்மையில் தமிழ்நாடு அரசின் ‘ முதலமைச்சர் கணினித்தமிழ் விருது (2013) ‘ வழங்கப்பட்டுள்ளது. அண்ணா பல்கலைக்கழகத்தின் மேனாள் பேராசிரியர் வி. கிருஷ்ணமூர்த்தி ( லேர்ன்ஃபன் சிஸ்டம்ஸ்) அவர்களது குழுவினர் ‘பொன்மொழி’ என்ற மென்பொருளை உருவாக்கியுள்ளனர். மலேசியாவைச் சேர்ந்த முரசு அஞ்சல் நிறுவனத்தின் தலைவர் திரு. முத்து நெடுமாறன் அவர்கள் ‘ முரசு அஞ்சல்’ என்ற ஒரு மென்பொருளை வெளியிட்டுள்ளார். நீச்சல்காரன் என்று தன்னை அழைத்துக்கொள்ளும் திரு. இராஜாராமன் அவர்களும் ‘நாவி’ ( சந்திப்பிழைதிருத்தி) ‘ வாணி’ ( சொற்பிழைதிருத்தி) என்ற இணையத்தில் செயல்படும் இரண்டு மென்பொருள்களை வெளியிட்டுள்ளார். 

4. ஒளிவழி எழுத்தறிவான் ( OCR – Optical Character Recognizer)
அச்சில் உள்ள தமிழ் ஆவணங்களைப் மின்படிமக் கருவிகள்மூலம் படியெடுத்துப் பதிப்பிக்க உதவும் மென்பொருள் உருவாக்கம் தமிழில் உருவாக்கப்பட்டுவருகிறது. பங்களூர் இந்திய அறிவியல் கழகத்தின் பேராசிரியர்  ஏ ஜி இராமகிருஷ்ணன் அவர்களும் அண்ணா பல்கலைக்கழகத்தின் மேனாள் பேராசிரியர் வி. கிருஷ்ணமூர்த்தி அவர்களும் இம்முயற்சியில் ஈடுபட்டு, இரண்டு மென்பொருள்கள் வெளிக்கொண்டுவந்துள்ளனர். அண்மையில் கூகில் நிறுவனமும் ஒரு சிறந்த மென்பொருளை இணையத்தின்வழியே தந்துள்ளது.

5. எழுத்து பேச்சுமாற்றி ( Text To Speech – TTS) :  கணினிபோன்ற மின்னணுக் கருவிகளில் உருவாக்கப்படுகிற தமிழ் ஆவணங்களை வாசித்துத் தரும் மென்பொருள் உருவாக்க முயற்சியும் தற்போது நடைபெற்றுவருகின்றன. இந்த முயற்சி இன்னும் பல படிகளைத் தாண்டவேண்டியுள்ளது. பங்களூர் இந்திய அறிவியல் கழகத்தின் பேராசிரியர் ஏஜி இராமகிருஷ்ணன் அவர்களும் சென்னை எஸ் எஸ் என் பொறியில் கல்லூரியின் பேராசிரியர் டி. நாகராஜன் அவர்களும் தங்கள் குழுவினருடன் இணைந்து இரண்டு மென்பொருள்களை இணையச் செயல்பாட்டு மென்பொருள்களாக வெளியிட்டுள்ளனர். இவை இன்னும் முழுமையான மென்பொருள்களாகப் பயன்பாட்டுக்கு வரவில்லை.

6. செல்பேசியில் தமிழ் :  செல்பேசியில் தமிழ் எழுத்துருக்களைக் கொண்டுவருவதிலும் பல முயற்சிகள் மேற்கொள்ளப்பட்டுவருகின்றன. மலேசியாவைச் சேர்ந்த முரசு அஞ்சல் நிறுவனத்தின் தலைவர் திரு. முத்து நெடுமாறன் அவர்கள் ‘செல்லினம்’ என்ற ஒரு மென்பொருளை வெளியிட்டுள்ளார். உலகில் பரவலாகப் பயனர்கள் இந்த மென்பொருளைத் தங்களது செல்பேசியில் பயன்படுத்திவருகின்றனர். டாவுல்சாப்ட் நிறுனத்தின் கீமேன் என்ற தமிழ் மென்பொருளும் வெளிவந்துள்ளது.

7. தமிழ்மயமாக்கம் ( Localization ) : மைக்ரோசாஃப்ட் போன்ற பன்னாட்டு மென்பொருள் தயாரிப்பு நிறுவனங்கள், தங்கள் மென்பொருட்களை ஆங்கிலம் அல்லாத பிறமொழியினரும் பயன்படுத்தும் நோக்கில், உள்ளூர்மொழிமயமாக்கம் முயற்சியை மேற்கொண்டுவருகின்றன. தங்களது மென்பொருட்களின் மெனுக்களை உள்ளூர் மொழிகளில் மொழிபெயர்த்து அளித்துவருகின்றன. தமிழுக்கும் இதுபோன்ற முயற்சிகள் சில நடைபெற்றுள்ளன.

தமிழ்க்கணினிமொழியியல் ஆய்வு :

கணினிமொழியியல், மொழித்தொழில்நுட்ப அறிவியலை முறைசார் கல்வியாக 2003 ஆம் ஆண்டுமுதல் 2010 ஆம் ஆண்டுவரை சென்னைப் பல்கலைக்கழகத்தின் தமிழ்மொழித்துறையில் செயல்பட்ட மொழியியல் ஆய்வுப்பிரிவில் பேரா. ந. தெய்வ சுந்தரம் அறிமுகப்படுத்தினார். இத்துறையில் தமிழ் உருபன் பகுப்பாய்வி, தொடரியல் பகுப்பாய்வி உட்பட பல தமிழ்க்கணினிமொழியியல் பயிற்சிகள் அளிக்கப்பட்டுவந்தன.  முதுகலைப் பட்டம், எம்ஃபில் பட்டம், முனைவர் பட்டம் ஆகியவற்றிற்கான படிப்புகளில் பலர் இணைந்து இத்துறையில் பயிற்சிபெற்றனர். 2010 ஜூன் மாதம் பேரா. ந. தெய்வ சுந்தரம் பணி ஓய்வுபற்றபின்னர், அப்படிப்புகளை மேற்கொள்ளப் பல்கலைக்கழகம் எவ்வித முயற்சியும் மேற்கொள்ளவில்லை. நிறுவப்பட்டிருந்த கணினிமொழியியல் ஆய்வுக்கூடம் ( Computer assisted Language Technology Lab – CALT) மூடப்பட்டது.. பல இலட்சம் மதிப்புள்ள கணினிமொழியியல் நூல்கள் கேட்பாரற்று, ஒரு மூலையில் குவிக்கப்பட்டுள்ளன.

அண்ணா பல்கலைக்கழகத்தின் கணினியியல் பேராசிரியர்கள் முனைவர்  கீதா, முனைவர் இரஞ்சனி பார்த்தசாரதி ஆகியோர் தங்கள் குழுவினருடன் பல ஆய்வுகளை மேற்கொண்டுள்ளனர்.
அண்ணா பல்கலைக்கழகத்தின் AU-KBC மையத்தில் முனைவர் ஷோபா உட்பட பலர் இத்துறையில் பல ஆய்வுகளை மேற்கொண்டுவருகின்றனர்.

கோவை அமிர்தா பல்கலைக்கழகத்தின் பேராசிரியர் சோமன் அவர்களின் தலைமையிலும் இயந்திரமொழிபெயர்ப்பு உட்பட பல தமிழ்க்கணினிமொழியியல் பணிகள் மேற்கொள்ளப்பட்டுவருகின்றன. தஞ்சைப் பல்கலைக்கழகத்தின் மேனாள் பேராசிரியர் இராஜேந்திரன் போன்றோரும் அங்கே தற்போது கணினித்தமிழ் ஆய்வுகளை மேற்கொண்டுவருகின்றனர்.

மைசூரில் இயங்கும் இந்தியமொழிகள் நடுவண் நிறுவனத்தில் தமிழுக்கான தரவக உருவாக்கம், உருபன்பகுப்பாய்வி போன்ற ஆய்வுப்பணிகள் பேராசிரியர் ல. இராமமூர்த்தி அவர்களின் தலைமையிலான குழுவினர் மேற்கொண்டுவருகின்றனர். 

அண்ணாமலைப் பல்கலைக்கழக மேனாள் பேராசிரியர் ம. கணேசன், ஹைதாராபாத் பல்கலைக்கழகப் பேராசிரியர் முனைவர் அருள்மொழி, செம்மொழித் தமிழ் மத்திய ஆய்வு நிறுவனத்தின் ஆய்வாளர்கள் முனைவர் செல்வதுரை, திரு. அகிலன், திரு. கார்த்திக் சுப்பிரமணியம் ,மேனாள் ஆய்வாளர் முனைவர் பழனிராஜன் ( தற்போது காசர்கோடு மையப் பல்கலைக்கழகம்) ஆகியோரும் பல பணிகளை மேற்கொண்டுவருகின்றனர்.

பேரா. ந. தெய்வ சுந்தரம் சென்னைப் பல்கலைக்கழகத்தில் தனது பணி ஓய்வுக்குப்பிறகு, என் டி எஸ் லிங்கசாஃப்ட் சொலூஷன்ஸ் என்ற ஒரு நிறுவனத்தைத் தொடங்கி, தனது தமிழ்க்கணினிமொழியியல் பணிகளைத் தொடர்ந்துவருகிறார். இன்றைய தமிழுக்கான உருபன் பகுப்பாய்வி, தொடர்ப்பகுப்பாய்வி, இயந்திரமொழிபெயர்ப்பு, மின்னகராதி, தரவக உருவாக்கம், தரவக ஆய்வு மென்பொருள் போன்ற மென்பொருள்களை உருவாக்கிவருகிறார். இவரது குழுவில் மொழியியலாளர்கள், மென்பொருள் நிரலாக்கர்கள் பலர் இணைந்து பணிமேற்கொண்டுவருகின்றனர். ‘மென்தமிழ் – தமிழ்ச்சொல்லாளர்’, ‘மென்தமிழ் ஆய்வுத்துணைவன்’, ‘ மென்தமிழ் – சந்தித்துணைவன் ‘ என்ற மூன்று மென்பொருள்கள் உருவாக்கப்பட்டுள்ளன.

அண்மையில் தமிழ்நாடு அரசின் தமிழ் இணையக்கல்விக்கழகமும் தமிழ்க்கணினிமொழியியல் ஆய்வுக்கான பணிகளைத் தொடங்கியுள்ளது. பேராசிரியர்கள் ஜேம்ஸ், உமாராஜ், தனலட்சுமி ஆகியோர் இணைந்து இதற்கான பணிகளைத் தீவிரப்படுத்திவருகின்றனர்.

மதுரையைச் சேர்ந்த கணினியியல் பேராசிரியர்  ப. பாண்டியராஜா அவர்கள் தமிழ் இலக்கியங்களுக்கான தொடரடைவு மென்பொருளை உருவாக்கியுள்ளார்.

அமெரிக்காவில் பென்சில்வேனியா பல்கலைக்கழகத்தில் பணியாற்றும் மொழியியலாளர் திரு. வாசு ரங்கநாதன் அவர்கள் தமிழ்க்கணினிமொழியியலில் பல ஆய்வுகளை மேற்கொண்டு, மென்பொருள்களையும் உருவாக்கி, இணையத்தில் இட்டுள்ளார். ஆஸ்திரேலியாவில் பணியாற்றிவரும் கணினியியல் துறை அறிஞர் திரு. முகுந்த் அவர்கள் பல ஆண்டுகளாகக் கட்டற்ற மென்பொருள் உருவாக்கத்தில் தன்னை ஈடுபடுத்திக்கொண்டு,  பல குறிப்பிடத்தக்க பணிகளை வெற்றிகரமாகச் செய்துமுடித்துள்ளார். கலிஃபோர்னியாவில் பணியாற்றிவரும் கணினியியல் அறிஞர் திரு. வேல்முருகன் சுப்பிரமணியன் அவர்களும் அண்மையில் தமிழ்க்கணினிமொழியியல் ஆய்வில் ஈடுபட்டுவருகிறார்.


எனக்குத் தெரிந்தவரையில் தமிழ்க்கணினிமொழியியலில் இதுவரை மேற்கொள்ளப்பட்டுள்ள பணிகளைத் தொகுத்துள்ளேன். மேலும் பலர் இத்துறையில் ஈடுபட்டிருக்கலாம். நண்பர்கள் இதுபற்றி விவரங்கள் தெரிந்தால், தயவுசெய்து தெரியப்படுத்தவும்.

 








1 கருத்துகள்:

மணிவானதி சொன்னது…

மிகச்சிறந்த தகவல்கள். மேலும் இதுபோன்ற ஆய்வுகள் வளர தாங்கள்தான் முன்நின்று செயல்படவேண்டும். ஐந்து தலைமுறையை இணைக்கும் பாலமாக இருக்கிறீர்கள். தங்கள் கணினிமொழி ஆய்வு வளர பல்வேறு கல்லூரிகள் பல்கலைக்கழங்கங்களில் கணினிமொழி ஆய்வு தொடர்பாக ஒரு தனித்துறை உருவாக்கினால்தான் இது நிறைவேறும்.

கருத்துரையிடுக

 
Design by Free WordPress Themes | Bloggerized by Lasantha - Premium Blogger Themes | Hot Sonakshi Sinha, Car Price in India