கணினித் தமிழும் தமிழ்மொழிக் கல்வியும்
( 10 – ஆம் உலகத் தமிழாசிரியர் மாநாடு , மலேசியா )
மொழித்தொழில்நுட்பம் ( Language Technology)
சமூக
வாழ்க்கையில் நாம் நமது உணர்வுகளையும் கருத்துகளையும் தேவைகளையும் பிறர்க்குப் புலப்படுத்துவது
மிகத் தேவையான ஒன்றாகும். இந்தப் புலப்படுத்தச்
செயல்பாட்டின் ( Communication ) ஊடே நாம் வாழும் இயற்கையையும் சமூகத்தையும்
புரிந்துகொண்டு, நமக்குத் தேவையான வகையில் மாற்றி, பயன்படுத்திக்கொள்கிறோம்.
செயல்முனைப்புள்ள இக் கருத்துப் புலப்படுத்தச் செயல்பாடே கருத்தாடல்
( Discourse) என்றழைக்கப்படுகிறது.
நாம்
மேற்கொள்கிற கருத்தாடலில் மிகப் பெரிய பங்கு
ஆற்றுவது நமது இயற்கைமொழியே ஆகும். இயற்கைமொழியோடு
( Verbal ) நமது உடல்
அசைவுகள், முகத் தோற்றங்கள், சைகைகள்,
குறியீடுகள், படங்கள் போன்ற
மொழிசாராக் கூறுகளும் ( non-verbal ) நமது கருத்தாடலில் பங்கேற்கின்றன.
பேச்சுமொழியாக
இருந்த பல மொழிகள் தமது வரலாற்றில் எழுத்துமொழிகளாகவும் வளர்ந்தன.
மனிதன் தனது கருத்துகளைக் காலம், இடம்
கடந்து நீடிப்பதற்காக எழுத்துகள்மூலம் பதிவு செய்யத் தொடங்கியதையொட்டி எழுத்துவழக்குகள்
தோன்றி வளர்ந்தன. கல்வெட்டுகள்,
ஓலைச்சுவடிகள், இன்றைய அச்சுப்
படைப்புகள் அனைத்துமே நமது கருத்துகளைப் பதிவுசெய்து, காலம்,
இடம் கடந்து பிறருக்குத் தெரிவிப்பதற்காக நாம் உருவாக்கிய மொழித் தொழில்நுட்பங்களே
( Passive Language Technology) ஆகும்.
தொழில்நுட்பமும்
அறிவியலும் ( Technology and Science)
தொழில்நுட்பக் கருவிகள் என்பவை நமது இயற்கைத் திறன்களின் செயல்பாடுகளை
மேன்மேலும் விரிவாக்கும் கருவிகளே ஆகும் ( enhancement of human
abilities) . நமது கண் பார்வைத் திறனை விரிவாக்கும் கருவிகளே நுண்நோக்கி
( Microscope) , தொலைநோக்கி ( Telescope) ஆகியவை
ஆகும். நமது வாய் மூலம் உருவாக்கும் ஒலிகளை வலுப்படுத்தவும் நெடுந்தூரம் எடுத்துச்
செல்லவும் பயன்படும் கருவிகளே ஒலிபெருக்கி, தொலைபேசி,
அலைபேசி ஆகியவை ஆகும். வேகமாகவும்
விரைவாகவும் இடம்விட்டு இடம்பெயர நமக்குப் பயன்படும் பொறிகளே மிதிவண்டி,
பேருந்து, தொடர்வண்டி
ஆகியவை ஆகும். பறவைபோன்று வானத்தில் பறந்துசெல்ல நாம் உருவாக்கிய பொறியே விமானமாகும்.
மேற்கூறிய
தொழில்நுட்பம் வளர்வதற்கு அடிப்படை,
இயற்கையின் பண்புகளை அறிந்து கூறும் அறிவியலே ஆகும்.
அறிவியல் அறிந்துகூறுகிற உண்மைகளின் அடிப்படையில் தொழில்நுட்பம் நமக்கு
பலவகைக் கருவிகளையும் பொறிகளையும் உருவாக்கித் தருகிறது.
இயற்கையின்
பண்புகளை அறிந்து கூறும் இயற்பியல், வேதியியல்,
உயிரியல் போன்ற அறிவியல்துறைகள் போன்றதே நமது இயற்கைமொழித் திறனைப் பற்றிக்
கூறும் மொழியியல்
துறையாகும் ( Linguistics) . . அதுபோன்று , நமது
இயற்கைமொழித் திறனை மேலும் விரிவாக்க அல்லது வளர்த்தெடுக்க நாம் உருவாக்கிய மொழித்தொழில்நுட்பமே முன்னர் குறிப்பிட்ட எழுத்துமொழி,
கல்வெட்டு, ஓலைச்சுவடி,
அச்சு ஆகியவை ஆகும்.
செயல்முனைப்புள்ள
பொறிகள் ( Active Technology oriented Machines)
இன்றைய
அறிவியல் , தொழில்நுட்பம் ஒரு அடுத்த கட்ட, உயர்
வளர்ச்சியை எட்டியுள்ளது. நாம் உருவாக்குகிற
கருவிகளும் பொறிகளும் நமது கட்டளைகளை ஏதோ ஒரு வகையில் புரிந்துகொண்டு,
நமது இடுகிற கட்டளைகளைச் செயல்படுத்துகின்றன. ஒரு
குறிப்பிட்ட இயற்பியல் தூண்டுதலுக்கு ஒரு குறிப்பிட்ட செயலைப் பொறிகள் மேற்கொள்கின்றன
அல்லது தருகின்றன ( Stimulus - Response ) . . நமது
புவியில் இருந்துகொண்டே செவ்வாய்க் கிரகத்திற்கு ஆய்வுக் கருவிகளை அனுப்பி,
நாம் செய்ய விரும்புகிற பணிகளை அவற்றிற்குப் புலப்படுத்தி,
அவற்றைச் செயல்பட வைக்கிறோம். புரிந்துகொள்ளும்
திறனற்ற பொறிகள் ( Passive Technology Machines) என்ற நிலைமாறி,
இன்று புரிந்துகொண்டு செயல்படும் பொறிகள் ( Active
Technology Machines) - ரபோட்கள்
- என்ற வளர்ச்சிநிலையை நமது தொழில்நுட்பம் பெற்றுள்ளது.
புரிந்துகொண்டு
செயல்படும் பொறிகள் என்று கூறும்போது , எவ்வாறு புரிந்துகொள்கின்றன
என்ற வினா நம் முன் நிற்கிறது. ஒலி,
ஒளி , மின்னோட்டம்
, மின்தடை போன்ற இயற்பியல் ( Physical) கூறுகளைக் புலப்படுத்தக் கூறுகளாகக்
கொண்டு, பல கருவிகள், பொறிகள் செயல்படுகின்றன.
ஆனால் இன்றைய அறிவியல், தொழில்நுட்ப
வளர்ச்சி அடுத்த கட்ட நிலையை எட்டியுள்ளது. இயற்பியல்
கூறுகளோடு, நாம் பயன்படுத்தும் இயற்கைமொழிகளையும் (
Natural languages) நம்மைப் போன்றே
புரிந்துகொண்டு செயல்படும் பொறிகள் உருவாக்கப்பட்டுவருகின்றன.
கணினியில்
மொழித்தொழில்நுட்பம் ( Language Technology in
Computer)
இந்த
உயர்ந்த கட்ட வளர்ச்சிக்கு அடிப்படையானதுதான் கணினியியல் துறையாகும்.
கணினி என்பது நமது கட்டளைகளை மொழிகள் வாயிலாகப் புரிந்துகொண்டு செயல்படும்
ஒரு பொறியாகும். இன்று இந்த மொழிகள் கணினிக்கென்று உருவாக்கப்படுகிற செயற்கைமொழிகளாக
( சி, சி+, ஜாவா
போன்ற மொழிகளாக) அமைந்துள்ளன. இருப்பினும்
இந்தச் செயற்கைமொழிகள் வாயிலாக நாம் இடுகிற கட்டளைகளைக் கணினிப் பொறி புரிந்துகொண்டு,
நாம் இடுகிற பணிகளை நிறைவேற்றுகின்றன. எனவே
இது கணினிக்கென்று உருவாக்கப்பட்டுள்ள செயற்கைமொழித் தொழில்நுட்பமாகும்.
அடுத்த
கட்ட வளர்ச்சியாக , நமது இயற்கைமொழிகளின் வாயிலாகவே
நமது கட்டளைகளைக் கணினி புரிந்துகொண்டு செயல்படுவதற்குத் தேவையான அறிவியலும்,
தொழில்நுட்பமும் இன்று வளர்ந்துவருகின்றன. கணினியியல்
நோக்கில் நமது இயற்கைமொழிகளை ஆராயும் அறிவியலே கணினிமொழியியலாகும்
( Computational Linguistics) . அதன் அடிப்படையில் உருவாக்கப்படுகிற
தொழில்நுட்பமே கணினிக்கேற்ற மொழித்தொழில்நுட்பமாகும் ( Active
Language Technology ) .
புதியவகை
மொழித்தொழில்நுட்பம்
நாம்
முன்னர் குறிப்பிட்ட கல்வெட்டு, ஓலைச்சுவடி,
அச்சு போன்றவையும் மொழித்தொழில்நுட்பங்களே என்றாலும் அவற்றிற்கும் கணினிவழி மொழித்தொழில்நுட்பத்திற்கும்
அடிப்படை வேறுபாடு உள்ளது. முந்தைய மொழித்தொழில்நுட்பங்கள்
எல்லாம் நமது மொழிவழிக் கருத்துகளைப் பதிந்துவைக்கும் தொழில்நுட்பமாகவே
( Passive Language Technology) அமைகின்றன.
பதிந்துவைக்கிற கருத்துகளைப் புரிந்துகொண்டு செயல்படும் மொழித்தொழில்நுட்பம்
அல்ல அவை. ஆனால் கணினிவழி மொழித்தொழில்நுட்பத்தின் அடிப்படையே நாம் மொழிவழி தெரிவிக்கிற
கருத்துகளைப் புரிந்துகொண்டு, செயல்படும்
செயல்முனைப்புள்ள மொழித்தொழில்நுட்பமாகும் ( Active
Language Technology) .
நாம்
நமது இயற்கைமொழிவாயிலாக முன்வைக்கப்படுகிற கருத்துகளைப் புரிந்துகொண்டு செயல்படுவதுபோல,
கணினியும் புரிந்துகொண்டு செயல்படவேண்டும். பேச்சு
வழியாகவோ எழுத்துவழியாகவோ நாம் கருத்துகளை முன்வைக்கும்போது,
கணினியானது மொழித்தொடர்களை ஆய்ந்து, கருத்துகளைப்
பிரித்தெடுக்கும் திறனைப் ( Natural Language Processing -
NLP ) பெறவேண்டும்.
நம்மைப் போன்றே மொழிவழிச் செயல்பாடுகளை மேற்கொள்ளவேண்டும்.
கணினித்தமிழ்
வளர்ச்சியில் இரண்டு கட்டங்கள்
மேற்கூறிய
கருத்துகளின் அடிப்படையில் நோக்கினால், கணினித்தமிழ்
என்பது தமிழ்மொழியைக் கணினிபோன்ற மின்னணு சாதனங்கள் கற்றுக்கொண்டு,
அதனடிப்படையில் நாம் தமிழில் இடுகிற கட்டளைகளைப் புரிந்துகொண்டு செயல்படுவதே
ஆகும்.
கணினித்தமிழின்
முதல் கட்டம், தமிழ்மொழியைக் கல்வெட்டு, ஓலைச்சுவடி,
அச்சு ஆகியவற்றில் பதிவதுபோல, கணினியில் பதிவு செய்வதாகும்.
தமிழ் எழுத்துருக்களை உருவாக்குவது. விசைப்பலகைகளை
உருவாக்குவது, இணையதளம், மின்னஞ்சல்,
வலைப்பூக்கள், விக்கிபீடியா
போன்றவற்றில் தமிழை இடம்பெறச்செய்வது போன்ற செயல்களை மேற்கொள்வதாகும்.
இவற்றில் தற்போது நாம் குறிப்பிட்ட அளவு வெற்றியடைந்துள்ளோம்.
இந்த வெற்றியில் ஒருங்குறி ( Unicode) வருகை, விசைப்பலகை
தரப்படுத்தம் ஆகியவை நமக்கு பெரிதும் உதவியுள்ளன.
கணினித்தமிழின்
அடுத்த உயர்ந்த கட்டம், கணினிக்குத்
தமிழ்மொழியைக் கற்றுக்கொடுத்து, நமது பல்வேறு
மொழித் தொழில்நுட்பத் தேவைகளை நிறைவேற்றிக்கொள்வதாகும். சொல்திருத்தி,
இலக்கணத் திருத்தி , எழுத்து
- பேச்சுமாற்றி ( Text to Speech - TTS ) , பேச்சு
- எழுத்துமாற்றி ( Automatic Speech Recognizer -
ASR ), ஒளிவழி எழுத்தறிவான் ( Optical Character Recognizer -
OCR ), இயந்திரமொழிபெயர்ப்பு ( Automatic Machine Translation
- MT ) போன்ற மொழித்தொழில்நுட்பங்கள் தமிழில் பெருகவேண்டும்.
கணினிக்குத் தமிழ் கற்பித்தல் ( Teaching Tamil to Computer)
இதற்கு
முதல் அடிப்படை, தமிழ்மொழி அறிவைக் கணினிக்குக் கொடுப்பதேயாகும்.
மனிதமூளை இயற்கைமொழியைக் கற்றுக்கொண்டு, பயன்படுத்துவதற்கும்,
கணினி கற்றுக்கொண்டு, பயன்படுத்துவதற்கும்
வேறுபாடுகள் உண்டு. மனிதமூளை ஒரு உயிரி-வேதியியல்
உறுப்பாகும் ( bio - chemical organ) . கணினி அப்படிப்பட்டதல்ல.
அது மின்னணுவியல் அடிப்படையில் அமைந்துள்ள ஒரு பொறியேயாகும்
( Electronic Chip) . எனவே ஒரு இயற்கைமொழியை மனிதமூளைக்குக் கற்றுக்கொடுப்பதற்காக
உருவாக்கப்படுகிற இலக்கணம், அகராதி போன்றவற்றை
அப்படியே கணினிக்குக் கொடுத்து, அதைக் கற்றுக்கொள்ளச்
செய்யமுடியாது.கணினியின் திறனுக்கேற்றவாறு மொழியைக் கற்றுக்கொடுப்பதில் இரண்டு கருத்துகளைக்
கவனத்தில் கொள்ளவேண்டும்.
ஒன்று,
தமிழ்மொழி இலக்கணத்தைக் கணினிக்கேற்ற கணிதவாய்பாடுகளாக
( mathematical formulae) மாற்றிக்
கொடுப்பதாகும். சுழியம், ஒன்று என்ற இரண்டு எண்களின் அடிப்படையில்தான்
கணினி எந்தவொரு அறிவையும் பெற்றுக்கொள்கிறது. இந்த
இரண்டு எண்களைப் பலவகைகளில் கையாளுவதன்மூலமே கணினி தனக்கு இடப்படுகிற எந்தவொரு கட்டளையையும்
செயல்படுத்துகிறது. மொழி அறிவும் எண்களின் அடிப்படையில்
அமைகிற கணினி வாய்பாடுகளாக அமையும்போதுதான், கணினியால்
அதைக் கையாளமுடியும். எனவே மனித மூளைக்காக உருவாக்கப்பட்டுள்ள
தொல்காப்பியம், நன்னூல் போன்ற இலக்கண நூல்களைக் கணினிக்கேற்ற கணிதவழி இலக்கணமாக
( Computational Tamil Grammar ) மாற்றிக், கணினிக்கு
அளிக்கவேண்டும்.
மற்றொன்று,
நாம் நமது மொழியைக் கையாளும்போது, உலகத்தைப்பற்றிய
நமது பின்புற அறிவு ( Pragmatic Knowledge )மிகவும் உதவுகிறது.
அதன் பயனாக, சொல்லிலோ அல்லது
தொடரிலோ பொருள் மயக்கம் ( Word Sense Ambiguity ) ஏற்பட்டால்,
பேசப்படுகிற பொருள், பேசும் சூழல்
போன்றவை நமக்கு உதவி செய்து, பொருள் மயக்கத்தைத்
தவிர்க்கின்றன ( Disambiguation ) . கணினிக்கு இதுபோன்ற பின்புல அறிவு இன்று
அமையவில்லை. எனவே, அதனால் நம்மைப்போன்று பொருள் மயக்கத்தைத்
தவிர்க்கமுடியாது. இச்சூழலில் பொருள் மயக்கத்தைத் தவிர்ப்பதற்குக்
கணினிக்குப் பலவகைகளில் நாம் உதவவேண்டும்.
மேற்கூறிய
இரண்டையும் கையாளுவதற்கான உத்திகளைத் தருவதே கணினிமொழியியல் என்ற ஒரு அறிவியல் துறையாகும்.
இந்த அறிவியல்துறையின் அடிப்படையில் தமிழ்மொழி அறிவு
( இலக்கணம், சொற்களஞ்சிய
அறிவு போன்றவை) கணினிக்கேற்ற தமிழ்மொழி அறிவாக மாற்றியமைக்கப்படவேண்டும்.
இதுவே கணினித்தமிழ் இலக்கணமாகும்.
கணினிவழித்
தமிழ் ஆய்வு ( Computational Tamil Research )
பேச்சொலி,
எழுத்து, சொல், தொடர்,
பனுவல், பொருண்மை என்று பல நிலைகளில் தமிழ்மொழி
அமைப்பு கணினிமொழியியல் நோக்கில் ஆராயப்படவேண்டும். அப்போதுதான்
தமிழ்மொழியைக் கணினிக்குக் கற்றுக்கொடுக்கமுடியும். இவ்வாறு
கற்றுக்கொடுக்கும்போதுதான், அதனடிப்படையில்
நமக்குத் தேவையான தமிழ்மொழித் தொழில்நுட்பங்களை ( Tamil
Language Technology ) நம்மால்
உருவாக்கமுடியும். தமிழ் மென்பொருள்கள் உருவாகும்.
மேற்கூறிய
கணினித்தமிழ் இலக்கண உருவாக்கப்பணிகளில் முதலாவது, தரவுமொழியியல்
( Corpus Linguistics ) அடிப்படையிலான
தமிழ் ஆய்வாகும். சங்கத் தமிழிலிருந்து இன்றைய தமிழ்வரை
, தமிழின் இலக்கணத்தையும் சொற்களஞ்சியத்தையும்
பெறுவதற்குத் தமிழ்த்தரவகம் ( Tamil Corpus ) உருவாக்கப்படவேண்டும்.
உருவாக்கப்பட்ட
தமிழ்த் தரவகத்தின் அடிப்படையில் தமிழ்மொழியின் அமைப்பு ( இலக்கணம்)
எழுத்து, சொல், தொடர்
போன்ற அனைத்து நிலைகளிலும் ஆராயப்படவேண்டும். உருபன்
பகுப்பாய்வி ( Morphological Parser ), தொடரன் பகுப்பாய்வி
( Syntactic Parser ) போன்ற
பல ஆய்வுக் கருவிகள் தமிழுக்கு உருவாக்கப்படவேண்டும்.
கணினிமொழியியல்
அடிப்படையில் இன்றைய எழுத்துத் தமிழை எழுத்து, சொல்
நிலைகளில் ஆராயும் உருபன் பகுப்பாய்வியை இக்கட்டுரை ஆசிரியர் தனது ஆய்வுக் குழுவினருடன்
இணைந்து உருவாக்கியுள்ளார். அதன் பயனாக
இன்று சில மொழி பதிப்புக் கருவிகளை உருவாக்க முடிந்துள்ளது.
குறிப்பாக, சொற்பிழைதிருத்தி,
சந்திப்பிழைதிருத்தி , அயல்மொழிச்சொல்
தவிர்ப்பு போன்ற சில தமிழ்மொழிக்கான மென்பொருள் கருவிகளை உருவாக்கமுடிந்துள்ளது.
தமிழ்
உருபன் பகுப்பாய்வியைத் தொடர்ந்து, தமிழ்த்தொடரன்
பகுப்பாய்வி உருவாக்கும் முயற்சி மேற்கொள்ளப்பட்டுவருகிறது.
இந்த முயற்சி வெற்றியடையும்போது, தமிழ்த்தொடரியல்
அடிப்படையில் தொடர் இலக்கணப் பிழைகளைத் திருத்தும் மொழிக்கருவியும் உருவாக்கமுடியும்.
தமிழ்ச்சொற்களஞ்சிய
அறிவையும் கணினிமொழியியல் அடிப்படையில் கணினிக்கு அளிக்கப்படவேண்டும்.
அத்தோடு,
தமிழ்மொழியின் ஒலியியல் அடிப்படைகளைப் பற்றிய ஆராய்ச்சி மிக முக்கியமானதாகும்.
தமிழ் எழுத்துகளைப் பேச்சொலிகளாக மாற்றி வாசித்துக்காட்டும் திறனையும்,
அதுபோன்று நமது பேச்சைக் கணினி கேட்டு , அதை
எழுத்தில் எழுதிக்காட்டும் திறனையும் கணினிக்கு அளிப்பதற்கு இந்த ஆய்வு தேவையாகும்.
மேற்கூறிய
அடிப்படை தமிழ்மொழி ஆராய்ச்சிப் பணிகள் வெற்றிகரமாக முடிவடைவதையொட்டியே
, தமிழ்மொழிக்கான கணினிமொழித்தொழில்நுட்பம் வளர்ச்சியடையமுடியும்.
கணினிவழி
தமிழ்க்கல்வி ( Computer Assisted Tamil Language Teaching
)
கணினியில்
மொழித்தொழில்நுட்பம் பெற்றுள்ள வளர்ச்சியின் பயனாக இன்று மாணவர்களுக்குத் தமிழ்மொழி
கற்பித்தலில் கணினிக்குக் குறிப்பிடத்தக்க பங்கு உள்ளது. தமிழ்
இலக்கணத்தையும் சொற்களஞ்சியத்தையும் மாணவர்களுக்குக் கற்றுக்கொடுப்பதில் ஆசிரியருக்குத்
துணையாகக் கணினி செயல்படமுடியும். மொழி
கற்றலில்
இடம்பெறும் பல்வேறு செயல்பாடுகளில் கணினியானது மாணவர்களோடு ஊடாட்டம்
( Interaction ) புரிந்து,
அவர்களுக்கு உதவமுடியும்.
இரண்டுவகைகளில்
கணினியைப் பயன்படுத்தலாம். ஒன்று,
தமிழ் இலக்கணத்தை நேரடியாகக் கற்றுக்கொடுக்கவும் பயன்படுத்தலாம்.
மற்றொன்று, அவ்வாறு ஆசிரியர்
மாணவருக்குக் கற்றுக்கொடுத்தபிறகு, மாணவரின் மொழிப்
பயன்படுத்தத்தை வளர்ப்பதற்காகவும் பயன்படுத்தலாம்.
இக்கட்டுரை
ஆசிரியர் மேற்கூறிய இரண்டு பயன்பாடுகளுக்கும் சில மென்பொருள்களை உருவாக்கியுள்ளார்.
மென்தமிழ் ஆய்வுத் துணைவன் ( Mentamizh Research Companion ) என்ற தமிழ் மென்பொருள் மாணவருக்குத்
தமிழின் எழுத்து, அசை, சொல்
, சந்தி ஆகியவைபற்றிய இலக்கணத்தையும் தமிழ்ப் பனுவல்களில் சொற்கள் பயன்படும்
முறைபற்றியும் கற்றுக்கொடுக்கும் ஒரு மென்பொருள் ஆகும். தமிழ்மொழி
ஆய்வாளர்களுக்கும் பல வகைகளில் பயன்படும் மென்பொருளாகும் இது.
அதன்
அடிப்படையில் மாணவர்கள் தங்களது எழுதும் திறனை வளர்த்துக்கொள்ளக் கணினிவாயிலாக உரைகளைத்
தயாரிக்கும்போது, அவர்களுக்கு உதவும் சொற்பிழை திருத்தி,
சந்திப்பிழைதிருத்தி, அயற்மொழிச்சொல்சுட்டி,
அகராதிகள் போன்ற பல கருவிகளை உள்ளடக்கிய மென்தமிழ் என்ற ஒரு தமிழ்ச்சொல்லாளரையும் ( Tamil Wordprocessor) உருவாக்கியுள்ளார்.
இக்கட்டுரையில்
மென்தமிழ்ச் சொல்லாளரைப் பயன்படுத்தி, எவ்வாறெல்லாம்
மாணவர்கள் தங்கள் எழுதும்திறனை வளர்த்துக்கொள்ளலாம் என்பதுபற்றி விளக்கம் அளிக்கப்படுகிறது.
1)
தமிழில் மாணவர்களுக்கு ஒலி ஒற்றுமையுடைய ல,ள,ழ
எழுத்துகள், னந,ன,ண
எழுத்துகள், ர,ற எழுத்துகள் ஆகியவற்றைப் பயன்படுத்துவதில் குழப்பங்கள் ஏற்படலாம்.
அப்போது அவர்களுக்கு உதவிசெய்ய மயங்கொலிச்சொல் அகராதி ஒன்று கொடுக்கப்பட்டுள்ளது.
மணம், மணம் என்ற
இரண்டு சொற்களுமே தமிழ்ச்சொற்கள்தான். ஆனால் பொருள்வேறுபாடு
உடைய இருவேறு சொற்கள் அவை. அதை எடுத்துக்காட்டும்வகையில்
அகராதி அமைந்துள்ளது.
2)
அடுத்து, சில சொற்களில் சரியான எழுத்துகளுக்குப்பதிலாக
தவறான எழுத்துகளை மாணவர்கள் பயன்படுத்தலாம். அப்போது
அது தவறு என்பதை எடுத்துக்கூறி, அச்சொல்லைத்
திருத்த மென்தமிழ் உதவும். எடுத்துக்காட்டாக,
தமிள் , ஆங்கிளம்,
மளாயா என்று தவறாக எழுதப்பட்டிருந்தால்,
மென்தமிழ் அவற்றைத் தமிழ், ஆங்கிலம்,
மலாயா என்று திருத்தி அளிக்கும்.
3)
மேலே குறிப்பிட்டுள்ள சொற்கள் வேர்ச்சொற்கள். அவற்றில்
விகுதிகள் இல்லை. ஆனால் விகுதி ஏற்ற சொற்களில் தவறுகள்
இருந்தாலும் அவற்றையும் மென்தமிழ் திருத்தி உதவும். தமிளுக்கு
, ஆங்கிளத்தில்தாண் , மலாயாவிளிருந்து என்று
விகுதி ஏற்ற சொற்களில் எழுத்துப் பிழைகள் காணப்பட்டாலும், அவற்றையும்
மென்தமிழ் திருத்தித் தரும்.
4)
தமிழில் சொற்களுக்குள் உயிர் எழுத்தை அடுத்து உயிர் எழுத்து வரக்கூடாது.
அவ்வாறு வரும்போது, அவற்றிற்கிடையில்
உடம்படுமெய் தோன்றும். இதற்கு அடிப்படை தமிழ் அசையின் அமைப்புவிதிகளேயாகும்.
இதில் மாணவர்கள் தவறு செய்திருந்தால், மென்தமிழ்
தவறுகளைத் திருத்தித் தரும். தெருஆ ,
இலைஆ என்று சொற்கள் தவறாகக் காணப்பட்டால்,
மென்தமிழ் அவற்றைத் தெருவா , இலையா
என்று திருத்தித் தரும்.
5)
தமிழில் மகர ஒற்று இறுதி பெயர்ச்சொற்கள் வேற்றுமை விகுதிகளை ஏற்கும்போது,
இடையில் அத்துச் சாரியை தோன்றும். அதுபோன்று
நெடில்தொடர் குற்றியலுகரச் சொற்கள் வேற்றுமை விகுதிகள் ஏற்கும்போது இறுதி குற்றியலுகரம்
பயின்றுவருகிற வல்லின எழுத்து இரட்டிக்கும். இந்த
விதிகளில் மாணவர்கள் தவறு செய்திருந்தால், மென்தமிழ்
அவற்றைத் திருத்தித் தரும். மரமை
, தரமோடு , வளமில் என்பதை
மரத்தை , தரத்தோடு,
வளத்தில் என்றும் நாடை ,
காடில், ஆடோடு என்பதை
நாட்டை, காட்டில், ஆட்டோடு என்று
மென்தமிழ் திருத்தித் தரும்.
6)
தமிழ்ச்சொற்களில் அடிச்சொல்லோடு விகுதிகள் இணையும்போது,
அகச்சந்தி என்றழைக்கப்படும் புணர்ச்சி விதிகள் சரியாகக் கையாளப்படவேண்டும்.
இல்லையென்றால் பொருளே மாறிவிடும். எடுத்துக்காட்டாக,
கடை+கள் என்பதை கடைகள்
( இங்கு கள் என்பது பன்மைவிகுதி ) என்று
எழுதினால் ஒரு பொருள். கடைக்கள் ( இங்கு
கள் என்பது ஒரு வேர்ச்சொல்) என்று எழுதினால்
மற்றொரு பொருள்.
எனவே
அகச்சந்திகளில் மாணவர்கள் தவறு செய்யக்கூடாது. அவ்வாறு
தவறுகள் செய்யப்பட்டிருந்தால், மென்தமிழ்
அவற்றைத் திருத்தித் தரும். பசுகள்,
பலாகள், தெருகள் என்று
தவறாக எழுதப்பட்டிருந்தால் அவற்றைப் பசுக்கள், பலாக்கள்,
தெருக்கள் என்று திருத்தித் தரும்.
இரண்டு சொற்கள் இணைந்து வரும்
தொகைகளில்
நிகழும் சந்திப் பிழைகளைத் தற்போது மென்தமிழ் மென்பொருளால் திருத்த இயலாது.
அதற்கான முயற்சிகள் மேற்கொள்ளப்பட்டுவருகின்றன.
7)
தமிழில் ஒரு சொல்லுக்கும் ( நிலைமொழி
) அதற்கு அடுத்த சொல்லுக்கும்
(
வருமொழி) இடையில் எழுத்துகள் தோன்றுவதும்,
திரிதலும், மறைதலும் உண்டு.
இதுவே புறச்சந்திகள் என்று அழைக்கப்படுகின்றன.
புறச் சந்தியில் மாணவர்கள் தவறு செய்தால், மென்தமிழ்
பிழைகளைத் திருத்துவதில் மாணவர்களுக்கு உதவும்.
படித்து
பார்த்தான், படிக்க பார்த்தான்,
அவனை பார், அவனுக்கு கொடு
, மிக பெரிய போன்ற தவறான தொடர்களைப் படித்துப்
பார்த்தான், படிக்கப்
பார்த்தான், அவனைப் பார், அவனுக்குக்
கொடு, மிகப் பெரிய என்று மென்தமிழ்
திருத்திக் கொடுக்கும்.
தவறாக
ஒற்றுகளை மாணவர்கள் இட்டிருந்தாலும் மென்தமிழ் அவற்றைத் திருத்தித் தரும்.
படித்தப் பையன், வந்துப் பார்த்தான்
என்று தவறாக மாணவர்கள் எழுதியிருந்தால் மென்தமிழ் அவற்றைப் படித்த
பையன், வந்து பார்த்தான் என்று திருத்தித்
தரும்.
8)
மாணவர்கள் தமிழில் எழுதும்போது, பிறமொழிச்சொற்களைக்
கலந்து எழுதியிருந்தால் அவற்றையும் திருத்தித் தரும் வசதி மென்தமிழில் இடம் பெற்றுள்ளது.
வேர்ச்சொற்கள் மட்டுமல்லாமல் விகுதிகள் ஏற்ற சொற்களாக இருந்தாலும் மென்தமிழ்
அவற்றைத் திருத்தித் தரும்.
அயல்மொழிச்
சொல் கலந்த உரை :
நான்
பஸ்ஸில் ஸ்கூலுக்குச் சென்றேன். அங்கு டீச்சரைப்
பார்த்தேன். பின்பு கேண்டீனில் டிபன் சாப்பிட்டேன்.
அங்கிருந்து ட்ரெயினில் யுனிவர்சிட்டிக்குப் போனேன்.
அங்கு புரபெசரைப் பார்த்தேன்.
மென்தமிழ்
திருத்திய உரை:
நான்
பேருந்தில் பள்ளிக்குச் சென்றேன். அங்கு ஆசிரியரைப்
பார்த்தேன். பின்பு உண்பகத்தில் சிற்றுண்டி உண்டேன். அங்கிருந்து
தொடர்வண்டியில் பல்கலைக்கழகத்துக்குப் போனேன். அங்கு
பேராசிரியரைப் பார்த்தேன்.
9)
மேலும் எண்களைத் தமிழ் எழுத்தில் எழுதிக் காட்டும் கருவியும் மென்தமிழில்
இடம் பெற்றுள்ளது.
98789
456346
தொண்ணூற்றெட்டாயிரத்து எழுநூற்று எண்பத்தொன்பது
நான்குஇலட்சத்து
ஐம்பத்தாறாயிரத்து முந்நூற்று
நாற்பத்தாறு
10)
உரையில் உள்ள சொற்களை அகரவரிசைப்படுத்தவும், னகரவரிசைப்படுத்தவும்
மென்தமிழில் வசதிகள் உண்டு. மேலும் சொல்லடைவும்
தயாரிக்கலாம்.
11)
தமிழ் - ஆங்கில அகராதி,
ஆங்கிலம் - தமிழ் அகராதி
, அயல்மொழிச்சொல் அகராதி என்று பல வகை அகராதிகளும் மாணவர்களுக்குப் பயன்படும்
வகையில் தயாரிக்கப்பட்டுள்ளன.
முடிவுரை
இன்றைய
கணினி உலகில் தமிழ்மொழியை மாணவர்கள் கற்கும்போது, அவர்களுக்கு
உதவியாகப் பயன்படும் வகையில் மென்தமிழ் மென்பொருள் உருவாக்கப்பட்டுள்ளது.
இன்றைய எழுத்துத் தமிழின் இலக்கணத்தைக் கணினிக்கு மென்பொருள் வாயிலாக
மென்தமிழ் அளித்துள்ளது. அதன் அடிப்படையில்
மாணவர்கள் பிழைகள் ஏதும் செய்திருந்தால், கணினியானது
செயல்முனைப்புடன் அவற்றைத் திருத்தித் தரும். அவர்கள் நல்ல தமிழில் எழுதப் பயிற்சி
அளிக்க மென்தமிழ் போன்ற தமிழ் மென்பொருள்கள் பயன்படும்.
தமிழ்
இலக்கண அறிவை முழுமையாகக் கணினிக்குக் கொடுப்பதில் மேலும் பல ஆராய்ச்சிகள் மேற்கொள்ளவேண்டியுள்ளது.
அதனடிப்படையில்தான் மென்தமிழ் மென்பொருளின் செயல்பாடும் வளர்ச்சியடையும்.
-
0 கருத்துகள்:
கருத்துரையிடுக