சனி, 25 மே, 2024

கணினி உருபனியலும் தமிழ் மென்பொருள்களும்

 

கணினி உருபனியலும் தமிழ் மென்பொருள்களும்

இன்றைய மின்னணு உலகில் மின்னணுக் கருத்துப்புலப்பாட்டுச் சாதனங்களில் ஒரு மொழி முழுமையாக இடம்பெறவேண்டியது மிக மிகத் தேவையான ஒன்றாகும். அவ்வாறு இடம்பெறமுடியாத சூழல் ஒரு மொழிக்கு ஏற்பட்டால், அந்த மொழியின் எதிர்காலம் கேள்விக்குரியதாகிவிடும்.

கணினித்தமிழின் முதல் கட்டம்

70-களில் தமிழ்மொழியின் எழுத்துக்களைக்கூட கணினியில் காணமுடியாத ஒரு சூழல். தமிழ் எழுத்துருக்களோ ( Fonts)   தமிழ் விசைப்பலகைகளோ (Keyboard drivers)  அப்போது கிடையாது. பின்னர் சிங்கப்பூர், மலேசியா, தமிழ்நாடு, மேற்கு நாடுகளில் இருந்த தமிழ் ஆர்வலர்கள்  முன்முயற்சியால் கணினியில் தமிழ் தோன்றத் தொடங்கியது. பலவகைத் தமிழ் எழுத்துருக்கள், விசைப்பலகைகள் மக்களின் பயன்பாட்டுக்குக் கிடைக்கப்பெற்றன. ஆனால் அனைவரும் பயன்படுத்தக்கூடிய பொதுவான எழுத்துருக்களோ விசைப்பலகைகள் நிலவாத ஒரு சூழலால் கணினித்தமிழ் வளர்ச்சியில் சில சிக்கல்கள் நீடித்தன என்பது உண்மையே. இருப்பினும் மேற்கூறிய தமிழ் எழுத்துருக்கள், விசைப்பலகைகளின் வளர்ச்சியானது கணினித்தமிழை அடுத்த கட்ட வளர்ச்சிக்கு இட்டுச்சென்றது.

1999-ஆம் ஆண்டு அன்றைய தமிழ்நாட்டு முதல்வர் மறைந்த மாண்புமிகு கலைஞர் அவர்கள், மறைந்த நடுவண் அரசின் அமைச்சர் மறைந்த மாண்புமிகு முரசொலி மாறன் அவர்கள், மறைந்த பேராசிரியர் திரு. மு. ஆனந்தகிருஷ்ணன் அவர்கள் ஆகியோரின் முயற்சிகளால் தமிழ் இணைய மாநாடு நடைபெற்றது. தமிழ் எழுத்துருக்கள், விசைப்பலகைகள் தரப்படுத்தப்பட்டன. அதன் பயனாக, கணினித் தமிழானது தனது அடுத்த கட்ட வளர்ச்சிக்கு நகர்ந்தது.

தமிழுக்கான சொல்லாளர் மென்பொருள்கள் உருவாக்கப்பட்டன. சொற்பிழை திருத்திகள் அறிமுகமாயின. இதன் முதல் கட்டத்தில் கணினியியல் துறையின் தொழில்நுட்ப வளர்ச்சி தமிழுக்கு உதவியது. ஆனால் கணினியின் தொழில்நுட்பத் திறனோடு தமிழ் இலக்கணம், தமிழ் மொழியியல் துறையினரும் இணைந்து செயல்பட்டால் கணினித்தமிழின் வளர்ச்சியை அடுத்த உயர்நிலைக்குக் கொண்டுசெல்லலாம் என்பது அனைவராலும் உணரப்பட்டது. 

இந்தக் காலகட்டத்தில்தான் உலக அளவில் வளர்ந்திருந்த இயற்கைமொழி ஆய்வு ( NLP - Natural Language Processing) , கணினிமொழியியல் (Computational Linguistics)  ஆகியவற்றின் முக்கியத்துவம் தமிழ்நாட்டிலும் உணரப்பட்டது. அதன் முதற்கட்டமாக, கணினி உருபனியல் அறிவைத் தமிழுக்கும் செயல்படுத்தக் கல்வி நிறுவனங்களும் பேராசிரியர்களும் முனைந்தனர்.

கணினி மொழியியல்  ( Computational Linguistics)

இயற்கைமொழிகளின் அமைப்பையும் (Structure)  செயற்பாட்டுமுறையையும் (Functions)  கணினிநோக்கில் ஆய்வுசெய்கிற ஒரு துறையே கணினிமொழியியல் என்ற ஒரு துறை. இதன் அடிப்படை நோக்கம், இயற்கைமொழிகளைக் கணினிக்குக் கற்றுக்கொடுப்பதாகும். ஒரு இயற்கைமொழியின் அமைப்புபற்றிய அறிவைக் கணினிக்குக் கொடுக்கமுடிந்தால், மனிதர்கள் இயற்கைமொழியைப் பயன்படுத்துவதுபோன்று கணினியும் பயன்படுத்தமுடியும் என்ற கருதுகோள் முன்வைக்கப்பட்டது. மனிதர்கள் மேற்கொள்கிற மொழிச் செயல்பாடுகளைக் கணினியும் மேற்கொள்ளமுடியும் என்று கருதப்பட்டது. அதன் இறுதி நோக்கம், மனிதரைப்போன்று சிந்திக்கவும் சிந்தித்தவற்றை வெளிப்படுத்தவும் கூடிய கணினியை (Cognitive Machine)  உருவாக்குவதே ஆகும்.

மனித மூளைக்கான இலக்கணமும் கணினிக்கான இலக்கணமும்

மேற்கூறியதை நிறைவேற்ற முதலில் கணினியானது இயற்கைமொழிகளைக் கற்றுக்கொள்ளவேண்டும். இதற்கு முதற்படி, இயற்கைமொழிகளின் அமைப்புக்களையும் செயற்பாடுகளையும் கணினி நோக்கில் கண்டறிவதே ஆகும். இதுவரை, இயற்கைமொழிகளின் அமைப்பை ஆய்வுசெய்கிற ஒரு மிகப் பெரிய துறையாக மொழியியல் வளர்ந்திருக்கிறது. இயற்கைமொழிகள்பற்றிய பல்வேறு கோட்பாடுகள், ஆய்வுமுறைகளை மொழியியல் அறிஞர்கள் முன்வைத்துள்ளனர். குறிப்பாக, நோம் சாம்ஸ்கியின் பங்களிப்பு மொழியியலை ஒரு மிக உயர்ந்த கட்டத்திற்கு இட்டுச் சென்றுள்ளது என்பது அனைவரும் அறிந்த ஒன்றே.

ஆனால் மேற்கூறிய மொழியியல் ஆய்வுகள் எல்லாம் மனிதர்களை - மனித மூளையை (Human Brain)  - அடிப்படையாகக் கொண்டவையே ஆகும். மனித மூளையின் மொழித்திறன்பற்றியதே ஆகும்; மனித மூளை எவ்வாறு ஒரு மொழியைக் கற்றுக்கொள்கிறது, கற்றுக்கொண்ட அறிவை எவ்வாறு தேக்கிவைக்கிறது, எவ்வாறு பயன்படுத்துகிறது என்பவைபற்றியதே ஆகும். ஆனால் மின்னணுச் சாதனமான கணினியின் மின்னணு மூளையானது ( Electronic Chip Brain) சிந்தனை, மொழி இரண்டிலும் மனிதமூளைக்கு இணையாக அமையமுடியுமா என்பது ஆய்வாளர்களின் முன்னால் நிற்கிற ஒரு வினாவாகும். அதனைத் தொடர்ந்து,  பொது மொழியியலில் (General Linguistics) இருந்து - அதை அடிப்படையாகக்கொண்டு - கணினிமொழியியல் (Computational Linguistics) என்ற ஒரு புதுத் துறையின் வளர்ச்சி இன்றியமையாதது என்ற கருத்து ஆய்வாளர்கள் இடையே உணரப்பட்டது. அதன் பயனே இன்று வளர்ந்துநிற்கிற கணினிமொழியியலாகும்.

 மொழி ஆய்வின் படிநிலைகள்

மொழியியலில் மொழிபற்றிய ஆய்வானது பல படிநிலைகளில் மேற்கொள்ளப்படுகிறது. ஒலியனியல் ( Phonology) , உருபனியல் (Morphology), தொடரியல் (Syntax) , பொருண்மையியல் (Semantics) , சூழல்சார் பொருண்மையியல் (Pragmatics) என்று பல நிலைகள் இருக்கின்றன. கணினியின் பேசும் திறனுக்கு அல்லது வாசிக்கும் திறனுக்கு ஒலியனியல் பயன்படும். மொழித்தொடர்களின் அல்லது உரைகளின் பொருண்மையை உணரவும் பொருள்பொதிந்த மொழித்தொடர்களை உருவாக்கவும் உருபனியல், தொடரியல், பொருண்மையியல், சூழல்சார் பொருண்மையியல் பிரிவுகள் பயன்படும்.

 உருபனியல் ஆய்வு ( Morphological analysis)

னிப் பேச்சொலிகள் (Phones / Speech Sounds)  அல்லது எழுத்துக்களையும் (Scripts / Alphabets) பொருண்மை பொதிந்த சொற்றொடர்களையும் (Sentences)   இணைக்கும் பாலமே சொற்கள்பற்றிய ஆய்வு - உருபனியல் ஆய்வு (Morphology)  - ஆகும். இந்த ஆய்வானது கணினி நோக்கில் அமைவதே கணினி உருபனியல் (Computational Morphology)  ஆகும். ஒரு மொழியில் கணினி உருபனியல் எந்த அளவு வெற்றிபெறுகிறதோ, அந்த அளவுக்குத்தான்  சொற்றொடர் ஆய்வு, பொருண்மை ஆய்வு ஆகியவை எல்லாம் அமையும்.

ஒரு குறிப்பிட்ட மொழியில்,

(1)  அகராதி அல்லது அடிச்சொற்களின் வகைப்பாடு  ( Parts of Speech - POS) - பெயர், வினை, பெயரடை, வினையடை போன்றவை -   எவ்வாறு இருக்கிறது?

(2) அடிச்சொற்கள் (Lexicons)  எவ்வாறு இலக்கணக் கூறுகளை ( Grammatical features) -  பன்மை விகுதி, வேற்றுமை விகுதிகள், கால விகுதிகள் போன்றவற்றை -  ஏற்றுக்கொள்கின்றன?

(3) இலக்கண விகுதிகளில் நிலவும் வேறுபாடுகள் என்ன ( பெயரோடு சேரும் விகுதிகள், வினையோடு சேரும் விகுதிகள் போன்றவை) ?

(4) அடிச்சொற்களோடு இலக்கண விகுதிகள் இணையும்போது என்ன மாற்றங்கள் சொற்களில் ஏற்படுகின்றன? ( 'பையன்' என்ற சொல்லோடு 'ஐ' வேற்றுமை விகுதி நேரடியாக இணைந்து 'பையனை' என்று வருகிறது; ஆனால் 'மரம்' என்ற சொல்லோடு 'ஐ' வேற்றுமைவிகுதி இணையும்போது 'மரத்தை' என்று இடையில் 'அத்து' என்ற சாரியை சேர்ந்து உருவாகிறது) .

(5) இரண்டு சொற்கள் அடுத்தடுத்து வரும்போது அவற்றின் எழுத்துக்களில் மாற்றங்கள் ஏற்படுவது  உண்டா ? ( 'அவனை' 'பார்த்தேன்' என்ற இரண்டும் அடுத்தடுத்து வரும்போது 'அவனைப் பார்த்தேன்' என்று இடையில் 'ப்' என்ற எழுத்து 'அவனை' என்பதோடு இணைந்து நிற்கிறது).

மேற்கூறியவைபற்றிய அறிவைத் தருகிற துறையான உருபனியல் அறிவைக் கணினிக்கு ஏற்றவகையில் எவ்வாறு அமைத்துக்கொடுப்பது என்பதுபற்றிய ஒரு துறையே  கணினி உருபனியல் ஆகும்.   

ஒரு குறிப்பிட்ட மொழியின் மேற்கூறிய சொல்பற்றிய அறிவு கணினிக்கு அளிக்கப்படும்போதுதான், அதற்கு அடுத்த கட்ட உயர்நிலை ஆய்வான கணினித்தொடரியலுக்குச் (Computational Syntax) செல்லமுடியும். ஆய்வு நோக்கில் இது ஒருபுறம்.

பயன்பாட்டு நோக்கில் பார்த்தால், கணினியானது குறிப்பிட்ட மொழிச் சொற்களின் எழுத்துப்பிழைகள், ஒற்றுப்பிழைகள், இலக்கணப் பிழைகள் போன்றவற்றைக் கண்டறிந்து, பயனாளர்களுக்கு உதவவேண்டும். தானியங்கு எழுத்துப் பிழைதிருத்தி (Auto Spell Checker), சொல்லிலக்கணப் பிழைதிருத்தி (Word Grammar Checker) , சந்திப் பிழைதிருத்தி ( Auto Sandhi Checker)   இணைப்புக்குறியீடு (Hyphenation), அயல்மொழிச்சொல் - தமிழ்ச்சொல் மாற்றி (Native Word Converter) ,  அகராதிகள் (Dictionary) போன்ற பல சொற்பதிப்புக் கருவிகளை உள்ளடக்கிய சொல்லாளர் மென்பொருள்கள் ஒரு மொழிக்கு உறுதியாகத் தேவைப்படும். அப்போதுதான் அந்த மொழியில் ஒரு உரையைக் கணினியில் தட்டச்சு இடுபவர்கள் தங்கள் உரையைத் தவறு இல்லாமல் தயாரிக்கமுடியும்.

மேற்கூறிய அனைத்து மொழிக் கருவிகளுக்கும் மிக மிக அடிப்படையானது குறிப்பிட்ட மொழியின் கணினி உருபனியல் ஆய்வு ஆகும். தமிழ்மொழிக்கான கணினி உருபனியல் ஆய்வில் பல்கலைக்கழகங்களும் தனியார் ஆராய்ச்சி நிறுவனங்களும் தனித்த ஆய்வாளர்களும் தமிழகத்தில் கடந்த 25 ஆண்டுகளுக்குமேலாக ஈடுபட்டுவருகின்றனர். தமிழ் நாடு அரசின் தமிழ் இணையக் கல்விக் கழகமும் இதற்கான திட்டங்களுக்கு நிதி உதவியும் அளித்துவருகின்றது.

 தமிழ்க் கணினி உருபனியல்

தமிழ்மொழி ஒரு உட்பிணைப்பு -  ஒட்டுமொழி ( Inflectional and agglutinative language) ஆகும். தமிழ் மொழியில் ஒரு அகராதிச்சொல் அல்லது அடிச்சொல் என்பது தன்னுடன் பல  இலக்கணப்பண்புகளை இணைத்துக்கொள்ளும். இந்த இலக்கணப் பண்புகள் விகுதிகள்மூலம் வெளிப்பட்டு நிற்கும். அப்போது அதன் அடிச்சொல் வடிவம் திரிபும் அடையலாம் . எடுத்துக்காட்டாக, 'நான்' என்ற தன்மை ஒருமைச் சொல்லானது 'ஐ' என்ற இரண்டாம் வேற்றுமை உருபை ஏற்கும்போது, 'என்னை' என்று தன் வடிவத்தில் திரிந்து அமையும்.  பெயர்ச்சொற்கள் திணை, பால் (Gender)  , ஒருமை-பன்மை (Number)  , வேற்றுமை (Case)  போன்ற இலக்கணப் பண்புகளையும் வினைச்சொற்கள் காலம் (Tense) , வினைக்கூறு (Aspects), வினைநோக்கு (Modals) வினைப்பாங்கு (Voice)  போன்ற இலக்கணப் பண்புகளையும் ஏற்றுக்கொள்கின்றன. மேற்கூறிய இலக்கணப் பண்புகள் ஒரு சில மொழிகளில் தனித்த சொற்களாகவும் (Grammatical words)  ஒரு சில மொழிகளில் விகுதிகளாகவும் (Affixes)  அமைகின்றன. சில மொழிகளிலும் தனிச்சொல், விகுதி இரண்டையும் கொண்டுள்ளன.

ஒரு மொழியின் இலக்கணம் ( Grammar) என்பது இரண்டு பகுதிகளை உள்ளடக்கியது: (1)   சொல்திரிபு அல்லது உட்பிணைப்பு உருபனியல் (Inflectional Morphology)  (2) தொடரியல் (Syntax). ஆங்கிலத்தைப் பொறுத்தமட்டில் பெரும்பான்மையான இலக்கணக் கூறுகள் தொடரியலில் இடம்பெறுகின்றன. சொல்திரிபு உருபனியல் ஒப்புநோக்கச் சற்று எளிமையானது. ஆனால் தமிழ்மொழியில் பெரும்பான்மையான இலக்கணக்கூறுகள் சொல்திரிபு உருபனியலில் இடம்பெறுகின்றன. தொடரியல் ஒப்புநோக்க ஆங்கிலத்தைவிடச் சற்று எளிமையானது. எனவே, தமிழ்மொழியைப்பொறுத்தமட்டில் சொல்திரிபு உருபனியல் மிகவும் முக்கியத்துவம் வாய்ந்தது.

ஆங்கிலமொழியைப் பொறுத்துவரையில் பெயர்ச்சொற்கள் ஒருமை - பன்மை இலக்கணப் பண்பை விகுதிகள்மூலமே (affixes)  வெளிக்காட்டிநிற்கின்றன ("boy - boys").  வேற்றுமை இலக்கணப் பண்புகளை வெளிப்படுத்தத் தனிச்சொற்களாக அமைகிற பின்னொட்டுக்கள் (Prepositionss) ,  விகுதிகள் இரண்டையும் பயன்படுத்துகின்றன  ( "to the School", "boy's School") . குறிப்பிட்ட சில ஆங்கிலச்சொற்கள் தங்கள் வடிவமாற்றத்தின்மூலமாகவும் வேற்றுமைப் பண்பை வெளிப்படுத்துகின்றன ( "his", "him", "their", "them")  சில இடங்களில் ஒரு இலக்கணப்பண்பை வெளிப்படுத்த ஒரே நேரத்தில் இரண்டையும் பயன்படுத்துகின்றன ( " is coming" "has been purchased").

தமிழைப்பொறுத்தமட்டில் இலக்கணச் சொற்கள் எல்லாம் விகுதிகளாகவே (Suffixes)  நீடிக்கின்றன. ''நூல்'' என்ற பெயர்ச்சொல் பன்மை இலக்கணப்பண்பை ஏற்கும்போது , ''கள்'' என்ற விகுதியைத் தன்னுடன் இணைத்து ''நூல்கள்'' என்று அமைகிறது. அதுபோன்று செயப்படுபொருள் என்ற வேற்றுமை உறவுப் பண்பைக் காட்ட ''ஐ'' என்ற விகுதியை இணைத்துக்கொண்டு ''நூலை'' என்ற அமைகிறது.

''படி'' என்ற வினைச்சொல் இறந்தகாலத்தைக் காட்ட ''த்த்'' என்ற விகுதியையும் வினைச் செய்கிறவன் படர்க்கை ஒருமை ஆண்பால் என்பதைக் காட்ட ''ஆன்'' என்ற விகுதியையும் இணைத்துக்கொண்டு  இணைத்துக்கொண்டு ''படித்தான்'' என்று அமைகிறது.

சில இலக்கணப் பண்புகளைக் காட்டும் வடிவங்கள் தனிச்சொற்கள் போன்று இருந்தாலும், அவை தனித்து வராமல் தங்களது அடிச்சொல் அல்லது அகராதிச்சொல்லுடன் இணைந்துதான் அமைகின்றன. ''அவனைப்பற்றி'' ''அவனுடன்'' ''படித்துக்கொண்டு'' போன்றவற்றில் ''பற்றி'' ''குறித்து'' ''கொண்டு'' ஆகியவை வேறு இடங்களில் தனித்து பொருண்மைச் சொற்களாக வந்தாலும் (''அவன் கைகளைப் பற்றி அறிவுரை கூறினேன்'' '' அதைக் குறித்துவிட்டேன்'' ''அதைக் கொண்டுவா'' )  , இலக்கணப் பொருள்களைக் குறித்து நிற்கும்போது தனித்து வராது.

இதுபோன்று தமிழில் ஒரு அடிச்சொல் - பெயரோ, வினையோ - தங்களுக்குரிய இலக்கணப் பண்புகளை ஏற்கும்போது, விகுதிகளை இணைத்துக்கொள்கிறது. மேலும் ஒன்றுக்குமேற்பட்ட இலக்கணப் பண்புகளை ஏற்கும்போது, அவற்றின் விகுதி வடிவங்களை ஒன்றன்பின் ஒன்றாக - மாலையில் பாசிமணிகளைக் கோர்ப்பதுபோல - இணைத்துக்கொள்கிறது. எனவேதான் தமிழை ஒரு ஒட்டுமொழி என்று அழைக்கிறார்கள்.

தமிழ்ச்சொற்களின் அமைப்பு

தமிழில் ஒரு அடிச்சொல்லில் பத்து, பதினொன்று விகுதிகளைக்கூட இணைக்கலாம். கீழ்க்கண்ட ஒரு வினைமுற்றுச் சொல்லில் '' எழுது'' என்ற வினைச்சொல்லுடன் 16  விகுதிகள் இணைந்துள்ளன. ''எழுதிக்காட்டவைக்கப்பார்த்தவர்களைப்பற்றிமட்டும்தானாடா''

''எழுது - இ - காட்டு - அ- வை(க்க்) - அ - பார் - த்த் - அ(வ) - அர் - கள்- ஐ(ப்) - பற்றி - மட்டும் - தான் -ஆ - டா ''.

மேற்கூறிய வகையில் ஏராளமான விகுதிகளை இணைத்துப் பொதுவாக யாரும் எழுதமாட்டார்கள் என்றாலும், அதற்கு வாய்ப்பு உண்டு என்பதைக் காட்டவே இந்த எடுத்துக்காட்டு. ஆங்கிலத்தில் பெரும்பான்மையாக ஒரு இலக்கண விகுதியும், சில இடங்களில் இரண்டு அல்லது மூன்று இலக்கண விகுதிகளும் இணையும்.

"boys" (boys- s) ;  "boys'(s)" (boy-s-s) ; "beautifully" (beauty - ful - ly) .

ஆங்கிலத்தில் ஒரு வினைச்சொல்லுக்கு ஆறு திரிபு வடிவங்கள் இருக்கலாம் ( go, goes, going, went, gone, to go).  ஆனால் தமிழில் ஒரு வினைச்சொல் பல இலட்ச வடிவங்களை எடுக்கலாம் ('படித்தான், படித்தேன், படித்துக்கொண்டு, படிக்க, படிக்காமல் . . . ) ; ஒரு பெயர்ச்சொல்லும் இதுபோன்று பல இலட்சம் வடிவங்களை எடுக்கலாம் ( 'பையன், பையனை, பையன்கள், பையன்களை, பையன்பற்றி, பையன்களைப்பற்றி . . . ) .

உருபன் பகுப்பாய்வு (Morphological Parsing)

எனவே, தமிழ்ச்சொல் ஆய்வில் திரிபு ஏற்ற சொல்லைப் பகுதி , விகுதி என்று பிரிப்பதே முதலாவது முக்கியப் பணியாக அமைகிறது. இதற்கு அடிப்படையில் தேவைப்படுபவை:

  (1) தமிழ் அகராதிச் சொற்களைப் பெயர், வினை, பெயரடை, வினையடை என்று பிரித்து அமைக்கப்படுகிற ஒரு முறையான மின்னகராதித் தரவகம் ஆகும்  (Electronic Lexical Database) . ஒரு சொல்லின் இலக்கணவகைப்பாடு சரியாகக் குறிக்கப்படவில்லையென்றால், பிரிக்க முடியாமல் போகலாம்; அல்லது தவறான பிரிப்பாக அமையலாம்.

இதுபோன்று தமிழின் இலக்கண விகுதிகளையும் அவற்றின் இலக்கணப் பண்புகளோடு தொகுக்கவேண்டும். பெயரோடு இணைகிற விகுதியா, வினையோடு இணைகிற விகுதியா என்பதையும் தரவேண்டும்.

    (2) தமிழ் சொல் அமைப்பில் அடுத்த ஒரு முக்கியமான பண்பு, ஒரு அகராதிச்சொல்லோடு ஒன்றுக்கு மேற்பட்ட இலக்கணவிகுதிகள் இணையும்போது, அவை எந்த வரிசையில் இணைக்கப்படவேண்டும் என்பது ஆகும். ''பையன்'' என்ற பெயர்ச்சொல் பன்மை, வேற்றுமை என்ற இரு இலக்கணவிகுதிகளை ஏற்கும்போது, அவை ஒரு குறிப்பிட்ட வரிசையில்தான் அமையவேண்டும். ''பையன் - கள் - ஐ'' என்று இணைந்து ''பையன்களை'' என்ற திரிபுச்சொல்லாக அமையவேண்டும்; மாறாக, ''பையன் - ஐ - கள்'' என்று இணைந்து, ''பையனைகள்'' என்று அமையக்கூடாது. இதை மொழியியலில் ''உருபு அமையும் வரிசைமுறை ( morpho tactics) என்று அழைப்பார்கள். எவ்விதத் தவறு இல்லாமல் இதற்கான விதிகள் கண்டறியப்படவேண்டும்.

 (3) அடுத்து மூன்றாவதாக, ஒரு அகராதிச்சொல்லோடு மற்றொரு அகராதிச்சொல் இணையும்போதோ அல்லது அடிச்சொல்லோடு விகுதிகள் இணையும்போதோ அல்லது விகுதியோடு அதற்கு அடுத்துவருகிற விகுதி இணையும்போதோ ஒலியன் மாற்றம் - சந்தி அல்லது புணர்ச்சி  ( Morphophonemics) ஏற்படலாம். ''மரம்'' என்பதுடன் பன்மை விகுதி ''கள்'' என்பதை இணைக்கும்போது, ''மரங்கள்'' என்று அமையும். அதாவது, ''மரம்'' என்பதில் உள்ள இறுதி ''ம்'' என்ற ஒலியன் ''ங்'' என்ற ஒலியனாக மாறி அமையும். அதுபோன்று இச்சொல்லோடு ''ஐ'' என்ற வேற்றுமை விகுதி இணையும்போது, ''மரம் + அத்து + ஐ'' என்று இடையில் ''அத்து'' என்ற சாரியை அமைந்து, ''மரத்தை'' என்று அமையும். ''கிளை'' என்ற மற்றொரு சொல் இணையும்போது ''மரக்கிளை'' என்று ''ம்'' என்ற இறுதி ஒலியன் மறைந்து, 'க்' என்ற எழுத்து அமையும்.  

 மேற்கூறிய அடிப்படையில் தமிழ் உருபனியல் ஆய்வுக்கு மூன்று தயாரிப்புக்கள் தேவைப்படுகின்றன. ஒன்று, முறையான அகராதி; இரண்டு, இலக்கண விகுதிகளும் அவற்றின் வரிசைமுறையும் ; மூன்று, சந்தி அல்லது புணர்ச்சி விதிகள்.

 மேற்கூறிய மூன்றும் முறையாகவும் சரியாகவும் உருவாக்கப்பட்டிருந்தால்தான், எந்தவொரு தமிழ்ச்சொல்லையும் பிரிக்கவும் முடியும்; ஒரு அகராதிச்சொல்லின் பல திரிபு வடிவங்களை உருவாக்கவும் முடியும். சொற்பிழை திருத்தி, சந்திப்பிழை திருத்தி போன்ற மென்பொருள் கருவிகளை உருவாக்க இதுவே அடிப்படை.

 மேற்கூறியவற்றை ஒரு மனிதர் கற்றுக்கொண்டு செயல்படுத்துவது வேறு. இது உருபனியல் என்ற பிரிவில் அடங்கும். ஆனால் ஒரு கணினியானது இதைக் கற்றுக்கொள்வது என்பது வேறு. இதுதான் கணினி உருபனியல் ஆகும்.

கணினிக்காக உருவாக்கப்படுகிற உருபனியலில் அகராதிச் சொற்களை எவ்வாறு கணினிக்கான ஒரு தரவாக மாற்றியமைப்பது ( Computational Lexical Database)  என்பதுபற்றிய அறிவு தேவை. ஒரு சொல், அதன் இலக்கண வகைப்பாடு ( பெயர், வினை . .. ) , உள்வகைப்பாடு ( உயர்திணைப் பெயர், அஃறிணைப்பெயர் , செயப்படுபொருள் குன்றா வினை, குன்றிய வினை . . . ), வினைகளின் கால விகுதி அல்லது வினைத்திரிபு அறிவு போன்றவற்றையெல்லாம் கணினிக்கேற்ற ஒன்றாக எவ்வாறு அமைப்பது என்பது இங்கு முக்கியம்.

அடுத்து, ஒரு அடிச்சொல்லோடு விகுதிகள் இணையும்போது எந்த வரிசையில் அவை இணையவேண்டும் என்ற வருகைமுறைகளைப் பற்றிய அறிவைக் கணினிக்கு எவ்வாறு அளிப்பது என்பது பற்றியதாகும். இது மிக மிக முக்கியமானது.

இறுதியாக, சொல்லும் சொல்லும் இணையும்போதோ, சொல்லும் விகுதியும் இணையும்போதோ, விகுதியும் விகுதியும் இணையும்போதோ நடைபெறும் உருபொலியன் மாற்றங்கள் பற்றிய விதிகளைக் கணினிக்கு அளிப்பது ஆகும்.

கணினிக்கு இயற்கைமொழி ஆய்வை அறிமுகப்படுத்திய நாளிலிருந்தே உலகெங்கும் கணினிமொழியியல் துறையினர் ( கணினியியல் , மொழியியல் அறிஞர்கள்) மேற்கூறிய  கணினி உருபனியலுக்குப் பல்வேறுபட்ட ஆய்வு முறைகளையும் உருபன் அறிவை வெளிப்படுத்தும் மாதிரிகளையும் (Computational Morphological Formalism) முன்வைத்துவருகின்றனர். எல்லா மொழிகளுக்கும் பொதுவான மாதிரிகளும் உருவாக்கப்பட்டுள்ளன.

 உருபன் பகுப்பாய்வில் சந்திக்கும் சில சிக்கல்கள்

தமிழ்ச் சொற்களைப் பகுப்பாய்வுக்கு உட்படுத்தும்போது, சில சிக்கல்களை எதிர்நோக்கவேண்டியிருக்கும்.

 (1) 'வந்தது' என்ற சொல்லைப் பகுக்கும்போது, கணினியானது '' வா - ந்த் - அது'' என்று மூன்றாகப் பிரித்துவிடும். இதில் 'வா' என்பது வினையடி; '-ந்த்-' என்பது இறந்தகால விகுதி; 'அது' என்பதற்கு மூன்று விளக்கங்களைக் கணினி தரும். ஒன்று, 'அது' என்பது திணை - எண்- பால் விகுதி (அஃறிணை படர்க்கை ஒன்றன்பால் ) ; இரண்டாவது, 'அது' என்பது வினையாலணையும் பெயர் விகுதி (Participial Noun suffix); மூன்றாவது, 'அது' என்பது தொழிற்பெயர் விகுதி (Verbal noun / Gerundial suffix). இந்த இடத்தில் 'அது' என்பதின் இலக்கண வகைப்பாட்டைப் பொறுத்துத்தான் 'வந்தது' என்பது வினைமுற்றா( Finite Verb) , வினையாலணையும் பெயரா (Participial Noun) , தொழிற்பெயரா (Verbal Noun or Gerundial Noun)  என்பதை முடிவெடுக்கமுடியும். இந்த இலக்கண மயக்கத்தைத் தீர்ப்பதற்கு 'வந்தது' என்பது பயின்றுவருகிற முழுச் சொற்றொடரும்  தேவைப்படும். அந்தச் சொற்றொடரில்  'வந்தது' என்ற சொல்லுக்குமுன் எந்தச் சொல் வருகிறது அல்லது பின்னால் எந்தச் சொல் வருகிறது என்பதைப் பொறுத்துத்தான் முடிவு எடுக்கமுடியும்.

 (2) 'வேலை' என்ற சொல்லைப் பகுக்கும்போதும் சிக்கலை எதிர்கொள்ளவேண்டியிருக்கும்.

தனித்துப் பார்த்தால் , 'வேலை' என்ற சொல்லுக்கு இரண்டு முடிவுகள் பகுப்பாய்வில் கிடைக்கும்.  ஒன்று, 'வேலை'  (''job/ work")  என்ற பெயரடிச்சொல்; மற்றொன்று, 'வேல் + ஐ' ( "spear -Obj." ) என்ற இரண்டாம் வேற்றுமை ஏற்ற ஒரு பெயர்ச்சொல். இங்கும் நமக்கு முன், பின் சொற்கள் தேவைப்படுகிறது. தமிழ்ப் புணர்ச்சியும் உதவுகிறது.

'' குமார் கோயிலில் வேலை பார்த்தான்'' - " Kumar worked in the temple"

''குமார் கோயிலில் வேலைப் பார்த்தான்'' - "Kumar saw the spear in the temple"

இரண்டாவதில் ''வேலை'' என்ற சொல்லானது 'வேல்' + 'ஐ' என்ற இரண்டாம் வேற்றுமை ஏற்ற சொல்லாக இருப்பதாலும் அடுத்து வல்லினத்தில் தொடங்குகிற 'பார்த்தான்' என்ற வினைமுற்று வருவதாலும் அங்கு ஒற்று மிகுகிறது. முதல் தொடரில் 'வேலை' என்பது இரண்டாம் வேற்றுமை ஏற்ற சொல் இல்லை என்பதால் ஒற்று மிகவில்லை. இதை வைத்துத்தான் முடிவு எடுக்கமுடியும்.

 (3) ''விஷமருந்து'' என்ற சொல்லுக்கும் இரண்டு பகுப்பாய்வு விடைகள் கிடைக்கும். ஒன்று, 'விஷம் அருந்து'' என்ற வினைச்சொல்; மற்றொன்று, 'விஷம் மருந்து'. இங்கு ஒரு 'ம்' மறைவதால் ஏற்படுகிற இலக்கண மயக்கம்.

 மனித மூளை மேற்கூறிய பொருண்மை மயக்கம்(Semantic ambiguity)  , இலக்கண மயக்கம் (Grammatical ambiguity)  ஆகியவற்றைத் தனது உலகறிவை (Pragmatic knowledge)  வைத்துக்கொண்டு, எந்தச் சிக்கலும் இல்லாமல்  புரிந்துகொள்ளும். ஆனால் கணினிக்கு நாம்தான்  ஒரு சில உதவிகளை அளிக்கவேண்டியிருக்கும்.

 மனித மூளையும் கணினி மூளையும்

மனித மூளையானது தனக்கே உரிய உலகறிவின் துணைகொண்டு மேற்கூறப்பட்ட பொருண்மை, இலக்கண மயக்கங்களை எளிதில் தீர்த்துக்கொள்கிறது. ஆனால் கணினிக்கு மிக நுட்பமாகச் சொல் அமைப்பு விதிகளை அளிக்கவேண்டும். எனவே, மனிதர்களுக்குக் கற்றுக்கொடுக்கப்படுகிற தமிழ்ச் சொல் இலக்கணத்தைவிட, மிக நுட்பமாகக் கணினிக்குத் தமிழ்ச் சொல்லமைப்பு விதிகள் கற்றுக்கொடுக்கப்படவேண்டும். அவ்வாறு கற்றுக்கொடுத்தால் கணினியால் எந்தவொரு தமிழ்ச் சொல்லையும் பகுத்து ஆராயமுடியும். எனவே, நாம் வகுப்புக்களில் கற்றுக்கொள்கிற சொல் இலக்கணத்தைவிட, மிகவும் ஆழமாகவும் நுட்பமாகவும் (micro-level)   அமைகிற தமிழ்ச்சொல் இலக்கணத்தைக் கண்டறிந்து கணினிக்கு அளிக்கவேண்டும். தமிழ்ச் சொல் இலக்கணத்தின் அமைப்புக்களுக்குத் தெளிவான விதிகள் இருப்பதால், முறையாக அவற்றைக் கணினிநோக்கில் ஆராய்ந்து தமிழ்க் கணினி உருபனியலில் முன்வைக்கப்பட்டால் தமிழ் உருபன் பகுப்பாய்வியால் நன்றாகச் செயல்படமுடியும்.

 மேற்கூறிய உண்மையின் அடிப்படையில் தமிழகத்தில் அண்ணா பல்கலைக்கழகம், எம் ஐ டி அண்ணா பல்கலைக்கழகம், கோவை அமிர்தா பல்கலைக்கழகம், மைசூர் இந்திய மொழிகள் நடுவண் நிறுவனம், ஹைதராபாத்தில் உள்ள IIIT, சென்னையில் உள்ள இந்தியத் தொழில்நுட்ப நிறுவனம் , தமிழ் இணையக் கல்விக்கழகம் போன்றவை தமிழ்க் கணினி உருபனியல் ஆய்வுகளில் ஈடுபட்டு, தமிழ் உருபன் பகுப்பாய்விகளை உருவாக்கிவருகின்றன. தனி நபர் அளவிலும் பேராசிரியர் கிருஷ்ணமூர்த்தி,  ந. தெய்வ சுந்தரம் , ச. இராஜேந்திரன், முனைவர் தனலட்சுமி கிரி, முனைவர் கி. உமாதேவி, திருமதி அபிராமிமுத்து, திரு. சு. சரவணன், முனைவர் அ. கோபால், பேராசிரியர் பரமேஸ்வரி, முனைவர் சண்முகம், முனைவர் பிரபாகரன், ம. கணேசன், மதன் கார்க்கி ( கார்க்கி ஆராய்ச்சி நிறுவனம்) போன்றோர் இப்பணியில் ஈடுபட்டுவருகின்றனர். இதன் பயனாக, தற்போது தமிழ்ச்சொற்பிழைதிருத்தி, சந்திப்பிழை திருத்தி போன்ற தமிழ் மென்பொருள்களைப் பேராசிரியர் கிருஷ்ணமூர்த்தி ('பொன்மொழி'), நீச்சல்காரன் என்ற இராஜாராமன் (''வாணி எழுத்துப்பிழைதிருத்தி'', ''நாவி சந்திப்பிழைதிருத்தி'') , என் டி எஸ் லிங்க்சாஃப்ட் சொலூஷன்ஸ் நிறுவனம் ('மென்தமிழ்') உருவாக்கி வெளியிட்டுள்ளனர்.

 தமிழ் உருபன் பகுப்பாய்வின் வளர்ச்சியானது சொற்பிழைதிருத்தி, சந்திப்பிழை திருத்தி போன்ற மென்பொருள் கருவிகளுக்கு மட்டுமல்லாமல், இணைப்புக் குறியீடு ( Hyphenation), தானியங்கு சொற்பரிந்துரை (Auto suggestion of words) போன்ற சொல்லாளர் மென்பொருளுக்கான கருவிகளை உருவாக்கவும் பயன்படும். மேலும் இந்த உருபன்பகுப்பாய்வின் திறனைப் பொறுத்து, சொற்பிழைதிருத்தியின் வேகமும் அதிகரிக்கும்.

 இவற்றிற்கெல்லாம் அடிப்படையானது, மொழியியல் நோக்கில் மேற்கொள்ளப்படும் தமிழ்ச் சொல்லாய்வு , தமிழ்ச் சொல்லிலக்கணமே ஆகும். தமிழ்மொழி ஆய்வாளர்கள், மொழியியல் ஆய்வாளர்கள், கணினியியல் ஆய்வாளர்கள் ஆகியோரின் கூட்டுமுயற்சியால்  எந்த அளவுக்கு இந்தப் பணி வெற்றியடைகிறதோ, அந்த அளவுக்குத் தமிழ்நாட்டு மக்களுக்குத் தேவையான தமிழ் மென்பொருள்களை உருவாக்கி அளிக்கமுடியும்.

(இக்கட்டுரை தமிழ் நாடு அரசின் 'பன்னாட்டுக் கணித்தமிழ்24 மாநாட்டையொட்டி, வெளியிடப்பட்ட ''கணித்தொகை - தமிழிணையம்99 முதல் கணித்தமிழ்24 வரை'' என்ற சிறப்பு மலருக்காக அளிக்கப்பட்டு, வெளியாகியது.)  


 

வியாழன், 23 மே, 2024

குறிப்பு வினைபற்றிய ஒரு உரையாடல்

 குறிப்பு வினைபற்றிய ஒரு உரையாடல்

--------------------------------------------------------------------------------------------------------

பொன் + பாதம் = பொற்பாதம் (பெயர் + பெயர்)

   - வேற்றுமைத்தொகை - புணர்ச்சி நடைபெறுகிறது.

ஊறு      + காய்   = ஊறுகாய்       (வினை + பெயர்)

     - வினைத்தொகை - புணர்ச்சி இல்லை)

நல்         + பெயர் = நற்பெயர்     (வினை  + பெயர்)

நல்         +பணி     = நற்பணி       (வினை  + பெயர்)

நல்          + செய்தி  = நற்செய்தி (வினை + பெயர்)  

இறுதி மூன்றிலும் திரிதல் நடைபெறுகிறது. திரிதலுக்கான காரணத்தை முடிவுசெய்வதில் எனக்கு ஐயம்! விளக்கம் கிடைத்தால் மகிழ்வேன். 

ஒரு அகராதியில் 'நல்' என்பது ''பெயரடை'' என்று கொடுக்கப்பட்டு, எடுத்துக்காட்டுக்களில் 'நற்செய்தி ' என்ற ஒரு சொல்லும் கொடுக்கப்பட்டுள்ளது.

--------------------------------------------------------------------------------------

"Time (காலம் அல்லது நேரக்கிளவி )" "Tense (கால இடைநிலை விகுதி ) " இரண்டும் வேறு வேறு. 'நேற்று' 'இன்று' 'நாளை' என்பவை காலம். 'நல்லது' என்பதில் கால இடைநிலை இடம்பெறவில்லை, திணை -எண் - பால் விகுதி மட்டுமே இணைகிறது. கால வினையடையைக்கொண்டுதான் (காலக்கிளவி) 'நல்லன்' என்பது நேற்று நல்லவனா, இன்று நல்லவனா, நாளை நல்லவனா என்பதை முடிவு எடுக்கமுடியும். 'படித்த' 'சிறந்த' இரண்டிலும் கால இடைநிலை இருந்தாலும் காலத்தைக்காட்டவில்லை. 'நேற்று படித்த பையன்' 'இன்று படித்த பையன்' 'நேற்று சிறந்த மனிதர்' 'இன்று சிறந்த மனிதர்' என்றெல்லாம் கூறலாம். ஆகவே காலம் அல்லது நேரக் கிளவிக்கும் , கால இடைநிலை விகுதிக்கும் ஆகிய இரண்டுக்கும் முரண்பாடு வரும்போது, காலத்தையே கணக்கில் கொள்ளவேண்டும். ஒரு வினையின் காலத்தைக் காட்டுவதற்குக் கால வினையடையும் (காலக்கிளவி அல்லது நேரக்கிளவி) வரலாம்; அல்லது கால இடைநிலையும் வரலாம். இதுபற்றித் தனியே ஒரு முனைவர் பட்ட ஆய்வையும் பேரா. அ. அருணாதேவி ( பேரா. அகத்தியலிங்கம் அவர்களின் புதல்வி) மேற்கொண்டார்.

நல்' என்பது பண்பைக்காட்டுகின்ற சொல்தான் என்பதில் ஐயம் இல்லை. ஆனால் அது பெயரா வினையா என்பதுதான் எனது ஐயம். திரிதலுக்கு - நற்பெயர், நற்செய்தி- என்ன காரணம் என்பதுதான் நான் விளங்கிக்கொள்ள விரும்புகிறேன்.

---------------------------------------------------------------------------------------

'நல்ல' என்பது குறிப்புப்பெயரெச்சம். 'படித்த' என்பது தெரிநிலைப்பெயரெச்சம். குறிப்புப்பெயரெச்சத்தைத்தான் தற்போது நாம் பெயரடை என்று கூறுகிறோம். 'அழகான' கூட்டுப்பெயரடை (அழகு + ஆன).

நாம் பயன்படுத்துகிற பெரும்பான்மையான பெயரடைகள் குறிப்புப்பெயரெச்சங்களே. பெயரெச்சம் என்றாலே அது வினையிலிருந்துதான் தோன்றியிருக்கவேண்டும். ஆகவே 'நல்ல' என்ற பெயரடை - அதாவது குறிப்புப்பெயரெச்சம் - 'நல்' என்ற காலங்காட்டாத குறிப்பு வினையடியிலிருந்துதான் வந்திருக்கவேண்டும். அதுபோன்றுதான் ' நல்லவன்' 'படித்தவன்'. 'நல்லவன்' என்பது குறிப்பு வினையாலணையும் பெயர்; 'படித்தவன்' என்பது தெரிநிலை வினையாலணையும் பெயர்.

--------------------------------------------------------------------------------------

'நல்' என்பது வினையடிதான் என்று கருதுகிறேன். எனவேதான் 'நல்லன்' 'நல்லள்' 'நல்லது' போன்ற குறிப்பு வினைமுற்றுக்கள் தோன்றுகின்றன. வினைத்தொகையிலும்கூட - ஊறுகாய் - 'ஊறு' என்ற வினைச்சொல் 'காய் ' என்பதின் பண்புதான். வினைச்சொல் பண்பை வெளிப்படுத்தும் ஒன்றாகவும் அமையலாம்.

'பொன்' என்பது 'நல்' போன்ற ஒரு வினைச்சொல் என்று நான் கூறவரவில்லை. 'பொன்னன்' என்பதை எப்படிப் பிரித்துப்பார்க்கலாம் என்பதைக் கூறினால் நல்லது. 'பொன் + ன் + அன்' என்று பிரித்துப்பார்க்கலாமா? 'பொன்னது' என்ற வடிவம் கிடைக்குமா? 'பொன்னனையன் ' = 'பொன் அனையன்' - இதில் 'அனை' என்பதைக் குறிப்பு வினையாகக்கொண்டு, 'அனையன்' என்பதைக் குறிப்பு வினைமுற்று என்று கூறலாமா?

''நன்று' 'அரிது' 'எளிது' முதலான சொற்களில் நல், அரி, எளி முதலான வினையடிகளும் 'து' என்னும் பாலிட விகுதியும் அமைந்திருக்கக் காண்கிறோம். இத்தகைய கிளவிகள் குறிப்பு வினைச்சொற்கள் என்று கொள்ளப்படும்''.

அடுத்து , பண்பைப் பெயர்ச்சொல்மட்டும் காட்டுகிறதா? அல்லது வினைச்சொல்லும் காட்டுமா (வினைத்தொகையில்) ?

---------------------------------------------------------------------------------------

ஆனால் வினையின் உள்வகைப்பாடுதான் தெரிநிலை, குறிப்பு வினைகள் என்பவை. கால இடைநிலை வந்தால் தெரிநிலை வினை; அவ்வாறு இல்லாமல் திணை-எண்-பால் மட்டும் எடுத்து வந்தால் அது குறிப்பு வினை. மேலும் குறிப்புவினையையும் மேலும் உள்வகைப்பாடு செய்யவேண்டியிருக்கிறது. எல்லாக் குறிப்புவினைகளும் ஒன்றுபோல் செயல்படுவதில்லை.

-------------------------------------------------------------------------------------

குறிப்புப் பெயரெச்சம் என்று கூறும்போது அது ( காலம் காட்டாத) வினையடி பிறந்த ஒன்றுதானே. நாம் பெயரடை என்று கூறுகிற பெரும்பாலானவை இந்த வகைக் குறிப்புப் பெயரெச்சங்களே என நான் கருதுகிறேன். தெரிநிலைப் பெயரெச்சங்கள் காலம் காட்டுவதால் அவற்றைப் பெயரெச்சம் என்று அழைக்கிறோம். காலம் காட்டாத குறிப்புப் பெயரெச்சங்களைப் பெயரடைகள் என்று அழைக்கிறோம். எனவே, ''நல்ல'' என்ற குறிப்புப்பெயரெச்சத்தின் அடிச்சொல்லான 'நல்' என்பது குறிப்பு வினையடியே என்று நான் கருதுகிறேன்.

---------------------------------------------------------------------------------------

 ''நல்'' என்ற குறிப்புவினையடிலிருந்துதான் நன்மை என்ற பெயர் தோன்றுகிறது எனக் கருதுகிறேன். நன்று என்ற வினைமுற்றுச் சொல்லில் 'நல்' என்பது குறிப்பு வினையடி. நல்லன் என்ற குறிப்பு வினையாலணையும் பெயரில் 'நல்' என்பது வினையடி. அதுபோன்று நற்செய்தி, நற்பண்பு, நற்பெயர் ஆகியவற்றிலும் 'நல்' என்பது குறிப்பு வினையடி. ஆகவே, நன்மை + பெயர் --> நற்பெயர் என்றுகூறுவதைவிட நல் + பெயர் --> நற்பெயர் என்று கூறலாம் எனக் கருதுகிறேன். பேரா. பொற்கோ அவர்களும் இதைப்பற்றித் தமது நூல் ஒன்றில் கூறியிருக்கிறார்.


தமிழில் வினையடியோடு மை விகுதி சேர்ந்து பெயராக மாறுவது உண்டு. அரு- மை, சும + ஐ, உரி + மை, இல்+ ஐ , கடு+ மை, நன்+ மை, இனி+ மை, சிறு_ மை, பொறு - மை.

ஆகவே, நன்மை என்ற பெயர்ச்சொல்லுக்கு நல் என்பதே குறிப்பு வினையடி எனக் கருதலாம். நல் - நன்மை, நல்லன், நல்ல, நற்பெயர், நற்செய்தி - இவை எல்லாவற்றிலும் 'நல்' என்பதே (குறிப்பு) வினையடி எனக் கருதுகிறேன்.

எனவே நன்மை + பெயர் --> நன் ('மை' கெடுகிறது) + பெயர் --> நற்பெயர் ('ன்' என்பது தனக்கு இனமான வல்லின 'ற்' ஆக மாறுகிறது) என்று வருவிப்பதைவிட நேரடியாகவே நல் + பெயர் --> நற்பெயர் என்று கூறலாமே. இங்கு 'நல்' என்பதில் உள்ள 'ல்' , வருமொழி முதலில் வல்லின 'ப' வருவதால், தனக்கு இனமான வல்லினமாக - 'ற்' ஆக - மாறுகிறது எனக் கருதலாம். தங்கள் கருத்தை எதிர்பார்க்கிறேன்.

-------------------------------------------------------------------------------------

குறிப்பு வினைமுற்று, குறிப்பு வினையெச்சம் ஆகியவற்றிற்கு அடிச்சொல்லாக இருப்பதால், 'நல்' என்பதைக் குறிப்பு வினையடி என்று நான் கூறினேன். தனித்து வராமல், பிற விகுதிகளுடன் இணைந்துதான் இது தன்னை வெளிக்காட்டிக்கொள்கிறது. அதாவது இது கட்டுண்ட உருபன் அல்லது கட்டுண்ட அடிச்சொல்- bound morpheme, bound stem. எனவேதான் நான் இதை வினையடி என்று கூறினேன். இதிலிருந்து குறிப்புப்பெயரச்சம், குறிப்பு வினைமுற்று, குறிப்பு வினையாலணையும்பெயர் போன்றவை உருவாகலாம். சரியா நண்பரே?

---------------------------------------------------------------------------------------

macro-bodies -க்கு நியூட்டன் விதிகள் பெருமளவில் சரியாகவே இருந்தன. ஆனால் micro-bodies ஆய்வுக்கு அவருக்குப்பிறகுவந்த ஐன்ஸ்டீன் , Heisenberg, Schrodinger போன்றவர்கள் ஈடுபட்ட microlevel bodies பற்றிய ஆய்வுக்கு குவாண்டம் கோட்பாடுகளே பெரிதும் உதவின. அதனால் அறிவியல் உலகிலேயே பெரிய மாற்றங்களும், தொழில்நுட்பத்தில் மிகப் பெரிய வளர்ச்சியும் ஏற்பட்டன. எனவே தற்கால மொழி ஆய்வில் மொழியின் நுட்பங்களை மிக நுணுக்கமாக ஆய்வுசெய்யும்போது, முதலில் ஒரு 'வழுக்குமரமாகத்'' தோன்றும். அது இயல்பே. Heisenberg, Schrodinger இருவரும் ஐன்ஸ்டீனிடம் பட்ட பாடு தங்களுக்குத் தெரிந்ததே. ஆனால் இறுதியில் அவரும் அறிவியல் வளர்ச்சியை ஏற்றுக்கொண்டார். அதுபோன்றே நாம் மேற்கொள்கிற விவாதங்கள் இறுதியில் நல்ல பயனுள்ள இலக்கணங்கள் வளர உதவும். அது மொழி வளர்ச்சிக்கும் பயன்படும். தற்கால மொழியியலில் மொழி ஆய்வு மிக மிக நுட்பமாக மேற்கொள்ளப்படுகிறது. தமிழ் இலக்கண ஆய்வும் அந்தப் பாதையில் செல்லவேண்டும். அடுத்த கட்டத்திற்குச் செல்லவேண்டும். அதுதான் தமிழின் அடுத்த கட்ட வளர்ச்சிக்கு உதவும் என்பது எனது கருத்து.

இன்றைய செய்யறிவுத்திறன் (Artificial Intelligence)உலகில் - பெரிய மொழி மாதிரிகள் (Large Language Modals - LLMs) உருவாக்கப்பட்டுள்ள ஒரு சூழலில் - ஒரு சொல்லின் பண்புக்கூறுகள் மிக மிக நுட்பமாக ஆய்வுசெய்யப்படுகின்றன. அதற்கான ஆய்வு வழிமுறைகளும் தற்போது தோன்றி வளர்ந்துள்ளன. தமிழ்மொழியும் அந்த ஆய்வுமுறைக்கு உட்பட்டால், தமிழ்மொழியின் மிக மிக நுட்பமான கூறுகள் வெளிப்படும்.

-----------------------------------------------------------------------------------------

'நல்' என்பதின் இலக்கண வகைப்பாடு ? நன்மை, நன்று, நல்லன், நல்லோர், நற்பெயர், நற்செய்தி, நற்குணம், நற்பண்பு போன்றவற்றில் அமைகிற 'நல்' என்பதைக் குறிப்பு வினையடி ( அதாவது கால விகுதி ஏற்காத குறிப்பு வினை) என்று வகைப்படுத்தலாமா என்பதுதான் எனது ஐயம். குறிப்பு வினையடியிலிருந்து ''நன்மை'' போன்ற பெயர்ச்சொற்களையும், ''நன்று'' போன்ற குறிப்பு வினைமுற்றுக்களையும், ''நல்லன்'' போன்ற குறிப்பு வினைமுற்றுக்களையும் (குறிப்பு வினையாலணையும் பெயர் ?? ) வருவிக்கலாம் அல்லவா? இவை அனைத்துக்கும் அடிச்சொல்லாக 'நல்' அமைகிறது. இதன் இலக்கண வகைப்பாட்டை ஏன் குறிப்பு வினையடி என்று கூறக்கூடாது என்பதுதான் எனது வினா ஐயா. அது சரியில்லையென்றால், அதன் வேறு இலக்கண வகைப்பாடு என்ன?


ஞாயிறு, 19 மே, 2024

''சொல்கள்'' - ''சொற்கள்'' ? ''நாள்கள் - நாட்கள்''? - ஓர் ஐயம்! (4) - முடிவு

 ''சொல்கள்'' - ''சொற்கள்'' ? ''நாள்கள் - நாட்கள்''? - ஓர் ஐயம்! (4) - முடிவு

------------------------------------------------------------------------
இதற்கான விவாதத்தில் ஏராளமான தமிழ் அறிஞர்கள், பிற துறை அறிஞர்கள் கலந்துகொண்டனர். மிகவும் வரவேற்கத்தக்க ஒன்று. அனைவருக்கும் நன்றி. 80-க்கும் மேற்பட்ட பின்னூட்டங்கள் அமைந்தன.
இறுதியாக, கீழ்க்கண்டவாறு கூறலாமா என்பதை நண்பர்கள் கூறவேண்டும்.
(1) இலக்கண விதிப்படிப் பார்த்தால் ''சொல்கள்'', ''பல்கள்'' என்றுதான் வரவேண்டும். தோன்றலோ திரிதலோ இங்கு நடைபெறாது.
தொகைச்''சொல்களுக்குமட்டுமே'' இந்தப் புணர்ச்சி விதி பொருந்தும். மேலும் மெய்மயக்க விதிகளும் இங்குப் புறக்கணிக்கப்படவில்லை (சொல்க, வெல்க) . இதில் தவறு இல்லை.
(2) நண்பர்கள் சிலர் '' குறிலை அடுத்து ஒற்று வரும்போதுமட்டும் - ஓரசைச்சொல்லாக இருக்கும்போதுமட்டும் - இவ்வாறு வருகிறது; மற்ற இடங்களில் பிரச்சினை இல்லை '' என்று கூறியுள்ளனர். இதையும் கருதிப்பார்க்கலாம். இந்த இடத்தில் குறிலை அடுத்து ஒற்றுவராத - ஓரசைச்சொல்லாக இல்லாத - ''பொருள்'' என்ற சொல் ''பொருட்கள்'' என்று அமையுமா அல்லது ''பொருள்கள்'' என்று அமையுமா என்பதற்கும் விடைகாணவேண்டும.
(3) நண்பர்கள் சிலர் ''வழக்கில் நெடுங்காலமாகப் 'பற்கள்' 'சொற்கள்' என்றே வழங்கிவருகிறோம். இது வேற்றுமைப்புணர்ச்சிக்கான விதியாக இருந்தாலும் , இவை போன்ற ''சொற்களில்'' இது பன்மை விகுதி இணைப்பிலும் செயல்படுகிறது. ஒரு மரபாக நீடித்து வருகிறது. இந்த இடத்தில் இலக்கண விதியா, மரபா என்று பார்க்கும்போது, மரபுக்கு முதன்மை கொடுக்கலாம்'' என்ற கருத்து கூறியுள்ளனர்.
இந்த மூன்றாவதை ஏற்றுக்கொண்டால் நாம் செய்யவேண்டியது . . . எந்த எந்தச் ''சொற்கள்'' இந்த மரபின் அடிப்படையில் அமைகின்றன என்பதைப் பட்டியல் இடவேண்டும்.
ஆனால் சிலர் இலக்கணவிதிப்படி ''சொல்கள்'' ''பல்கள்'' என்று எழுதினால் , அவற்றைத் தவறு என்று கூறலாமா? இதுபற்றியும் கருதிப்பார்க்கவேண்டும்.

ஆங்கிலச் சொல்களைத் தமிழில் எழுதும்போது ஏற்படும் பிரச்சினை . . . gold - cold : god - cot

 ஆங்கிலச் சொல்களைத் தமிழில் எழுதும்போது ஏற்படும் பிரச்சினை . . . gold - cold : god - cot

----------------------------------------------------------------------------------------------------------------------------------

ஆங்கிலச் சொல்களோடு தமிழ் விகுதிகளை இணைக்கும்போதுகூட ஒரு ஒழுங்கு இருக்கிறது.
Gold என்ற சொல் "d" (ஒலிப்புள்ள ஒலி - voiced sound) -இல் முடிகிறது. இதைத் தமிழில் எழுதும்போது ''கோல்ட்'' என்று அமைந்து, பின்னர் 'உ' சேர்த்து, 'கோல்டு' கிடைக்கும். அதனுடன் 'ஐ' என்ற விகுதியை இணைக்கும்போது, 'கோல்டை' என்று அமையும். இங்கு 'ட்' இரட்டிக்காது. இங்கு அகராதிச்சொல் 'கோல்டு'. அப்போதுதான் 'ஐ' இணைகிறது.
அதேவேளையில் cat என்ற சொல்லில் ''t" என்பது ஒலிப்பில்லா ஒலி (Voiceless sound ). இது தமிழில் இரட்டித்து, 'கேட்ட்' என்று மாறி, அதனுடன் 'உ' சேரும் ('கேட்டு'). பின்னர் அதனுடன் 'ஐ' விகுதியை இணைக்கும்போது ''கேட்டை' என்று மாறும். இங்கு அகராதிச்சொல் 'கேட்டு' . அப்போதுதான் 'ஐ' இணைகிறது.
அதாவது, ஆங்கிலச்சொல் ஒலிப்புள்ள ஒலியில் முடிந்தால் வெறுமனே 'உ' சேரும். ஆனால் ஆங்கிலச்சொல் ஒலிப்பில்லா ஒலியில் முடிந்தால் 'கேட் - கேட்டு' என்று 'ட்' இரட்டித்து, பின்னர் 'உ' சேரும். இந்த விதியைத் தமிழில் எழுதுகிற எந்தவொரு ஆங்கிலச்சொல்லுக்கும் செயற்படுத்திப் பார்க்கலாம்.

god என்பதைத் தமிழில் 'காட்' என்று நாம் எழுதினாலும் இறுதி ஒலியை ஒலிப்புள்ள ஒலியாகத்தான் உச்சரிக்கிறோம். முதல் ஒலியையும் ஒலிப்புள்ள 'க்' -வாகத்தான் ஒலிக்கிறோம். அதுபோன்று cot என்பதைத் தமிழில் 'காட்' என்று எழுதினாலும் இறுதி ஒலியை ஒலிப்பில்லா ஒலியாகத்தான் உச்சரிக்கிறோம். முதல் ஒலியையும் ஒலிப்பிலா 'க்' ஆகத்தான் ஒலிக்கிறோம்.
தமிழில் ஒலிப்புள்ள 'ட்' இருக்கிறது; ஒலிப்பில்லா 'ட்' உம் இருக்கிறது. ஆனால் அவை ஒரே ஒலியனின் மாற்றொலிகள். ஒன்று வருமிடத்தில் மற்றொன்று வராது. 'பட்டம்' என்பதில் வருகிற 'ட்ட்' ஒலிப்பிலா ஒலி; 'பண்டம்' என்பதில் வருகிற 'ட்' ஒலிப்பிலா ஒலி.
ஆனால் இந்த இரண்டு ஒலிகளும் ஆங்கிலத்தில் தனித்தனி ஒலியன்கள். ஒரே இடத்தில் வரும்; பொருண்மை வேறுபாட்டைத் தரும். cold, gold நல்ல எடுத்துக்காட்டுக்கள். சொல்முதலில் ஒலிப்பிலா 'க்' வும் ஒலிப்புள்ள 'க்' வும் வருகின்றன. இந்த இரண்டு ஒலிகளைத் தவிர, பிற ஒலிகள் ஒன்றுபோல் இருக்கின்றன. எனவே இந்த இரண்டு சொல்களின் பொருண்மை வேறுபாட்டுக்கு இந்த ஒலிப்பிலா ஒலி, ஒலிப்புள்ள ஒலி வேறுபாடே அடிப்படை. எனவே தனித்தனி ஒலியன்கள். ஆனால் இதுபோன்று தமிழில் கிடையாது. சொல் முதலிலும் சொல் இடையில் இரட்டித்து வரும்போதும் 'க்' ஒலிப்பிலா ஒலி வரும்; சொல் இடையில் மெல்லினங்களுக்குப்பின் ஒலிப்புள்ள 'க்' வரும். எனவே இவை ஒரே ஒலியனின் மாற்றொலிகளே.
எனவே ஆங்கிலச்சொல்களைத் தமிழில் பயன்படுத்தினாலும் அவற்றின் பேச்சொலிப்பண்பைத் தக்கவைத்துத்தான் பேசுகிறோம். ஆனால் எழுத்தில் இந்த வேறுபாட்டைக் காட்ட, தமிழில் தனித்தனி எழுத்து இல்லை. தமிழில் ஒலியன்களுக்குத்தான் எழுத்து. மாற்றொலிகளுக்கு எழுத்து கிடையாது. cold -ஐ ஒலிப்பிலா 'க்' ஆகத்தான் ஒலிக்கிறோம்; அதுபோன்று gold- ஐ ஒலிப்பிலா 'க்' ஆகத்தான் ஒலிக்கிறோம். இரண்டு 'க்' -வையும் ஒன்றுபோல் ஒலிப்பதில்லை.
இறுதி ஒலி ஒலிப்புள்ள ஒலியாக இருந்தால் வெறும் 'உ' மட்டுமே சேரும். 'காடு'. ஆனால் இறுதி ஒலி ஒலிப்பிலாத ஒலியாக இருந்தால் முதலில் அது இரட்டித்து, பின்னர் 'உ' சேரும் - "காட்டு''.

வியாழன், 16 மே, 2024

''சொல்கள்'' - ''சொற்கள்'' ? ''நாள்கள் - நாட்கள்''? - ஓர் ஐயம்! (3)

 ''சொல்கள்'' - ''சொற்கள்'' ? ''நாள்கள் - நாட்கள்''? - ஓர் ஐயம்! (3)

--------------------------------------------------------------------------
பேராசிரியர் செ.இரா. செல்வக்குமார் அவர்கள்
--------------------------------------------------------
ஐயா கருதிப் பார்க்கின்றேன்.
-ல்க- என்று தமிழில் வரும். எ.கா வெல்க, சொல்க, நல்க. ஆனால் சொல்கள் என்று சொல்வது சற்று கடினமாக உள்ளது. ள் என்னும் நாமடி ஒலி க-வை அடுத்து வருவதாலோ என்னமோ. சொற்கள் என்று சொல்லுதல் எளிதாக உள்ளது. (என் உணர்வைப் பகிர்கின்றேன்).
ந. தெய்வ சுந்தரம்
-------------------------------------------------------------------
ஆமாம் பேராசிரியர் அவர்களே. நானும் இதுவரை இதை உணரவில்லை. சொற்கள், பற்கள் என்றுதான் எழுதிவருகிறேன். மிக அண்மையில்தான் ஆய்வில் இந்த முடிவுக்கு நாங்கள் வந்தோம். மாற்றி எழுதுவது கடினமாகத்தான் இருக்கிறது.செயற்கையாகத் தெரிகிறது. ஆனால் இதுதான் உண்மை.
'ல்க்' மெய்மயக்கம் தமிழில் உண்டு. ஆனால் இங்கு உள்ள சிக்கல் . . . வேற்றுமைத்தொகையில் மூன்று மெய் மயக்கங்கள் வருகின்றன. பல் + பொடி --> பல் + ப் + பொடி . இடையில் உள்ள 'ப்' புணர்ச்சி அடிப்படையில் தோன்றுகிற வல்லெழுத்து. எனவே 'ல்ப்ப்' என்று சொல்நடுவில் அமைகிறது. (ப்அல் + ப்ஒ-ட்இ --> (ப்அல்)+ (ப்) + (ப்ஒ-ட்இ) --> ப்அ - ற் - ப்ஒ-ட்இ --> பற்பொடி.
தமிழில் மூன்று மெய்மயக்கங்கள் வரலாம். ஆனால் முதல் மெய்யாக ய், ர், ழ் மட்டுமே முதல் மெய்யாக வரலாம் (தமிழ்ப்பாடம் , வாய்ப்பந்தல், மோர்க்குடம்). இங்கு திரிதல் நடைபெறாது. தோன்றல்மட்டுமே நீடிக்கும்.
ஆனால் இங்கு முதல் மெய்யாக 'ம்' வருகிறது. அதன் விளைவாகவே 'ல்ப்' இரண்டும் இணைந்து 'ற்' ஆக மாறுகிறது. 'ல்' க்கு இணையான வல்லெழுத்து 'ற்'; எனவே 'ல்ப்ப்' என்பது 'ற்' ஆக அமைகிறது. அதன் பயனே 'பற்பொடி'.
'ல்' 'ன்' இதுபோன்ற இடங்களில் வந்தால் 'ற்' கிடைக்கும்; 'ள்' 'ண்' அமைந்தால் 'ட்' கிடைக்கும்.
பொன்குடம் --> பொற்குடம்; கள்குடம் --> கற்குடம்; மண்+குடம் --> மட்குடம்.
ஆனால் நாள்கள், சொல்கள் என்பவை தொகை இல்லை. 'கள்' பன்மை விகுதிதானே! எனவே இங்கு ஒற்று தோன்றலோ அல்லது திரிதலோ நடைபெறாது. தொகைப்புணர்ச்சியில் புணர்ச்சி விதியின்படி முதலில் மெய் ஒற்று தோன்றி, பின்னர் மெய்மயக்கவிதிப்படி திரிதல் நடைபெறுகிறது. ஆனால் வெளிப்பார்வைக்கு வெறும் திரிதலாக இது தென்படுகிறது. திரிதலுக்கு அடிப்படையை இங்கு மெய்மயக்க விதிகளே.
புதை அமைப்பு : பல்ப்பொடி (பல் + ப் + பொடி)
புற அமைப்பு : பற்பொடி
ஆனால் வினைத்திரிபில் கேள் + கிறேன் --> கேட்கிறேன் (கேட்டேன், கேட்பேன்) ; கல் + கிறேன் --> கற்கிறேன் (கற்றேன், கற்பேன்). இவை தொகை இல்லை; மேலும் 'கிறு-ஏன் என்பவை விகுதிகள்தான். ஆனாலும் தொகைகளில் தோன்றுகின்ற தோன்றலும் திரிதலும் இங்கும் - வினைத்திரிபிலும் - நடைபெறுகின்றன.
எனவே இன்னும் ஆழமான ஆய்வு தேவை.

மொழியியல் தமிழுக்கு எதிரானதா?

மொழியியல் தமிழுக்கு எதிரானதா? 

மொழியியலே தமிழ்மொழி ஆய்வுக்கு எதிரானது என்று இன்னும் ஆங்காங்கே குரல்கள் ஒலித்துக்கொண்டுதான் இருக்கிறது. ஆங்கில இலக்கணத்தைத் தமிழுக்குப் புகுத்த முயல்கிறார்கள் மொழியியல் ஆய்வாளர்கள் என்று கூறப்படுகிறது.

தற்போது கணினிமொழியியல் துறை வளர்ச்சி அடையும்போது மொழியியல் ஆய்வாளர்கள் அந்தத் துறையைப் பயன்படுத்தித் தமிழ்ச்சமுதாயத்திற்கு ஏதாவது பயனுள்ள பணிகளை மேற்கொள்ளமுடியுமா என்று கருதிப்பார்க்கிறார்கள்.
மேலைநாட்டு அறிவியல் வளர்ச்சியைத் தமிழுக்குக் கொண்டுவருவதில் என்ன தவறு இருக்கிறது? அறிவியலில் மேலைநாடு, கீழைநாடு என்று பார்ப்பது சரி இல்லை. மொழியியல் துறையில் புதிய புதிய கோட்பாடுகள் உலக அளவிலான மொழியியல் ஆய்வாளர்கள் முன்வைக்கிறார்கள். அவற்றைத் தமிழ்க்குச் செயல்படுத்திப் பார்த்து, அந்தக் கோட்பாடுகள் சரியா தவறா என்று மொழியியல் ஆய்வாளர்கள் ஆய்வுசெய்யவேண்டும்.
மொழியியல் என்றால் ஆங்கில இலக்கணம் என்று கூறப்பட்டது . தற்போது மொழியியல் துறையானது கணினியை வைத்துக்கொண்டு தமிழைச் சிதைக்கிறார்கள் என்ற குற்றச்சாட்டு ஒலித்துவருகிறது.

தமிழகத்தில் மொழியியலுக்கு எதிராகப் பேசுபவர்கள் முதலில் மொழியியல் துறைபற்றி நன்கு தெரிந்துகொண்டு பேசவேண்டும். அனைத்து மனித மொழிகளின் பண்புகளையும் ஆய்வுசெய்யக்கூடிய ஒரு துறை மொழியியல். மொழியியல் அனைத்து மொழித்துறைகளுக்கும் பொதுவானது. அதை ஆங்கிலத்திற்கும் பயன்படுத்தலாம், தமிழுக்கும் பயன்படுத்தலாம், வளர்ச்சியடையாத மொழிகளையும் ஆய்வு செய்யலாம். ஆங்கிலத்திற்கு ஒரு ஆய்வுமுறை, தமிழுக்கு ஒரு முறை, பழங்குடி மக்களின் மொழிகளுக்கு ஒரு ஆய்வுமுறை என்று மொழியியலில் கிடையாது. இயற்பியல், வேதியில் போன்று இதுவும் ஒரு அறிவியல் துறை.

இன்றைக்கு அதிகமாகப் பேசப்பட்டுவருகிற செய்யறிவுத்திறன் தொழில்நுட்பம் 50 ஆண்டுகளுக்குமுன்பு தோன்றி வளர்ந்திருக்கமுடியாது. தற்போது ஏற்பட்டுள்ள கணினியியல் வளர்ச்சியும் அதற்கான உட்கட்டுமானமும் (Infra structure) இதைச் சாத்தியமாக்கியுள்ளது. ஆயிரக்கணக்கானவர்களின் கூட்டு உழைப்பால்தான் இது சாத்தியமாகியுள்ளது. இப்போதும்கூட ஒரு தனிநபர் அதைப் பயன்படுத்தமுடியுமேதவிர, அதுபோன்ற ஒன்றைத் தனியே உருவாக்கமுடியாது. கோடிக்கணக்கான பணம் தேவை. ஆயிரக்கணக்கானவர்களின் கூட்டு உழைப்பு தேவை. இது தற்போதுதான் சாத்தியம். இதில் என்ன பிரச்சினை என்றால் கூகுள், மைக்ரோசாப்ட், அமேசான் போன்ற மிகப் பெரிய பன்னாட்டு நிறுவனங்கள்தான் உருவாக்கமுடிகிறது. மற்றவர்கள் அதைப் பயன்படுத்தலாம். உருவாக்குவது கடினம்.
எந்தவொரு அறிவியல் கண்டுபிடிப்புக்கும் தேவை ஒரு சமுதாயத்தில் உருவாகவேண்டும். மேலும் அதற்கான உள்கட்டமான வசதி வேண்டும். அப்போதுதான் குறிப்பிட்ட அறிவியல் தோன்றி வளரமுடியும் ( இதுபற்றி இரண்டு நூல்களை ஆர்வமுள்ளவர்கள் படிக்கவேண்டும். ஒன்று, பெர்னால் அவர்களின் ''வரலாற்றில் அறிவியல் - Science in History) '';. மற்றொன்று ஜோசப் நீதாம் அவர்களின் '' சீனத்தில் அறிவியலும் நாகரிகமும் - Science and Civilization in China: இதுபோன்று ஒரு நூலை இந்தியாவில் தேபி பிரசாத் சட்டோபாத்யாயாய எழுதியுள்ளார்) இன்றைக்குச் செய்யறிவுத்திறன் பன்னாட்டுக் கம்பெனிகளுக்குத் தேவைப்படுகிறது. அதற்கான வசதியும் அவர்களிடம் இருக்கிறது. நாம் அதைப் பயன்படுத்தாலம். நமக்கேற்றமுறையில் சற்று மாற்றலாம். அவ்வளவுதான்.

மற்றொரு கருத்தையும் இவ்விடத்தில் தெரிவிக்க விரும்புகிறேன். நானோ அல்லது தமிழகத்தின் மொழியியல் ஆசிரியர்கள் , ஆய்வாளர்களோ எந்தவொரு இடத்திலும் தமிழ்மொழியின் இலக்கணத்தை அல்லது தமிழ்மொழியின் அமைப்பு நுட்பங்களைப் புறக்கணிக்கவோ அல்லது தவிர்க்கவோ அல்லது எதிராகப் பேசவோ செய்தது கிடையாது. ஒரு மொழியின் வளத்தை மேலும் திட்டமிட்டு அம்மொழிச்சமுதாயத்தின் தேவைகளுக்கு ஏற்ப வளர்த்தெடுப்பதற்கான கருத்துக்களை முன்வைப்பது தமிழ்மொழிக்கு எதிரானது கிடையாது. மாறாக, தமிழ்மொழிக்குத் திட்டம்மிட்டு வளத்தைக் கூட்டுவதே ஆகும்.
இதுபோன்றுதான் தற்போதைய கணினி மொழியியல் அல்லது இயற்கைமொழி ஆய்வுத் துறை. இந்தத் துறையானது தனது மொழி ஆய்வில் எங்கும் நிலவுகிற இன்றைய எழுத்துத்தமிழின் மொழிநுட்பங்களைப் புறக்கணிக்கச் சொல்லவில்லை. எனது வருத்தமே இந்தக் கணினிமொழியியல் துறை, செய்யறிவுத்திறன் மென்பொருள் உருவாக்கம் போன்றவற்றைப் பற்றிப் புரிதல் இல்லாமல் அல்லது செயற்படுத்திப்பார்க்காமல், குறைகூறுவதுதான். இந்த அணுகுமுறை தமிழ்மொழி வளர்ச்சிக்கு எதிரானது என்று கூறக்கூடாது. இந்த மொழி அறிவைக் கணினிக்குக் கொடுப்பதில் அது கணிதத்தையும் புள்ளியியலையும் கணினியியலையும் இணைத்துக்கொளவதில் எவ்விதத் தவறும் இல்லை. இந்த முயற்சி உறுதியாகத் தமிழுக்கு வளம் சேர்க்கும்; தமிழ்ச்சமுதாயத்தின் மொழிச்செயல்பாடுகளுக்கு உதவும்.
மாறாக, இன்றைய தமிழ்மொழியின் தரவுகளை எவ்வாறு கணினிக்கு அளித்தால், கணினி அதைப் புரிந்துகொண்டு அல்லது கற்றுக்கொண்டு தமிழுக்குச் செயல்படுத்தலாம் என்பதே இத்துறையின் ஆய்வு அல்லது முயற்சி ஆகும். கணினி அவ்வாறு புரிந்துகொண்டால் தமிழ்ச் சமுதாயத்திற்குப் பலவகைகளில் மொழிப்பயன்பாடுகளில் உதவும். கணினியின் இந்த மொழிகற்றலில் தமிழின் எந்தவொரு மொழிநுட்பத்தையும் புறக்கணிக்கவோ அல்லது கைவிடவோ அது சொல்வது இல்லை. மாறாக, தமிழ்மொழியின் நுட்பங்களைக் கணிதம், புள்ளியியல், கணினியியல்போன்ற துறைகளின் அறிவோடு இணைத்து, தமிழ்மொழி ஆய்வை அடுத்த உயர்கட்டத்திற்குக் கொண்டுசெல்வதுதான்.
எனவே இந்த புதிய துறையைப்பற்றிய அறிவை நாம் உள்வாங்கிக்கொள்ளாமல், செயல்படுத்திப்பார்க்காமல், தொடக்கத்திலேயே இத்துறையானது தமிழ்மொழிக்கு எதிரானது என்று கூறுவது சரி கிடையாது.

 
Design by Free WordPress Themes | Bloggerized by Lasantha - Premium Blogger Themes | Hot Sonakshi Sinha, Car Price in India