எழுத்துத்தமிழ் இலக்கணமும் கணினித்தமிழ் இலக்கணமும் வேறுபட்டதா?
---------------------------------------------------------------------- --------------------------------------------------
பேராசிரியர் நண்பர் நெடுஞ்செழியன் வேலாயுதம் அவர்கள்:
//என்னுடைய கேள்வி என்னவென்றால் கணினிக்காக உருவாக்கப்படும் இந்தத் தோன்றல் விதி, மொழியில் இல்லாத ஒன்றுதானே. எனவே கணினிக்காக உருவாக்கும் இந்தத் தோன்றல் விதியை, மொழி வழக்கைக் காத்தல் பொருட்டு, தோன்றிக் கெடுதல் என கணினிக்கு வழங்கலாமே .//
1) பேச்சுத்தமிழ்தான் எழுத்துத் தமிழுக்கு அடிப்படை; எனவே சில புணர்ச்சி விதிகள் பேச்சுவழக்கில் இல்லையென்றால் அதை ஏன் எழுத்துத்தமிழில் தக்கவைக்கவேண்டும்?
2) கணினிக்கு வேண்டுமென்றால் பொருள் மயக்கம் தோன்றாமல் இருப்பதற்குத் ''தேவையற்ற'' புணர்ச்சி விதிகளை அளிக்கலாம்.
முதல் கருத்துக்கு எனது பதில் நேற்றே கூறியிருந்தேன். தமிழ் ஒரு இரட்டைவழக்குமொழி (diglossic language) . தமிழ்ச் சமுதாயத்தின் அனைத்து மொழிவழிச் செயல்பாடுகளையும் (language functions) மேற்கொள்வதற்கு பேச்சுத்தமிழும் வேண்டும், எழுத்துத்தமிழும் வேண்டும். எங்குப் பேச்சுத்தமிழ் பயன்படுத்தவேண்டும், எங்கு எழுத்துத்தமிழ் பயன்படுத்தவேண்டும் என்பதை ஒரு தனிநபர் தீர்மானிக்கவில்லை; மாறாக, தமிழ்ச் சமுதாயமே தீர்மானிக்கிறது.
ஆங்கிலம், தமிழ் மொழிகளைப் பொறுத்தமட்டில் எங்கு ஆங்கிலம், எங்குத் தமிழ் என்பதை ஒரு தனிநபர் முடிவு செய்துகொள்ளலாம். ஒரு குறிப்பிட்ட சூழலில் ஒருவர் தனக்கு ஆங்கிலம் தெரியும், தான் படித்தவர் என்பதை மற்றவர்களுக்குத் தெரிவிப்பதற்காக ஆங்கிலத்தைப் பயன்படுத்துவார். ஆனால் அது கட்டாயம் இல்லை. தமிழைப் பயன்படுத்தலாம். தடை இல்லை! நீடிக்கின்ற தடைகள் எல்லாம் நமக்கு நாமே உருவாக்கிக் கொண்டவையே! இதை இருமொழியம் என்று கூறுவார்கள் (bilingualism) .
அல்லது சில இடங்களில் கட்டாயமாக ஆங்கிலமும் சில இடங்களில் கட்டாயமாகத் தமிழும் பயன்படுத்தவேண்டும் என்று சூழல் தோன்றலாம். இதுபோன்ற சூழல் இருந்தால் அதை இரட்டை வழக்கு இருமொழியம் ( Bilingualism with diglossia) என்று அழைப்பார்கள். தமிழ்நாட்டில் இது கிடையாது.
எனவே , இன்றைய சூழலில் பேச்சுவழக்கும் எழுத்துவழக்கும் ஒரே மொழியின் இரட்டைவழக்குகளாகவே நீடிக்கின்றன. இது ஒரு சமுதாயமொழியியல் சிக்கல் (Sociolinguistic problem) . தமிழ்மொழி வரலாற்றில் இந்தச் சூழல் எப்போது தோன்றியது, இது உண்மையில் ஒரு சிக்கலா, சிக்கல் என்றால் எப்படி இதைத் தீர்ப்பது என்பது வேறு ஆய்வு. அதில் நான் இப்போது நுழையவில்லை. ஆனால் நாம் விரும்பினாலும் விரும்பாவிட்டாலும் இன்று இரண்டு தமிழ் வழக்குக்களும் ஒருவருக்குத் தேவை. நாம் இரண்டு வழக்குக்களையும் வைத்துக்கொண்டுதான் இன்று தமிழ்ச்சமுதாயத்தில் செயல்படுகிறோம்.
எழுத்துத்தமிழுக்காகப் பேச்சுத்தமிழ் இலக்கணத்தை மாற்றுவதும் பேச்சுத்தமிழுக்காக எழுத்துத்தமிழ் இலக்கணத்தை மாற்றுவதும் இன்றைய கட்டத்தில் இயலாத ஒரு செயல். நாம் இயற்கையாகப் பேசும்போது, ''நான் படிச்சேன்; நான் உடைச்சேன்; எலெயெப் பறி; ஒலகத்தில் இது இருக்கிறது'' என்று பேசுகிறோம். ஆனால் நம்மை எழுதச்சொன்னால், உறுதியாக நாம் ''நான் படித்தேன்; நான் உடைத்தேன்; இலையைப் பறி; உலகத்தில் இது இருக்கிறது'' என்றுதான் எழுதுவோம்.
அடுத்து, எழுத்துத்தமிழுக்கும் பேச்சுத்தமிழுக்குமான இலக்கணங்களில் பெரிய வேறுபாடு கிடையாது. ஒலியன் அளவில்தான் (phonological differences) வேறுபாடு. 'இலை' - 'எலெ' - இங்கு 'இ' ஆனது 'எ' ஆக மாறுகிறது; 'படித்தான்' - 'படிச்சான்' - இங்கு இறந்தகால விகுதி -த்த்- என்பது பேச்சுத்தமிழில் -ச்ச்- என்று மாறுகிறது. ஆனால் 'கொடுத்தான்' என்பது 'கொடுச்சான்' என்று மாறாது. 'உண்மை' என்பது 'ஒண்மை' என்று மாறாது. எங்கும் மாறும் , எங்கு மாறாது என்பதற்குத் தெளிவான விதிகள் உண்டு. 'கொடுத்தான்' என்பது 'கொடுச்சான்' என்று மாறாது; 'உண்மை' என்பது 'ஒண்மை' என்ற மாறாது.
மேலும் எழுத்துத்தமிழைப் பள்ளிகளில் முறையாகக் கற்காதவர்களும் தமிழ் நாளிதழ்களை வாசித்துக்காட்டினால் புரிந்துகொள்வார்கள் (Comprehension ability) ; மேடையில் எழுத்துத்தமிழில் பேசினால் புரிந்துகொள்வார்கள். அவர்களால் எழுத்துத்தமிழைப் பயன்படுத்தமுடியாமல் (Performance disability) இருக்கலாம். அவ்வளவுதான்! எனவேதான் எழுத்துத்தமிழ் - பேச்சுத்தமிழைத் தமிழின் இரட்டைவழக்குக்கள் (diglossic language) என்று மொழியியலாளர்கள் அழைக்கிறார்கள். இரு வழக்குக்கள் (two dialects) என்றோ இரு மொழிகள் (two languages) என்றோ அழைக்கவில்லை. ஒட்டிப்பிறந்த இரட்டைக்குழந்தைகள் அல்லது இரட்டைப் பழங்கள். இரு குழந்தைகளோ அல்லது இரு பழங்களோ இல்லை. இந்த நுட்பமான வேறுபாட்டை நாம் புரிந்துகொள்ளவேண்டும்.
இது ஒருபுறம் இருக்க . . . இங்குப் பேராசிரியர் நெடுஞ்செழியன் அவர்கள் கூறியது, பேச்சுவழக்கே எழுத்துவழக்குக்கு அடிப்படை என்றும் அதனால் பேச்சுவழக்கில் ஒரு புணர்ச்சி விதி இல்லையென்றால், அதை ஏன் எழுத்துத்தமிழில் பயன்படுத்தவேண்டும்? விட்டுவிடலாமே!
மனிதமூளை அளவுக்குக் கணினிக்கு மொழியறிவு கொடுக்கமுடியாது என்பதால், வேண்டுமென்றால் கணினித்தமிழில் அந்த புணர்ச்சிவிதியை வைத்துக்கொள்ளுங்கள் என்பது அவர் கருத்துபோல் தெரிகிறது.
ஏற்கனவே பேச்சுத்தமிழ், எழுத்துத்தமிழ் என்று இருப்பதே ஒரு சிக்கல் என்று நாம் நினைக்கும்போது, மூன்றாவதாகக் கணினித்தமிழ் என்ற ஒரு தனித் தமிழ் உருவாக இடம் கொடுக்கவேண்டுமா?
பேராசிரியர் கூறுவதில் ஒரு உண்மை உண்டு. அதாவது கணினிக்கு ஒரு தொடரின் பொருண்மையை முழுமையாகப் புரிந்துகொள்வதற்குத் தேவையான உலகறிவு (World knowledge / ontology / Pragmatic knowledge) இல்லாததால், அனைத்து மொழிக்கூறுகளையும் - இலக்கணம் உட்பட - தெளிவாகவும் வெளிப்படையாகவும் (Explicitly) கொடுக்கவேண்டிய சூழல் உண்டு.
ஆனால் இந்தச் சிக்கலைத் தற்போதைய கணினிமொழியியல் (Computational Linguistics) ஆய்வு பெரிய அளவுக்குத் தீர்த்துக்கொள்ளும் திறன் கணினிமொழியியலில் நீடிக்கிறது. ''நான் பழம் சாப்பிட்டேன்'' என்பதில் செயப்படுபொருளான 'பழம்' இரண்டாம் வேற்றுமை உருபை - 'ஐ'- எடுக்காமல் இருந்தாலும் மனிதமூளை தனது உலகறிவைக்கொண்டு ஐயத்தைத் தீர்த்துக்கொள்கிறது; அதுபோல 'மாமா நேற்று வந்தார், அவர் எனக்குப் பரிசு அளித்தார்' என்ற தொடரில் 'அவர்' என்பது யார் என்பதை முந்தைய தொடரிலிருந்து மனித மூளை புரிந்துகொள்கிறது.
ஆனால் கணினி இவ்வாறு புரிந்துகொள்ளமுடியுமா? அதற்குத் தெளிவாக, 'நான் பழத்தைச் சாப்பிட்டேன்' ; 'மாமா நேற்று வந்தார், அந்த மாமா எனக்குப் பரிசு அளித்தார்' என்று கொடுக்கவேண்டாமா? உண்மைதான் . . . இது சிக்கல்தான்!
ஆனால் இன்று கணினிமொழியியலில் இதுபோன்ற பொருள் மயக்கம் (Word sense ambiguity) , இலக்கண மயக்கம் (Grammatical ambiguity) ஆகியவற்றைத் தீர்ப்பதற்குத் தேவையான மொழியியல் உத்திகள் (Computational linguistic formalisms and disambiguation techniques) தோன்றி நிலவுகின்றன.
இதுபோன்றவற்றைப்பற்றிப் படிப்பதுதான் கணினிமொழியியல் (Computational Linguistics). இந்தத் துறையானது வெறும் கணினியியல் இல்லை; வெறும் மொழியியல் இல்லை. மாறாக, கணினிக்கு மொழியைக் கற்றுக்கொடுப்பதற்கான ஒரு புதிய துறை.
'படித்தான்' என்பதில் -த்த்- என்பது இறந்தகால விகுதி; ஆனால் 'அத்தான்' என்பதில் உள்ள '-த்த்-' இறந்தகால விகுதி இல்லை என்று கணினியால் இன்று தெரிந்துகொள்ளமுடியும். சொற்பொருண்மை மயக்கம் (Word Sense ambiguity) இலக்கண வகைப்பாடு மயக்கம் ( grammatical ambiguity) ,சுட்டுப்பொருள் மயக்கம் ( Anaphora ), தொலைதூரச் சார்பு ( long distance dependency) போன்ற சிக்கல்களை எவ்வாறு தீர்ப்பது என்பதற்கு நிகழ்தகவு இயலைக் (Probabilistic statistics) கொண்டும், ஆழ்நிலை கற்றல் (Deep Learning) , நரம்புப்பின்னல் அமைப்பு (Neural Network) போன்ற பல நுட்பமான உத்திகள் அல்லது வழிமுறைகள் தற்போது கணினிமொழியியல் துறையில் நீடிக்கின்றன.
எனவே, இன்றைய எழுத்துத்தமிழை - அதன் இலக்கண அமைப்பை அடிப்படையாகக்கொண்டே - கணினிக்குக் கற்றுக்கொடுக்கமுடியும். எனவே கணினித்தமிழ் , கணினித்தமிழ் இலக்கணம் என்பதெல்லாம் தேவை இல்லை. எழுத்துத்தமிழையும் எழுத்துத்தமிழாகக் கணினி புரிந்துகொள்ளமுடியும்; அதுபோன்று, பேச்சுத்தமிழையும் பேச்சுத்தமிழாகவே கணினியால் புரிந்துகொள்ளமுடியும்.
மேடைகளில் 'இயற்றமிழ், இசைத்தமிழ், நாடகத்தமிழ் ' என்று பேசப்படுகிற 'முத்தமிழ்' வரிசையில் கணினித்தமிழை வைப்பது சரியில்லை. முத்தமிழ் என்பதுங்கூட தமிழை - பொதுத்தமிழை- எந்தக் கருத்தாடலுக்குப் (Discourse) பயன்படுத்துகிறோம் என்ற அடிப்படையில் உருவாக்கப்பட்ட வேறுபாடுதான். மூன்றிலும் பொதுத்தமிழ்தான் பயன்படுகிறது. சில சில நடை வேறுபாடு (Stylistic differences) இருக்கும் . கருத்து வெளிப்பாட்டு உத்திகள் மாறுபடும். அவ்வளவுதான். அதுபோல் 'அறிவியல் தமிழ்' என்பதும் ஒரு கருத்தாடல் நடை வேறுபாடுதான். அதிலும் பொதுத்தமிழ்தான் பயன்படுகிறது. அனைத்திலும் பயன்படுகிற தமிழ் இலக்கணம் இன்றைய எழுத்துத்தமிழ் இலக்கணமே. அவற்றிற்கென்று தனி மொழி இலக்கணம் கிடையாது!
0 கருத்துகள்:
கருத்துரையிடுக