தொகை (நிலைத் தொடர்) - தொகாநிலைத் தொடர் - சந்திச் சிக்கல். (தமிழ் மாணவர்களுக்கு)
------------------------------------------------------------------------------------------------------------
1. அச்சு பிழை
2. அஞசல்வழி கல்வி
3. அணி தலைவர்
5. வரி தள்ளுபடி
மேற்கண்டவற்றில் ஒற்று மிகுமா மிகாதா?
மிகும் - மிகாது ! ஆமாம் இரண்டுமே சரிதான்! இது என்ன குழப்பம்?
பொதுவாக, நாம் நம்முடைய பேச்சையும் செயலையும் இடத்திற்குத் தகுந்தமாதிரி மாற்றிக் கொள்கிறோம் அல்லவா?
ஒரு குறிப்பிட்ட சூழலில் நாம் பேசுவதும் மாறுபட்ட மற்றொரு சூழலில் நாம் பேசுவதும் மாறுபடுகின்றன அல்லவா? அதுபோல்தான் இந்த ஒற்று மிகுதல் - மிகாமையும் ஆகும்.
1.1. [இந்த அச்சு] [பிழை இல்லாமல் இருக்கிறது]
1.2. [அச்சுப் பிழைகளே] [இந்த நூலில் இல்லை.]
2.1. [எங்கள் அணி] [தலைவர் இன்றித் திண்டாடுகிறது.]
2.2. [எங்கள் அணித் தலைவர்] [மிகத் திறமை
வாய்ந்தவர் ]
3.1. [தமிழ்நாடு அரசு] [கல்லூரிகளுக்கு அதிக நிதி
ஒதுக்கியுள்ளது.]
3.2. [புதிய ஆசிரியர் நியமனம்] [அரசுக் கல்லூரிகளுக்கு
நடைபெற்றுவருகிறது.]
4.1. [சில பொருள்களின் வரி] [தள்ளுபடிக்கு
உட்பட்டது.]
4.2. [தமிழ் மென்பொருள்கள்] [வரித் தள்ளுபடிக்கு
உட்பட்டவை இல்லை.]
1.1. - இல் 'அச்சு' 'பிழைகள்' இரண்டுமே வெவ்வேறு தொடர்களில் - ஒன்று எழுவாய்த்தொடர், மற்றொன்று பயனிலைத் தொடர் - அமைந்துள்ளன.
1.2. - இல் 'அச்சு' 'பிழைகளே' இரண்டுமே ஒரே தொடரில்
அமைந்துள்ளன. ஒரே தொடருக்குள் வேற்றுமை உறவு நீடிக்கிறது. 'அச்சின் பிழைகள்' என்பதே அத்தொடரின் பொருண்மை.
1.1. தொகாநிலைத் தொடர் என்று அழைக்கப்படுகிறது.
1.2. தொகை (நிலைத்தொடர்) என்று அழைக்கப்படுகிறது.
எனவே, குறிப்பிட்ட இரண்டு சொற்களுக்கு இடையில் உள்ள தொடரியல் உறவே இந்த எடுத்துக்காட்டுகளில் ஒற்று வருவதற்கும் வராததற்கும் அடிப்படைக் காரணமாகும்.
நம்முடைய பொது அறிவும் பேசும் சூழலும் குறிப்பிட்ட சொற்களுக்கு முந்தைய பிந்தைய சொற்களும் நமக்கு ஐயமில்லாமல் பொருண்மையைப் புரிந்துகொள்ள உதவுகின்றன.
ஆனால் தமிழ் எழுத்துரைப் பயிற்சி இல்லாதவர்களுக்கு எழுதும்போது இதில் சிக்கல் ஏற்படுகிறது. இரண்டு சொற்களும் பெயர்ச்சொற்கள்தானே என்று நினைக்கலாம். பெயர்ச்சொற்கள் என்பது சொல் வகைப்பாடு. ஆனால் இங்கே சொல்வகைப்பாடு தாண்டி, தொடரியல் வகைப்பாடு - தொகைநிலைத்தொடரா, தொகாநிலைத்தொடரா என்னும் வகைப்பாடு - தேவைப்படுகிறது. வருமொழி முதலில் வல்லினம் வருகிறதா, எந்த வல்லினம் வருகிறது என்னும் எழுத்தியல் அறிவும் தேவைப்படுகிறது.
கணினிக்குத் தற்போது இதுதான் பிரச்சினை! கணினி எப்படி இந்த அறிவைப் பெற்றுக்கொள்ளும்?
ஒரு வழி , மொழியியல் (Linguistics) துணைகொண்டு, தமிழ்த் தொடரியல் ஆய்வின் (Syntactic analysis) அடிப்படையில் இந்த இலக்கண அறிவைக் (Linguistic / grammatical knowledge) கணினிக்குக் கொடுக்கலாம். இந்த அறிவில் எழுத்தியல் (Phonology) , சொல்லியல் (Morphology) அறிவைத் தாண்டி, தொடரியல் அறிவும் (Syntax) தேவைப்படுகிறது. [சில தொடர்களில் பொருண்மையியல் அறிவும் (Semantics) தேவைப்படலாம் (பழம் + கூடை --> பழக்கூடை / பழங்கூடை ]. இதுவே அண்மைக் காலம்வரை கணினிமொழியியல் துறையின் (Computational Linguistics) பணியாக அமைந்திருந்தது.
தற்போது ஒரு குறிப்பிட்ட சிக்கலுக்கு , அச்சிக்கல் தோன்றுகிற ஆயிரக்கணக்கான தொடர்களைக் (Dataset) கொடுத்து, அதன்மூலம் கணினியைப் பயிற்றுவித்து (Pre-training) இந்த அறிவைப் பெற்றுக்கொள்ள வைக்கும் தொழில்நுட்பம் தோன்றி நிலவுகிறது. தொகைநிலைத் தொடர்களுக்கு ஆயிரக்கணக்கான வேறுபட்ட எடுத்துக்காட்டுகளும் தொகாநிலைத் தொடர்களுக்கு ஆயிரக்கணக்கான எடுத்துக்காட்டுகளும் கொடுத்தால், பெரும்மொழிமாதிரி (Large Language Model - LLM) இந்த அறிவைப் பெற்றுக்கொள்ளும் என்று எதிர்பார்க்கப்படுகிறது.
தற்போது எங்களுடைய 'மென்தமிழ்' சந்தித் திருத்தியில் பயனர்களிடம் இந்த வினாவை - குறிப்பிட்ட சொற்கள் தொகைநிலைத்தொடராக அமைகின்றனவா, தொகாநிலைத்தொடராக அமைகின்றனவா - கேட்கிறோம். அதைப்பொறுத்து மென்பொருள் ஒற்று இடும். ஆனால் இதை எல்லோராலும் செய்யமுடியாது.
அவ்வாறு இல்லாமல் செய்யறிவுத்திறனின் (Artificial Intelligence - AI) பெரும்மொழிமாதிரி (LLM) அடிப்படையில் மென்பொருளின் சந்தித்திருத்தி தானே இந்த ஐயங்களைத் தீர்த்துக்கொள்ளப் பயனர்களுக்கு உதவ வேண்டும். இது ஒரு எளிமையான பணி இல்லை! ஆனாலும் முயல்வோம்!
மேற்கூறிய கருத்துகளில் தவறோ அல்லது குழப்பமோ இருக்கலாம். இருந்தால் சுட்டிக்காட்டவும். திருத்திக்கொள்ளலாம்!


9:34 PM
ந.தெய்வ சுந்தரம்
0 கருத்துகள்:
கருத்துரையிடுக