வெள்ளி, 14 நவம்பர், 2025

தொகை (நிலைத் தொடர்) - தொகாநிலைத் தொடர் - சந்திச் சிக்கல்.

 தொகை (நிலைத் தொடர்) - தொகாநிலைத் தொடர் - சந்திச் சிக்கல்.

1. அச்சு பிழை
2. அஞசல்வழி கல்வி
3. அணி தலைவர்
4. அரசு கல்லூரி
5. வரி தள்ளுபடி
மேற்கண்டவற்றில் ஒற்று மிகுமா மிகாதா?
மிகும் - மிகாது ! ஆமாம் இரண்டுமே சரிதான்! இது என்ன குழப்பம்?
பொதுவாக, நாம் நம்முடைய பேச்சையும் செயலையும் இடத்திற்குத் தகுந்தமாதிரி மாற்றிக் கொள்கிறோம் அல்லவா?
ஒரு குறிப்பிட்ட சூழலில் நாம் பேசுவதும் மாறுபட்ட மற்றொரு சூழலில் நாம் பேசுவதும் மாறுபடுகின்றன அல்லவா? அதுபோல்தான் இந்த ஒற்று மிகுதல் - மிகாமையும் ஆகும்.
1.1. [இந்த அச்சு] [பிழை இல்லாமல் இருக்கிறது]
1.2. [அச்சுப் பிழைகளே] [இந்த நூலில் இல்லை.]
2.1. [எங்கள் அணி] [தலைவர் இன்றித் திண்டாடுகிறது.]
2.2. [எங்கள் அணித் தலைவர்] [மிகத் திறமை
வாய்ந்தவர் ]
3.1. [தமிழ்நாடு அரசு] [கல்லூரிகளுக்கு அதிக நிதி
ஒதுக்கியுள்ளது.]
3.2. [புதிய ஆசிரியர் நியமனம்] [அரசுக் கல்லூரிகளுக்கு
நடைபெற்றுவருகிறது.]
4.1. [சில பொருள்களின் வரி] [தள்ளுபடிக்கு
உட்பட்டது.]
4.2. [தமிழ் மென்பொருள்கள்] [வரித் தள்ளுபடிக்கு
உட்பட்டவை இல்லை.]
1.1. - இல் 'அச்சு' 'பிழைகள்' இரண்டுமே வெவ்வேறு தொடர்களில் - ஒன்று எழுவாய்த்தொடர், மற்றொன்று பயனிலைத் தொடர் - அமைந்துள்ளன.
1.2. - இல் 'அச்சு' 'பிழைகளே' இரண்டுமே ஒரே தொடரில்
அமைந்துள்ளன. ஒரே தொடருக்குள் வேற்றுமை உறவு நீடிக்கிறது. 'அச்சின் பிழைகள்' என்பதே அத்தொடரின் பொருண்மை.
1.1. தொகாநிலைத் தொடர் என்று அழைக்கப்படுகிறது.
1.2. தொகை (நிலைத்தொடர்) என்று அழைக்கப்படுகிறது.
எனவே, குறிப்பிட்ட இரண்டு சொற்களுக்கு இடையில் உள்ள தொடரியல் உறவே இந்த எடுத்துக்காட்டுகளில் ஒற்று வருவதற்கும் வராததற்கும் அடிப்படைக் காரணமாகும்.
நம்முடைய பொது அறிவும் பேசும் சூழலும் குறிப்பிட்ட சொற்களுக்கு முந்தைய பிந்தைய சொற்களும் நமக்கு ஐயமில்லாமல் பொருண்மையைப் புரிந்துகொள்ள உதவுகின்றன.
ஆனால் தமிழ் எழுத்துரைப் பயிற்சி இல்லாதவர்களுக்கு எழுதும்போது இதில் சிக்கல் ஏற்படுகிறது. இரண்டு சொற்களும் பெயர்ச்சொற்கள்தானே என்று நினைக்கலாம். பெயர்ச்சொற்கள் என்பது சொல் வகைப்பாடு. ஆனால் இங்கே சொல்வகைப்பாடு தாண்டி, தொடரியல் வகைப்பாடு - தொகைநிலைத்தொடரா, தொகாநிலைத்தொடரா என்னும் வகைப்பாடு - தேவைப்படுகிறது. வருமொழி முதலில் வல்லினம் வருகிறதா, எந்த வல்லினம் வருகிறது என்னும் எழுத்தியல் அறிவும் தேவைப்படுகிறது.
கணினிக்குத் தற்போது இதுதான் பிரச்சினை! கணினி எப்படி இந்த அறிவைப் பெற்றுக்கொள்ளும்?
ஒரு வழி , மொழியியல் (Linguistics) துணைகொண்டு, தமிழ்த் தொடரியல் ஆய்வின் (Syntactic analysis) அடிப்படையில் இந்த இலக்கண அறிவைக் (Linguistic / grammatical knowledge) கணினிக்குக் கொடுக்கலாம். இந்த அறிவில் எழுத்தியல் (Phonology) , சொல்லியல் (Morphology) அறிவைத் தாண்டி, தொடரியல் அறிவும் (Syntax) தேவைப்படுகிறது. [சில தொடர்களில் பொருண்மையியல் அறிவும் (Semantics) தேவைப்படலாம் (பழம் + கூடை --> பழக்கூடை / பழங்கூடை ]. இதுவே அண்மைக் காலம்வரை கணினிமொழியியல் துறையின் (Computational Linguistics) பணியாக அமைந்திருந்தது.
தற்போது ஒரு குறிப்பிட்ட சிக்கலுக்கு , அச்சிக்கல் தோன்றுகிற ஆயிரக்கணக்கான தொடர்களைக் (Dataset) கொடுத்து, அதன்மூலம் கணினியைப் பயிற்றுவித்து (Pre-training) இந்த அறிவைப் பெற்றுக்கொள்ள வைக்கும் தொழில்நுட்பம் தோன்றி நிலவுகிறது. தொகைநிலைத் தொடர்களுக்கு ஆயிரக்கணக்கான வேறுபட்ட எடுத்துக்காட்டுகளும் தொகாநிலைத் தொடர்களுக்கு ஆயிரக்கணக்கான எடுத்துக்காட்டுகளும் கொடுத்தால், பெரும்மொழிமாதிரி (Large Language Model - LLM) இந்த அறிவைப் பெற்றுக்கொள்ளும் என்று எதிர்பார்க்கப்படுகிறது.
தற்போது எங்களுடைய 'மென்தமிழ்' சந்தித் திருத்தியில் பயனர்களிடம் இந்த வினாவை - குறிப்பிட்ட சொற்கள் தொகைநிலைத்தொடராக அமைகின்றனவா, தொகாநிலைத்தொடராக அமைகின்றனவா - கேட்கிறோம். அதைப்பொறுத்து மென்பொருள் ஒற்று இடும். ஆனால் இதை எல்லோராலும் செய்யமுடியாது.
அவ்வாறு இல்லாமல் செய்யறிவுத்திறனின் (Artificial Intelligence - AI) பெரும்மொழிமாதிரி (LLM) அடிப்படையில் மென்பொருளின் சந்தித்திருத்தி தானே இந்த ஐயங்களைத் தீர்த்துக்கொள்ளப் பயனர்களுக்கு உதவ வேண்டும். இது ஒரு எளிமையான பணி இல்லை! ஆனாலும் முயல்வோம்!
மேற்கூறிய கருத்துகளில் தவறோ அல்லது குழப்பமோ இருக்கலாம். இருந்தால் சுட்டிக்காட்டவும். திருத்திக்கொள்ளலாம்!

0 கருத்துகள்:

கருத்துரையிடுக

 
Design by Free WordPress Themes | Bloggerized by Lasantha - Premium Blogger Themes | Hot Sonakshi Sinha, Car Price in India