வெள்ளி, 14 நவம்பர், 2025

மொழியியல் பார்வையில் தமிழ்ப் பெயரெச்சம் - பெயர்த் தொடர்

 மொழியியல் பார்வையில் தமிழ்ப் பெயரெச்சம் - பெயர்த் தொடர் . . . (தமிழ் மாணவர்கள் - ஆய்வாளர்கள் கவனத்திற்கு)

--------------------------------------------------------------------------
1) 'படித்த பையன்'
2) 'படித்த புத்தகம்'
3) 'படித்த பள்ளிக்கூடம்'
நண்பர் ஒருவர் ஒரு ஐயம் எழுப்பினார். 'படித்த பையன்' என்பது 'பையன் படித்தான்' என்று கூறலாம். ஆனால் 'படித்த புத்தகம்' என்று கூறினால் 'புத்தகம் படித்தது' என்றுதானே பொருள் தரும்? எனவே 'படிக்கப்பட்ட புத்தகம்' என்று கூறுவதுதானே சரியாக இருக்கும்?
உண்மையில் நண்பரின் ஐயம் மிகச் சரியானதுதான். ஆனால் உண்மையில் பிரச்சினை என்ன?
1) 'படித்த பையன்' என்னும் தொடரின் தாய்த் தொடர் ' பையன் படித்தான்' என்பது ஆகும். இங்குப் 'பையன்' என்னும் பெயருக்கும் 'படித்தான் ' என்னும் வினைமுற்றுக்கும் இடையிலான உறவு 'எழுவாய் - வினைமுற்று' உறவாகும். முற்றுத்தொடரானது பின்னர் 'படித்த பையன் ' என்னும் பெயர்த்தொடராக மாறி அமைகிறது. இவ்வாறு மாறி அமைந்தபோதிலும் 'பையன்' என்பதற்கும் 'படித்தான்' என்பதற்கும் இடையில் உள்ள வேற்றுமை உறவு மாறவில்லை. அதாவது முற்றுத்தொடரில் பெயருக்கும் வினைக்கும் இடையில் என்ன வேற்றுமை உறவோ அந்த உறவே இங்கும் தொடர்கிறது.
2) 'பையன் புத்தகம் படித்தான்' என்னும் தொடரில் 'பையன் - படித்தான்' உறவு எழுவாய் - வினை உறவு. ஆனால் 'புத்தகம் - படித்தான்' உறவு செயப்படுபொருள் - வினை' உறவு. இரண்டாம் வேற்றுமை உறவு. இந்த முற்றுத்தொடரானது 'பையன் படித்த புத்தகம்' என்னும் பெயர்த்தொடராக மாறி அமையும்போதும், 'புத்தகம்- வினை' உறவு இரண்டாம் வேற்றுமை உறவுதான். செயப்படுபொருளை முன்னிறுத்தும் தொடர். அவ்வளவுதான்! 'பையன்' என்பதைக் கூறாமல் இருக்கலாம்.
3) 'பையன் இந்தப் பள்ளிக்கூடத்தில் படித்தான்' என்னும் தொடரில் 'பள்ளிக்கூடம் - படித்தான்' உறவு இடவேற்றுமை உறவு; ஏழாம் வேற்றுமை உறவு. இந்த முற்றுத்தொடரானது 'பையன் படித்த பள்ளிக்கூடம்' என்னும் பெயர்த்தொடராக மாறி அமையும்போதும் . 'பள்ளிக்கூடம் - படி' உறவு ஏழாம் வேற்றுமை உறவுதான். இடப்பொருளை முன்னிறுத்தும் தொடர். அவ்வளவுதான்! 'பையன்' என்பதைக் கூறாமல் இருக்கலாம்.
மேற்கூறியவற்றின் அடிப்படைக் கருத்து . . . ஒரு முற்றுத்தொடரில் அமைகிற பெயர்ச்சொற்களுக்கும் வினைக்கும் என்ன வேற்றுமை உறவுகள் நீடிக்கிறதோ, அதே வேற்றுமை உறவுகளைத்தான் பெயரெச்சத்தோடு அமைகிற - பெயரெச்சத்தை அடுத்து அமைகிற - பெயர்ச்சொற்களும் கொள்கின்றன. புறத்தோற்றத்தில் பார்ப்பதற்கு மேற்கூறப்பட்ட 'புத்தகம்' 'பள்ளிக்கூடம்' ஆகியவைதான் 'படித்த' என்பதின் எழுவாய்போலத் தோன்றலாம். ஆனால் உண்மையில் நீடிக்கிற வேற்றுமை உறவுகளை உணர்வதற்கு முற்றுத்தொடரை மனதில் கொள்ளவேண்டும். தமிழைத் தாய்மொழியாகக் கொண்டவர்களுக்கு இதில் சிக்கல் ஏற்படாது. எனவே, 'படித்த புத்தகம்' என்று கூறுவதில் எவ்விதத் தவறும் இல்லை.
'இந்தப் புத்தகம் (பையனால்) படிக்கப்பட்டது' என்று அமையும் முற்றுத்தொடரிலிருந்து '(பையனால்) படிக்கப்பட்ட புத்தகம்' என்னும் பெயர்த்தொடர் அமையலாம். எனவே, பெயரெச்சங்கள் ('படித்த') பெயர்ச்சொற்களுக்குமுன்னால் ('பையன்' 'புத்தகம்' 'பள்ளிக்கூடம்' ) அமைந்து பெயர்த்தொடர்களாக மாறுகின்றன. இந்தப் பெயர்த்தொடர்கள் முழு வாக்கியங்களிலிருந்துதான் உருவாகின்றன என்பதைக் கருத்தில் கொள்ளவேண்டும். குறிப்பிட்ட வாக்கியங்களில் குறிப்பிட்ட பெயர்ச்சொற்கள் எந்த வேற்றுமை உறவுகளைப் பெற்றிருக்கின்றனவோ, அதே வேற்றுமை உறவுகள்தான் மேற்காட்டிய பெயர்த்தொடர்களிலும் அமைகின்றன. வெறும் பெயரெச்சதைமட்டும் கருத்தில்கொண்டு பார்த்தால் மயக்கம் இருக்கும். இதுபற்றிப் பேரா. ச. அகத்தியலிங்கம் அவர்கள் தமது ' தமிழ் மொழி அமைப்பியல்' நூலில் (பக்கங்கள் 216-218) மிகத் தெளிவாக விளக்கியுள்ளார்.
இந்த விளக்கத்திற்கு அடிப்படை, அவரது மாற்றிலக்கண மொழியியல் அறிவுப் பின்னணிதான் என்பதையும் இவ்விடத்தில் சுட்டிக்காட்டுகிறேன். அதாவது, பெயரெச்சத்தைக் கொண்ட ஒரு பெயர்த்தொடர் புறவய அமைப்புதான்; அதனுடைய புதை அமைப்பு ஒரு முற்றுத்தொடர்தான் என்பதாகும். குறிப்பிட்ட முற்றுத்தொடர் (புதை அமைப்பு) குறிப்பிட்ட மாற்றிலக்கண விதிகளின் உதவியால் குறிப்பிட்ட பெயர்த்தொடராக மாறி அமைகிறது.
இந்தப் பதிவின் அடிப்படை நோக்கம் . . . பெயரெச்சத்துக்கும் அதுகொண்டு முடியும் பெயருக்கும் இடையில் பலவேறு இலக்கணத் தொடர்புகள் இருக்கின்றன என்பதைச் சுட்டிக்காட்டுவதே ஆகும்.
மேலும் சில எடுத்துக்காட்டுகளை அவர் கூறியுள்ளார்.
'துவைத்த பையன்' (எழுவாய்)
'துவைத்த துணி' (ஐ வேற்றுமை)
'துவைத்த சோப்புய (ஆல் வேற்றுமை)
'துவைத்த கூலி' (கு வேற்றுமை)
'துவைத்த கல்' (இல் வேற்றுமை)\
'துவைத்த வேகம்' (வினையடை)
'துவைத்த நேரம்'( காலம்)
'துவைத்த முறை (வினையடை)
'துவைத்த துவைப்பு' (வினை)
மைசூர் இந்திய மொழிகள் நடுவண் நிறுவனத்தின் பேராசிரியராகவும் செம்மொழித் தமிழாய்வு நடுவண் நிறுவனத்தின் இயக்குநராகவும் பணியாற்றி ஓய்வுபெற்ற பேராசிரியர் க. இராமசாமி அவர்கள் அண்ணாமலைப் பல்கலைக்கழக மொழியியல்துறையில் 'தமிழ்ப் பெயரெச்சம்' என்னும் மாற்றிலக்கண மொழியியல் அடிப்படையிலான முனைவர் பட்ட ஆய்வை மேற்கொண்டார் என்பதையும் இங்குக் குறிப்பிட விரும்புகிறேன்.
தமிழ் இலக்கணத்தைத் தற்கால மொழியியல் நோக்கில் ஆய்வுசெய்யும்போது பல தெளிவான விளக்கங்கள் கிடைக்கின்றன. தமிழ் இலக்கணம், மொழியியல் - இவ்விரண்டின் பின்னணியில் தமிழ்மொழியை ஆராய்ந்தால் பல புதிர்களுக்கு விடை கிடைக்கும். இவ்விரண்டு துறைகளின் அறிவும் மாணவர்களுக்குத் தேவை.

தமிழின் தொகை இலக்கண விதிகளைப் புறக்கணிக்கலாமா?

தமிழின் தொகை இலக்கண விதிகளைப் புறக்கணிக்கலாமா?
(தமிழ் மாணவர்கள் - ஆய்வாளர்கள் கவனத்திற்கு.)
---------------------------------------------------------------------------------------------------------
ஒரு தொடரில் தொகைச் சொற்களைப் பிரித்து எழுதும்போது தவறாமல் ஒற்று இட்டு எழுதவேண்டும். அப்போதுதான் இரண்டு சொற்களும் இணைந்து தொகையாக வருகிறது என்பது தெரியவரும். இல்லையென்றால் பொருள் குழப்பம் ஏற்படும். கணினிவழித் தமிழுக்கு நாங்கள் எடுத்துவரும் முயற்சியில் இதுதான் ஒரு பெரிய சிக்கல்.
கணினியானது தமிழைப் புரிந்துகொள்ள வேண்டுமென்றால், அதற்குச் சிக்கல் இல்லாமல் நாம் எழுதவேண்டும். நமது மூளையின் மொழித்திறனும் பேசுகிற அல்லது எழுதப்படுகிற சூழலும் நமக்கு ஐயம் ஏற்பட்டாலும் தீர்த்துக்கொள்ள உதவுகிறது. ஆனால் கணினி பாவம்! அதற்கு அந்த உதவி கிடைக்காது. எனவே, தேவை இல்லாமல் அதைத் துன்புறுத்தக்கூடாது.
'பால் குடத்தில் இருக்கிறது' - 'நான் பால் குடம் எடுக்கப்போகிறேன்'.
இவற்றில் அமைகிற வினைமுற்றுகளில் உள்ள திணை எண் பால் விகுதி, எது எழுவாய் என்பதை நமக்குத் தெரியப்படுத்துகிறது. இரண்டாவது தொடரில் 'பால் குடம்' என்பதை 'அண்ணன் தம்பி ' போன்று உம்மைத் தொகையாகவும் கருதலாம் அல்லவா? 'நான் பாலும் குடமும் எடுக்கப்போகிறேன்' என்று இரண்டாவது தொடருக்குப் பொருள் கொள்ளலாம் அல்லவா? அவ்வாறு இல்லாமல் 'பாற்குடம் எடுக்கப்போகிறேன்' அல்லது 'பாற் குடம் எடுக்கப்போகிறேன்' என்று எழுதலாம் அல்லவா? சொல்லிறுதியில் 'ற்' வல்லினம் வராதே என்று நினைக்கலாம். புறச்சந்தியில் சொல் இறுதியில் வல்லினம் வரலாமே. 'க், ச். த், ப்' ஆகிய வல்லினங்கள் சந்தியில் நிலைமொழி இறுதியில் வரும்போது 'ற்' என்னும் வல்லினமும் வரலாமே!
ஆகவே, என் கருத்து, சந்தி உட்பட அனைத்து இலக்கண விதிகளும் நமக்குப் பொருள் மயக்கத்தைத் தவிர்த்து, தெளிவாக ஒரு தொடரைப் புரிந்துகொள்ளப் பயன்படுகிற உத்திகள்தான்! இலக்கண விதிகள் என்று கூறும்போது அவை தொல்காப்பியம், நன்னூல் இலக்கண விதிகள்மட்டுமே என்று கருதிவிடக்கூடாது. இன்றைய எழுத்துத்தமிழில் புதிதாகத் தோன்றி நிலவுகிற இலக்கண விதிகளையும் உள்ளடக்கியதுதான் இன்றைய தமிழ் இலக்கணம்!

வேற்றுமைத்தொகையில் ஒற்று மிகும்! தொகைச்சொற்கள் ஒரு சொல் நீர்மை உடையவை!

 வேற்றுமைத்தொகையில் ஒற்று மிகும்!

தொகைச்சொற்கள் ஒரு சொல் நீர்மை உடையவை!
(தமிழ் மாணவர்கள் - ஆய்வாளர்கள் கவனத்திற்கு.)
-----------------------------------------------------------------------------------------------------------
வேறொரு பதிவில் நான் இட்ட ஒரு பின்னூட்டம் இது!
'இந்த அச்சு பிழையின்றி இருக்கிறது' என்பதில் 'அச்சு' என்பது எழுவாய்த்தொடரின் பகுதியாக இருக்கிறது.
ஆனால் 'இந்த அச்சுப்பிழை ஏற்கத் தக்கதன்று ' என்பதிலும் 'அச்சுப்பிழை' என்பது எழுவாய்த்தொடரின் பகுதியாகவே நீடிக்கிறது.
எழுவாயில் தனிப்பெயர்ச்சொல்லும் அமையலாம்; தொகைச்சொல்லும் அமையலாம் அல்லவா?
அதுபோன்றே இரண்டாவது எடுத்துக்காட்டிலும் 'அணி' 'அணித்தலைவர்' இரண்டுமே எழுவாய்தொடர்களின் பகுதிகள்தான்!
இங்குச் சிக்கல், 'அச்சுப்பிழை' என்பதும் 'அணித்தலைவர்' என்பதும் இரண்டுமே தொகைச்சொற்கள் என்பதை உணர்ந்து, தேவையான ஒற்று இடவேண்டும். தொகைச்சொற்களைப் பிரித்து எழுதாமல் சேர்த்து எழுதினால் சிக்கல் இல்லை. மேலும் தொகை என்பதைச் சுட்டிக்காட்டவே ஒற்று இடையில் அமைகிறது.
ஆனால் இன்று நடைமுறைத் தமிழில் பலர் 'அச்சுப் பிழை' என்று பிரித்தே எழுதுகிறார்கள். தமிழில் தொகைச்சொற்களை இவ்வாறுதான் எழுதவேண்டுமென்ற தரப்படுத்தப் பணி இல்லை. இப்படித்தான் எழுதவேண்டுமென்று நாம் கூறினால், அதைத் திணிப்பு என்று கூறுவார்கள்.
இச்சூழலில் தொகை என்பதைத் தெரியப்படுத்த அமைகிற 'ஒற்றைப்' பயன்படுத்தினால், பிரித்து எழுதினாலும் அது தொகையே என்று நாம் தெரிந்துகொள்ளலாம். ஒற்று இல்லையென்றால் இதற்கும் தனிச்சொல்லுக்கும் இடையில் நீடிக்கும் வேறுபாடு தெரியாமல் இல்லாமல் போய்விடும். பொருண்மையும் தவறாகப் புரிந்துகொள்ளப்படலாம்.
தொகையில் நிலைமொழிச்சொல்லுக்கும் வருமொழிச்சொல்லுக்கும் இடையில் ஒரு தொடரியல் உறவு - வேற்றுமை உறவு - நீடிக்கிறது. ஒரு தொடரே - 'அச்சால் விளைந்த பிழை' அல்லது ' அச்சில் உள்ள பிழை' என்பதே 'அச்சுப்பிழை' என்று மாற்றமடைகிறது. 'உருபும் பயனும் உடன்தொக்க தொகை' என்று இலக்கண ஆசிரியர்கள் இதை விளக்குகிறார்கள். ஆகவேதான், தொகையைத் 'தொகைநிலைத்தொடர்' என்றும் சிலர் அழைக்கின்றனர்.
தொடரிலிருந்து வந்தாலும் , தொடரியல் உறவு மறைந்து, ஒருசொல் நீர்மை பெறுவதால் இதைச் சொல்நிலையிலேயே வைத்துப்பார்க்கலாம்.
தொகைச்சொற்கள் ஒருசொல் நீர்மை உடையவை என்பதை விளக்கக் கீழ்க்கண்ட எடுத்துக்காட்டுகளைக் கொடுக்கலாம்.
'இந்த அச்சு பிழையின்றி இருக்கிறது' --> இது பிழையின்றி இருக்கிறது'
'இந்த அச்சுப்பிழை ஏற்கத்தக்கதன்று --> இது ஏற்கத்தக்கதன்று'
மேற்காட்டிய தொடர்களில் 'இந்த அச்சு' என்பதும்' இந்த அச்சுப்பிழை' என்பதும் இரண்டுமே 'இது' என்னும் ஒரு சொல்லால் பதிலிடு செய்யமுடியும்.
அதுபோன்று, 'எங்கள் அணி தலைவர் இல்லாதது' --> இது தலைவர் இல்லாதது'.
'எங்கள் அணித்தலைவர் திறமையானவர்' --> இவர் திறமையானவர்'
அதாவது ஒரு தொகைச்சொல்லுக்குப் பதிலீடாக 'இது' 'இவர்' என்னும் தனிச்சொற்களை இடமுடியும். (சுட்டுப்பெயர்கள் பொதுவாகத் தனிச்சொல்லாக மட்டும் இல்லாமல், ஒரு தொகை அல்லது ஒரு தொடருக்கே மாற்றாக அமையமுடியும்.)
'அவர் நேற்று நன்றாகப் பேசினார்' ஒரு முழுத்தொடர் அல்லது வாக்கியம். இதற்கு வேறு ஒரு அமைப்பில் 'இது' என்பது பதிலிடுவாக அமையலாம்.
'அவர் நேற்று நன்றாகப் பேசினார்; அது எனக்கு மிகவும் பிடித்திருந்தது'
இங்கு இரண்டாவது வாக்கியத்தில் அமைந்துள்ள 'அது' என்பது முதல் வாக்கியம் முழுமைக்கும் பதிலாக இரண்டாவது வாக்கியத்தில் அமைகிறது.
(இந்தப் பின்னூட்டத்தில் போதிய விளக்கம் இல்லையென்றாலோ அல்லது பிழைகள் தென்பட்டாலோ சுட்டிக்காட்டினால் நன்றி உடையவனாக இருப்பேன்.)

தொகை (நிலைத் தொடர்) - தொகாநிலைத் தொடர் - சந்திச் சிக்கல்.

 தொகை (நிலைத் தொடர்) - தொகாநிலைத் தொடர் - சந்திச் சிக்கல்.

1. அச்சு பிழை
2. அஞசல்வழி கல்வி
3. அணி தலைவர்
4. அரசு கல்லூரி
5. வரி தள்ளுபடி
மேற்கண்டவற்றில் ஒற்று மிகுமா மிகாதா?
மிகும் - மிகாது ! ஆமாம் இரண்டுமே சரிதான்! இது என்ன குழப்பம்?
பொதுவாக, நாம் நம்முடைய பேச்சையும் செயலையும் இடத்திற்குத் தகுந்தமாதிரி மாற்றிக் கொள்கிறோம் அல்லவா?
ஒரு குறிப்பிட்ட சூழலில் நாம் பேசுவதும் மாறுபட்ட மற்றொரு சூழலில் நாம் பேசுவதும் மாறுபடுகின்றன அல்லவா? அதுபோல்தான் இந்த ஒற்று மிகுதல் - மிகாமையும் ஆகும்.
1.1. [இந்த அச்சு] [பிழை இல்லாமல் இருக்கிறது]
1.2. [அச்சுப் பிழைகளே] [இந்த நூலில் இல்லை.]
2.1. [எங்கள் அணி] [தலைவர் இன்றித் திண்டாடுகிறது.]
2.2. [எங்கள் அணித் தலைவர்] [மிகத் திறமை
வாய்ந்தவர் ]
3.1. [தமிழ்நாடு அரசு] [கல்லூரிகளுக்கு அதிக நிதி
ஒதுக்கியுள்ளது.]
3.2. [புதிய ஆசிரியர் நியமனம்] [அரசுக் கல்லூரிகளுக்கு
நடைபெற்றுவருகிறது.]
4.1. [சில பொருள்களின் வரி] [தள்ளுபடிக்கு
உட்பட்டது.]
4.2. [தமிழ் மென்பொருள்கள்] [வரித் தள்ளுபடிக்கு
உட்பட்டவை இல்லை.]
1.1. - இல் 'அச்சு' 'பிழைகள்' இரண்டுமே வெவ்வேறு தொடர்களில் - ஒன்று எழுவாய்த்தொடர், மற்றொன்று பயனிலைத் தொடர் - அமைந்துள்ளன.
1.2. - இல் 'அச்சு' 'பிழைகளே' இரண்டுமே ஒரே தொடரில்
அமைந்துள்ளன. ஒரே தொடருக்குள் வேற்றுமை உறவு நீடிக்கிறது. 'அச்சின் பிழைகள்' என்பதே அத்தொடரின் பொருண்மை.
1.1. தொகாநிலைத் தொடர் என்று அழைக்கப்படுகிறது.
1.2. தொகை (நிலைத்தொடர்) என்று அழைக்கப்படுகிறது.
எனவே, குறிப்பிட்ட இரண்டு சொற்களுக்கு இடையில் உள்ள தொடரியல் உறவே இந்த எடுத்துக்காட்டுகளில் ஒற்று வருவதற்கும் வராததற்கும் அடிப்படைக் காரணமாகும்.
நம்முடைய பொது அறிவும் பேசும் சூழலும் குறிப்பிட்ட சொற்களுக்கு முந்தைய பிந்தைய சொற்களும் நமக்கு ஐயமில்லாமல் பொருண்மையைப் புரிந்துகொள்ள உதவுகின்றன.
ஆனால் தமிழ் எழுத்துரைப் பயிற்சி இல்லாதவர்களுக்கு எழுதும்போது இதில் சிக்கல் ஏற்படுகிறது. இரண்டு சொற்களும் பெயர்ச்சொற்கள்தானே என்று நினைக்கலாம். பெயர்ச்சொற்கள் என்பது சொல் வகைப்பாடு. ஆனால் இங்கே சொல்வகைப்பாடு தாண்டி, தொடரியல் வகைப்பாடு - தொகைநிலைத்தொடரா, தொகாநிலைத்தொடரா என்னும் வகைப்பாடு - தேவைப்படுகிறது. வருமொழி முதலில் வல்லினம் வருகிறதா, எந்த வல்லினம் வருகிறது என்னும் எழுத்தியல் அறிவும் தேவைப்படுகிறது.
கணினிக்குத் தற்போது இதுதான் பிரச்சினை! கணினி எப்படி இந்த அறிவைப் பெற்றுக்கொள்ளும்?
ஒரு வழி , மொழியியல் (Linguistics) துணைகொண்டு, தமிழ்த் தொடரியல் ஆய்வின் (Syntactic analysis) அடிப்படையில் இந்த இலக்கண அறிவைக் (Linguistic / grammatical knowledge) கணினிக்குக் கொடுக்கலாம். இந்த அறிவில் எழுத்தியல் (Phonology) , சொல்லியல் (Morphology) அறிவைத் தாண்டி, தொடரியல் அறிவும் (Syntax) தேவைப்படுகிறது. [சில தொடர்களில் பொருண்மையியல் அறிவும் (Semantics) தேவைப்படலாம் (பழம் + கூடை --> பழக்கூடை / பழங்கூடை ]. இதுவே அண்மைக் காலம்வரை கணினிமொழியியல் துறையின் (Computational Linguistics) பணியாக அமைந்திருந்தது.
தற்போது ஒரு குறிப்பிட்ட சிக்கலுக்கு , அச்சிக்கல் தோன்றுகிற ஆயிரக்கணக்கான தொடர்களைக் (Dataset) கொடுத்து, அதன்மூலம் கணினியைப் பயிற்றுவித்து (Pre-training) இந்த அறிவைப் பெற்றுக்கொள்ள வைக்கும் தொழில்நுட்பம் தோன்றி நிலவுகிறது. தொகைநிலைத் தொடர்களுக்கு ஆயிரக்கணக்கான வேறுபட்ட எடுத்துக்காட்டுகளும் தொகாநிலைத் தொடர்களுக்கு ஆயிரக்கணக்கான எடுத்துக்காட்டுகளும் கொடுத்தால், பெரும்மொழிமாதிரி (Large Language Model - LLM) இந்த அறிவைப் பெற்றுக்கொள்ளும் என்று எதிர்பார்க்கப்படுகிறது.
தற்போது எங்களுடைய 'மென்தமிழ்' சந்தித் திருத்தியில் பயனர்களிடம் இந்த வினாவை - குறிப்பிட்ட சொற்கள் தொகைநிலைத்தொடராக அமைகின்றனவா, தொகாநிலைத்தொடராக அமைகின்றனவா - கேட்கிறோம். அதைப்பொறுத்து மென்பொருள் ஒற்று இடும். ஆனால் இதை எல்லோராலும் செய்யமுடியாது.
அவ்வாறு இல்லாமல் செய்யறிவுத்திறனின் (Artificial Intelligence - AI) பெரும்மொழிமாதிரி (LLM) அடிப்படையில் மென்பொருளின் சந்தித்திருத்தி தானே இந்த ஐயங்களைத் தீர்த்துக்கொள்ளப் பயனர்களுக்கு உதவ வேண்டும். இது ஒரு எளிமையான பணி இல்லை! ஆனாலும் முயல்வோம்!
மேற்கூறிய கருத்துகளில் தவறோ அல்லது குழப்பமோ இருக்கலாம். இருந்தால் சுட்டிக்காட்டவும். திருத்திக்கொள்ளலாம்!

தமிழில் வினைகளிலிருந்து ஆக்கப்பெயர்கள் உருவாக்கத்தில் ஒரு வியக்கத்தக்க ஒழுங்கமைவு

 தமிழில் வினைகளிலிருந்து ஆக்கப்பெயர்கள் உருவாக்கத்தில் ஒரு வியக்கத்தக்க ஒழுங்கமைவு (முகநூலின் வேறு ஒரு பதிவில் நான் இட்ட பின்னூட்டம் இது.)

---------------------------------------------------------------------------------------------------------------------------
தமிழில் கால விகுதிகள் அடிப்படையில் வினைச்சொற்கள் வகைப்படுத்துகிறார்கள். இந்த வகைப்பாட்டில் வேறுபாடுகள் இருக்கலாம். நான் தமிழ் லெக்சிகனில் கொடுக்கப்பட்டுள்ள 12 வகைப்பாடுகள் அடிப்படையில் கீழ்க்கண்ட ஒழுங்கைப் பார்க்கிறேன்.
வினையிலிருந்து பெயர்கள் (ஆக்கப்பெயர்கள்) உருவாகும்போது, ஆக்கவிகுதிகளாக (-வு, -ப்பு . -ச்சி போன்றவை) எது அமையவேண்டும் என்பதைத் தீர்மானிப்பதில் வினைகளின் கால வகைப்பாடு ஒரு முக்கியமான பங்கைப் பெற்றுள்ளது. ஒரு சில எடுத்துக்காட்டுகளைக் கீழே அளிக்கிறேன். இது விவாதத்திற்கு உரியதுதான்!
4, 11 ஆவது ('அசை' என்னும் வினை 4, 11 இரண்டிலும் வரும். அசைகிறேன், அசைந்தேன், அசைவேன் ; அசைக்கிறேன், அசைத்தேன், அசைப்பேன்) அசை - அசைவு , அசைப்பு ; அமை - அமைவு , அமைப்பு ; அழி - அழிவு, அழிப்பு; இணை - இணைவு, இணைப்பு; ஒழி - ஒழிவு, ஒழிப்பு
(செய்வினை- செயப்பாட்டு வினை, தன்வினை - பிறவினை போன்ற பண்புக்கூறுகளுக்கும் இங்கு இடம் உண்டு. 4-ஆவது வகைப்பாட்டில் அடங்குகிற வினைகள் செயப்படுபொருளை எடுக்காது' 11 ஆவது வகைப்பாட்டில் அடங்குகிற வினைகள் செயப்படுபொருளை எடுக்கும்)
11-ஆவது காலவகைப்பாடான -க்கிறு - த்த்- ப்ப் என்பதிலும் 12 -ஆவது காலவகைப்பாடான -க்கிறு-ந்த்-ப்ப் என்பதிலும் அடங்குகிற வினைகள் பொதுவாக -ப்பு எடுக்கிறது.
11 ஆவது : அணிவி (அணிவிப்பு), அலங்கரி (அலங்கரிப்பு), அவமதி (அவமதிப்பு), அழை (அழைப்பு), இரட்சி (இரட்சிப்பு), இளை (இளைப்பு).
12 ஆவது : கச (கசப்பு), கல (கலப்பு), கற (கறப்பு), இழ (இழப்பு), சிற (சிறப்பு), பிற (பிறப்பு)
பொதுவாக ஆக்கப்பெயர்களின் உருவாக்கத்தில் ஒழுங்கு இருப்பது கடினம். ஆனால் தமிழ் வினைகளிலிருந்து ஆக்கப்பெயர்கள் உருவாகும்போது, குறிப்பிட்ட வினையின் கால வகைப்பாடு ஆக்கப்பெயர் உருவாக்கத்தில் ஒரு ஒழுங்கைத் தருவதாக இருக்கிறது. அதாவது ஒரு வினையின் கால வகைப்பாட்டுக்கும் அந்த வினையிலிருந்து பிறக்கிற ஆக்கப்பெயர்களுக்கும் இடையில் ஒரு நெருங்கிய தொடர்பு இருக்கிறது.

'முயல் - முயற்சி ! 'முயல்கிறான் - முயற்சிக்கிறான்' எது சரி?

 'முயல் - முயற்சி ! 'முயல்கிறான் - முயற்சிக்கிறான்' எது சரி?

------------------------------------------------------------------------
முயல் ---> முயற்சி; வீழ் --> வீழ்ச்சி ; தளர் --> தளர்ச்சி. இவ்வாறு வினையடிகள் -சி, ச்சி ஆகிய பெயராக்க விகுதிகளை இணைத்துக்கொண்டு பெயர்களாக மாறி அமைகின்றன. 'போரில் வீழ்ந்தான்' அல்லது 'போரில் வீழ்ச்சி அடைந்தான்' என்று கூறலாம். 'நோயால் தளர்ந்தான்' அல்லது 'நோயால் தளர்ச்சி அடைந்தான்' . அதுபோன்று 'நான் வெற்றிபெற முயன்றேன்' அல்லது 'நான் வெற்றிபெற முயற்சி செய்தேன்' என்று கூறலாம். இது இன்றைய தமிழில் பரவலாகப் பயன்படுத்தப்படுகிறது.
ஆனால் 'வீழ்ச்சித்தேன்' 'வீழ்ச்சிகிறேன்' 'வீழ்ச்சிப்பேன்' என்று கூறுவதோ, 'தளர்ச்சித்தேன்' 'தளர்ச்சிகிறேன்' 'தளர்ச்சிப்பேன்' என்றோ யாரும் கூறமாட்டார்கள். அதுபோன்று 'முயற்சி செய்தேன்' என்று கூறலாம்' ஆனால் முயற்சித்தேன், முயற்சிக்கிறேன், முயற்சிப்பேன் என்று அமைவது பொது விதிக்குக் கட்டுப்பட்டு இல்லை. தவறுதான் என்று தெளிவாகக் கூறலாம்.
ஆனால் 'முயற்சித்தேன்' 'முயற்சிக்கிறேன்' 'முயற்சிப்பேன்' என்பதும் இப்போது பயன்படுத்துகின்றன என்பது உண்மை.
ஆனால் அவர்களே 'வீழ்ச்சித்தேன், வீழ்ச்சிக்கிறேன், வீழ்ச்சிப்பேன்' என்றோ அல்லது 'தளர்ச்சித்தேன், தளர்ச்சிக்கிறேன், தளர்ச்சிப்பேன்' என்றோ கூறுவது கிடையாது. ஏன் 'முயற்சி' மட்டும் வினையடியாகப் பயன்படுத்தப்படுகிறது ? இது ஆராயப்படவேண்டிய ஒன்று. 'முயல்கிறேன்' என்பதை 'முயற்சி செய்கிறேன்' என்றும் 'முயன்றேன்' என்பதை ' முயற்சி செய்தேன்' என்றோ 'முயல்வேன்' என்பதை 'முயற்சி செய்வேன் ' என்று கூறுவதில் தவறு இல்லை என நான் கருதுகிறேன்.
(முயற்சி என்பது வினைதான் என்ற நிலை எடுப்பவர்கள் முயற்சித்தான் , முயற்சிக்கிறான், முயற்சிப்பான் என்று கூறும்போது அவற்றைப் பின்வருமாறுதான் பிரிக்கவேண்டியுள்ளது - முயற்சி + த்த் + ஆன்; முயற்சி + க்கிறு + ஆன்; முயற்சி + ப்ப் + ஆன்)
--------------------------------------------------------------------
'விஷமருந்து' - அவன் விஷமருந்தினான்'
- அது விஷமருந்து'
இதுபோன்று சில சொற்கள் வினை, தொகை ஆகிய இரண்டு வகைப்பாடுகளுக்கும் உட்படுகின்றன. இதுபோன்று ஏராளமான சொற்கள் தமிழில் இருப்பதால், இவற்றில் உள்ள பொருண்மை மயக்கத்தைத் தவிர்க்க முன், பின் சொற்களை மனதில் கொள்ளவேண்டியுள்ளது. இதுவே கணினிக்கும் உள்ள சிக்கல். தற்போது செய்யறிவுத்திறனின் பெரும்மொழிமாதிரியில் தரவுகளின் அடிப்படையில் பெருமளவு தீர்க்கப்படுகிறது. அதுவும் குறிப்பாக , தொகையா, தொகை இல்லையா என்பதைப் பொறுத்து ஒற்று அமைவதால், கணினிக்குப் பெரிய சிக்கல் இது.

அரசியலில் "B " Team . . . " B' டீம்களுக்குள்ளேயே 'B' டீம்கள் !

 அரசியலில் "B " Team . . . " B' டீம்களுக்குள்ளேயே 'B' டீம்கள் !

------------------------------------------------------------------------
தற்போதைய தேர்தல் அரசியலில் . . . 'பி' டீம் என்னும் ஒரு 'கலைச்சொல்' பரவலாக உலா வந்துகொண்டு இருக்கிறது. அதாவது ஒரு பெரிய அரசியல் அல்லது ஆளும் கட்சியில் நேரடியாக இயங்காமல், மறைமுகமாக இருந்துகொண்டு, அந்தப் பெரிய கட்சிக்குத் தேவையானவற்றைச் செய்துகொடுப்பவைதான் 'பி' டீம்கள் என்று அழைக்கப்படுகின்றன.
ஒரு நிர்வாகம் - அது ஒரு அரசாங்கமாகவோ அல்லது நிறுவனமாகவோ அல்லது ஒரு பெரிய தனிநபராகக் கூட இருக்கலாம்- தன் நலன்களைப் பாதுகாத்துக்கொள்ள வெளிப்படையான ஒரு அமைப்பை வைத்திருக்கும். இருந்தாலும் அந்த அமைப்பை மட்டும் நம்பியிருக்கமுடியாது, ஏனென்றால் அதில் எதிரியின் உளவாளிகள் இருக்கலாம் என்று கருதும் நிர்வாகம், நீடிக்கிற அந்த அமைப்புக்குத் தெரியாமல் மற்றொரு அமைப்பை உருவாக்கும். இதுதான் 'பி' டீம்!
பாஜகாவுக்கு இவர் இவர் . .. . அந்த இந்தக் கட்சிகள் 'பி' டீம்! அதுபோல, காங்கிரசுக்கு, திமுக வுக்கு, அதிமுக வுக்கும் இவர், இவர் அல்லது இந்த இந்தக் கட்சிகள் 'பி' டீம் , என்று நாள்தோறும் ஒவ்வொரு கட்சியும் மற்ற கட்சிகளைப் பற்றிக் கூறுவதும், அல்லது ஒரு கட்சியிலிருந்து வெளியேற்றப்படுகிறவரை மற்றொரு கட்சியின் 'பி' டீம் என்று குற்றம் சாட்டுவதும் நாள்தோறும் நடைபெறுகிறது.
அதெல்லாம் சரி . . . ஆனால் இந்த கட்சிகள் எல்லாமுமே . . . யாருடைய 'பி' டீம் என்று ஆய்வு செய்துபாருங்கள்! பன்னாட்டு நிறுவனங்களின் ஏகபோக நிறுவனங்களின் 'பி' டீம் இங்குள்ள டாடா, பிர்லா, அதானி, அம்பானி போன்றோர்.
பன்னாட்டு நிறுவனங்களும் அவற்றின் நலன்களுக்காக நீடிக்கிற அமெரிக்க, ரசிய, சீன அரசுகளும் தங்களுடைய 'மூலதனத்தை' இந்தியாவில் முதலீடு செய்து, இந்திய மக்களைச் சுரண்டும்போது, அவர்களின் தரகர்களாக இங்கு விளங்குகிற டாடா, பிர்லா, அம்பானி, அதானிகளைமட்டும் நம்பி இருக்கமுடியாது அல்லவா? எனவே, இங்குள்ள தேர்தல் அரசியல்கட்சிகளைத் தங்களுக்கான 'பி' டீமாக வைத்திருக்கிறார்கள்.
மேலும் ஒரு கட்சியைமட்டும் நம்பி இருக்கமுடியுமா? எனவேதான் அவ்வப்போது, மக்களின் உணர்வு நிலைக்கு ஏற்ப புதுப் புதுக் கட்சிகளையும் தலைவர்களையும் அரசியலில் 'இறக்குமதி' செய்கிறார்கள்( ஆங்கிலேய ஏகாதிபத்தியத்திற்கு எதிரான இந்திய மக்களின் போராட்டங்களின்போதும் ஆங்கிலேயர்களால் இந்தியாவில் பல 'தலைவர்கள்' இறக்குமதி செய்யப்பட்டு, போராட்டத்தைத் திசைதிருப்பிய வரலாறு உண்டு!) ! இந்த அரசியல் கட்சிகள் அனைத்துமே பன்னாட்டு நிறுவனங்களின் 'பி' டீம்தான்! எனவேதான் இன்று நடுவண் அரசாகட்டும், மாநில அரசுகளாகட்டும் பன்னாட்டு நிறுவனங்களுக்கு ' சிவப்புக் கம்பளம்' விரித்துவருகிறார்கள்! இதில் யார் அதிகமாக விரிக்கிறார்கள் என்னும் போட்டி வேறு!
உழைக்கும் மக்களைப் பொறுத்தமட்டில் இந்த அரசியல் கட்சிகள் எல்லாம் . . . அம்பானிக்கும் அதானிக்கும் அவர்களுடைய எசமானர்களான பன்னாட்டு நிறுவனங்களுக்கும் அவற்றின் அரசுகளுக்கும் 'பி' டீம்களே! இதை மக்கள் உணரவேண்டும்!
'பி' டீம்களுக்குள்ளேயே 'பி' டீம்கள் ! வேடிக்கையான அரசியல்தான்!

பெரும்மொழிமாதிரியின் (Large Language Model - LLM) அடிப்படையும் மொழியியலும் (Linguistics)

 பெரும்மொழிமாதிரியின் (Large Language Model - LLM) அடிப்படையும் மொழியியலும் (Linguistics) . . . (மொழி, மொழியியல் மாணவர்களுக்குப் பயன்படும் ஒரு பதிவு இது)

-------------------------------------------------------------------------
மொழியியலில் வேறுபட்ட பல கோட்பாடுகள் உண்டு. இதற்கு இரண்டு முக்கியக் காரணங்கள் உண்டு. முதலாவது குறிப்பிட்ட மொழியியல் கோட்பாட்டின் நோக்கம்.
(1) மாற்றிலக்கணக் கோட்பாட்டின் (குறிப்பாக, நோம் சாம்ஸ்கி ) நோக்கம், பிறந்த குழந்தை எவ்வாறு குறைந்த காலத்தில் ( மூன்று ஆண்டுகளுக்குள்), தாய்மொழி அறிவை (இலக்கணம், சொற்களஞ்சியம்) நிறைவாகப் பெற்றுக்கொள்கிறது? அதற்கு அடிப்படையான மொழித்திறன் குழந்தை பிறக்கும்போதே - மனிதமூளைக்குள் - அத்திறன் நீடிக்கிறதா (Innate) ? அவ்வாறு நீடித்தால் அத்திறனின் அடிப்படைக் கூறுகள் (''பொதுமை இலக்கணம்'' - Universal Grammar - UG) என்ன? அத்திறன் மனிதமூளைக்கே உரிய மரபணுப் பண்பு சார்ந்ததா? குழந்தை தனது வளர்ச்சியில் மொழியைக் ''கற்றுக்கொள்கிறதா (learning)''? அல்லது ''பெற்றுக்கொள்கிறதா (acquring) ''? குழந்தைக்குப் பிற திறன்கள் - தவழுதல், நடத்தல் போன்ற திறன்கள் - தாமாகவே ''வருவதுபோல (comes to) '' அல்லது ''வளர்வதுபோல'' மொழியும் 'வளர்கிறதா (develops) ?''
கணினிமொழியியலில் நீடிக்கிற ''நரம்பு வலைப்பின்னல் (Neural Network) " வழிமுறையானது கணினிக்கு இயற்கைமொழியின் அறிவைக் கொடுப்பதற்குத் தேவையான ''வழிமுறையை (algorithm / architecture)'' உருவாக்குவதாகும். அதனுடைய இன்றைய வளர்ச்சியே செய்யறிவுத்திறனில் கூறப்படுகிற ''ஆழ்நிலைக் கற்றல் (Deep Learning)'' ஆகும். இந்த ஆழ்நிலைக் கற்றல் வழிமுறையே தனக்குக் கொடுக்கப்படுகிற மொழித்தரவுகளைக் கொண்டு, ''தேவையான'' மொழி அறிவைக் கணினி பெற்றுக்கொள்கிறது. ஆனால் இந்த அறிவு குழந்தையின் மூளையில் இருக்கின்ற இலக்கண. சொற்களஞ்சிய அறிவு என்று கூறிவிடமுடியாது. வேறுபட்ட ஒன்றாகத்தான் அது அமைகிறது. இருப்பினும் மாற்றிலக்கண மொழியியலின் அடிப்படை இதற்கு உள்ளது. 'மனிதமூளையின்' உள்ளே உள்ள ''பொதுமை இலக்கணம்'' போன்ற ஒன்றைக் கணினிக்குக் கொடுக்க முயல்கிறது. இந்த உள்ளார்ந்த ' ஆழ்நிலை கற்றல் பொறி' எந்தவொரு குறிப்பட்ட மொழி சார்ந்ததும் இல்லை. எந்தவொரு மொழியின் தரவுகள் கிடைத்தாலும் அதைக்கொண்டு அம்மொழிக்கான திறனைப் பெற்றுக்கொள்ளும். (சாம்ஸ்கியின் 'பொதுமை இலக்கணமும்' இதுபோன்றதுதான். எந்தவொரு குறிப்பிட்ட மொழி சார்ந்ததும் இல்லை! )
(2) அடுத்து, இங்கிலாந்தைச் சேர்ந்த ஃபிர்த் (Firth), ஹாலிடே (Halliday), சிங்க்ளயர் (Sinclair) போன்றோர் முன்வைக்கிற மொழியியல் கோட்பாடு. இக்கோட்பாடு ஆங்கிலத்தில் "Systemic Grammar" என்று அழைக்கப்படுகிறது. ஒருவர் மற்றவர் பேச்சை அல்லது மொழியைப் புரிந்துகொள்வதில் மூன்று முக்கியக் கூறுகள் உண்டு. ஒன்று , 'குறிப்பட்ட தொடர் அல்லது வாக்கியம்("Text") ' ; இரண்டு, அத்தொடருக்கு அல்லது வாக்கியத்திற்கு முந்தைய, பிந்தைய தொடர்கள் அல்லது வாக்கியங்கள் (Co-text)' ; மூன்று, குறிப்பிட்ட தொடர் அல்லது வாக்கியம் முன்வைக்கப்படுகிற மொழிசாராக் கூறுகள்( Context).
இம்மூன்றின் உதவியினால்தான் ஒருவர் மற்றொருவர் முன்வைக்கின்ற தொடரை அல்லது வாக்கியங்களின் பொருண்மையைப் புரிந்துகொள்ளமுடிகிறது.
செய்யறிவுத்திறன் மென்பொருளில் அமைந்துள்ள 'மொழித்திறன்' என்பது குறிப்பிட்ட சொல் அல்லது தொடரின் முந்தைய , பிந்தைய சொற்கள், தொடர்கள், பத்திகள் ஆகியவற்றன் அடிப்படையில்தான் அமைகிறது. இதைத்தான் செய்யறிவுத்திறனில் 'சூழற் சாளரம் "(Context Window") என்று அழைக்கிறார்கள். ஆனால் மனித மூளைக்கும் செய்யறிவுத்திறனுக்கும் இடையில் உள்ள ஒரு அடிப்படை வேறுபாடு, மனித மூளைக்கு ஒரு தொடரின் முன்னால் அல்லது பின்னால் அமைகிற ஒரு சில சொற்கள் போதும். ஏனெனில் சூழல்சார் அறிவு (Pragmatic knowledge) துணை செய்கிறது. பேசப்படுகிற சூழலை அல்லது பேசப்படுகிற பொருளைப் புரிந்துகொள்ளும் திறன் (உலக அறிவு - Ontology ) மனித மூளைக்கு உள்ளது. இதில் டெல் ஹைம்ஸ் (Dell Hymes) என்பவரின் கருத்தாடல் திறன் (Communicative Competence) என்பதும் அடங்கும்.
ஆனால் இந்த அறிவு கணினிக்கு இல்லாததால், அதற்கு ஒரு சொல் அல்லது தொடருக்கு முந்தைய , பிந்தைய ஆயிரக்கணக்கான , லட்சக்கணக்கான சொற்கள் அல்லது தொடர்கள் தேவைப்படுகின்றன. எனவேதான் செய்யறிவுத்திறன் மென்பொருளில் அமைந்துள்ள பெரும்மொழிமாதிரியில் கோடியே கோடியே சொற்கள் இடம்பெறுகின்றன. இச்சொற்களின் எண்ணிக்கை மேலும் கூடக்கூட, அதன் 'மொழித்திறமும்' கூடும்.
ஆகவே, மொழியியலின் அடிப்படைகளே செய்யறிவுத்திறனில் அமைந்துள்ள பெரும்மொழிமாதிரிகளில் நிலவுகின்றன. மொழியியல், கணினிமொழியியல் ஆகியவற்றின் கடந்த 150 ஆண்டுகால வளர்ச்சியே செய்யறிவுத்திறனின் பெரும்மொழிமாதிரிகளை (Pre-trained Large Language Model - LLM) உருவாக்குவதற்கு அடிப்படையாக அமைந்துள்ளன.
தமிழ்போன்ற மொழிகளில் கோடியே கோடி மின்தரவுகள் கிடைக்காததால்தான், ஆங்கிலத்திற்கு இருக்கிற மொழித்திறன் தமிழுக்குச் செய்யறிவுத்திறன் மென்பொருள்களில் கிடைப்பதில்லை. அதற்கு மாற்றுவழியே 'நுட்ப மேம்படுத்தல் (Fine-tuning) ' என்னும் வழிமுறையாகும். இந்த வழிமுறையில் மொழிதரவுகளுடன் மொழி இலக்கண அறிவும் இணைத்துக் கொடுக்கப்படுகிறது. இதற்குக் குறிப்பிட்ட மொழியின் இலக்கண அறிவும் மொழியியல் ஆய்வுமுறையும் தேவைப்படுகின்றன.
மேற்கூறியவை எல்லாம் முதல் காரணத்தில் அடங்கும். இரண்டாவது காரணம், ஒரே மொழியியல் கோட்பாட்டின் நோக்கத்தை வெவ்வேறு வழிமுறைகளில் நிறைவேற்ற முயல்வது ஆகும். மாற்றிலக்கண மொழியியல் கோட்பாட்டில் வெவ்வேறு வழிமுறைகளைக் கொண்ட மொழியியல் பிரிவுகள் உண்டு. அதுபற்றிய வேறொரு பதிவைப் பின்னால் இடுகிறேன்.

கோமா நிலையில்' மனிதமூளை . . .

 'கோமா நிலையில்' மனிதமூளை . . .

-------------------------------------------------------------------------
உலகில் மிகப் பெரிய கொடுமை . . . மனித மூளைகளைச் சிந்திக்கவிடாமல் செயலற்றதாக ஆக்குவதுதான்! தமிழகத்தில் இதுதான் இன்று மிக வேகமாக நடைபெற்றுவருகிறது!
சாதி, மதம், திரைப்படம் , 'இலவசங்கள்' 'போலித்தமிழ் உணர்வு' - இவையெல்லாம் இன்று இதைத்தான் செய்துவருகின்றன! இது ஒருவகை 'கோமா' நிலைக்குப் பாதிக்கப்பட்டவர்களைத் தள்ளுவதுதான்! மதுவின் பாதிப்புகளைவிட இவற்றின் பாதிப்புதான் அதிகம்!

தமிழ்நாட்டு அரசியல் . . . 'மூளைகள்' பலியாக்கப்படுகின்றன!

 தமிழ்நாட்டு அரசியல் . . . 'மூளைகள்' பலியாக்கப்படுகின்றன!

-------------------------------------------------------------------------------------------------------
அண்மையில் கரூரில் நடைபெற்ற கூட்ட நெரிசலில் எதிர்பாராதவிதமாக 41 உயிர்கள் பலியாகியுள்ளது உண்மையில் மிக மிக வேதனைக்குரிய ஒன்று. குழந்தைகள்முதல் பெரியவர்கள்வரை . . . பலி! இந்த உயிர்களை இழந்த குடும்பத்தினருக்குக் கோடி கோடியே கொட்டிக்கொடுத்தாலும் அவர்களது இழப்புக்கு ஈடாகாது! இந்நிகழ்ச்சியை ஒவ்வொரு அரசியல் கட்சியும் வரும் தேர்தலை மனதில் வைத்து, லாவணி பாடிவருகிறது! இதற்குமேல் ஒரு படி . . . தமிழ்நாடு அரசு, காவல்துறை, உயர்நீதிமன்றம், உச்ச நீதிமன்றம், விசாரணைக்குழு, சிபிஐ என்று அரசு சார்ந்த அமைப்புகளும் இந்தப் பலிகளைப்பற்றித் ''தங்களுக்கே உரிய வகையில்'' கருத்து தெரிவித்துவருகின்றன!
தமிழ்நாட்டில் (மற்ற மாநிலங்களும் இதற்கு விதிவிலக்குகள் இல்லைதான்!) அரசியல் என்றாலே 'தேர்தல் அரசியல்மட்டும்தான்'!
என்னைப் பொறுத்தவரையில் . . . 41 உயிர்கள் மட்டுமல்ல . . . கோடிக்கணக்கான தமிழ்நாட்டு மக்களின் 'மூளைகளை' இந்த அரசியல் கட்சிகள் பலியிட்டுவருகின்றன!
சாதி, மதம், திரைப்படம் . . . இந்த மூன்றின் ஆதிக்கங்களே அத்தனை அரசியல் கட்சிகளிலும் நீடிக்கின்றன. இதற்குமேல் . . . போலி இந்தி எதிர்ப்பு (ஆங்கில ஆதரவு!) , 'செம்மொழித்தமிழ்' 'இலவசங்கள்' போன்றவையும் அரசியல் கட்சிகளால் 'பயன்படுத்தப்பட்டுவருகின்றன'. 'செம்மொழித் தமிழ் ' என்று நான் கூறுவதற்குக் காரணம், இன்றைய தமிழின் வளர்ச்சிபற்றி இங்கு யாரும் கவலைப்படுவதில்லை!
எந்தவொரு அரசியல் கட்சியும் இந்தியப் பொருளாதாரம்பற்றியோ, ஏகாதிபத்தியப் பன்னாட்டு நிறுவனங்களின் ஆதிக்கம்பற்றியோ பேசுவது இல்லை! இன்னும் ஒருபடி மேலே சென்று, அரசுகளே பன்னாட்டு நிறுவனங்களுக்குச் 'சிவப்புக் கம்பளம்' விரித்து வரவேற்று வருகின்றன! மறுபுறம் சுதேசிக் கப்பல் நிறுவனத்தை ஆங்கிலேயர்களுக்கு எதிராக உருவாக்கிப் பல்வேறு இன்னல்களுக்கு உட்பட்ட வ உ சி -இன் நினைவுநாளையும் தவறாமல் போட்டி போட்டுக்கொண்டு கொண்டாடிவிடுகின்றன.
தேர்தலை மனதில்கொண்டு, அத்தனை சாதிகளின் மறைந்த தலைவர்களின் சிலைகளுக்கும் அவர்களின் பிறந்தநாளையொட்டி, மறக்காமல் ஆளுயர மாலைகளைப் போட்டிபோட்டுக்கொண்டு அணிவித்துவருகின்றன!
நாட்டின் உண்மையான அரசியல் பொருளாதாரம், விலைவாசி உயர்வு, வேலையில்லாத்திண்டாட்டம், பணவீக்கம் போன்ற உண்மையான பிரச்சினைகள்பற்றி எந்தவொரு கட்சியும் பேசுவதே இல்லை. அதுபற்றிக் கவலைப்படுவதே இல்லை! தேர்தல் கூட்டணி எவ்வாறு அமைக்கலாம் என்பதுபற்றிமட்டுமே கவலைப்படுகின்றன. அது இக்கட்சிகளின் 'வாழ்க்கைப் பிரச்சினை'! இருந்துவிட்டுப் போகட்டும்! பணம் சம்பாதிப்பதும் (வட்டம் முதல் உயர்மட்டம்வரை!) குலத்தொழிலாக வாரிசுகளை உருவாக்குவதுமே இக்கட்சிகளின் நிர்வாகிகள் முதல் உயர்மட்டத் தலைவர்கள் வரை முதன்மையான வேலைகளாகக் கொண்டிருக்கின்றனர்! இவர்கள் இப்படித்தான் இருப்பார்கள்! இதில் எந்தவொரு கட்சியும் விதிவிலக்கு இல்லை! இவர்களது 'முக்கியப் பணியே' மக்களுக்கு உண்மையில் தேவையான 'அரசியல் பொருளாதாரக் கருத்துகள்' சென்றுவிடாமல் தடுப்பதே ஆகும்!
என்னைப் பொறுத்தவரையில் 41 உயிர்களை மட்டுமல்ல . . . தமிழ்நாட்டின் கோடிக்கணக்கான பாதிக்கப்பட்ட மக்களின் 'மூளைகளை' இந்த அரசியல்கட்சிகள் அனைத்தும் 'பலியாக்கிவருகின்றன'! இது தமிழ்ச் சமுதாயத்திற்கு மிகப் பெரிய ஆபத்து! மக்கள் தங்களது உண்மையான பிரச்சினைகளுக்கான தீர்வுகளைத் தெரிந்துகொள்ளாமல் இருப்பதற்கான அத்தனை வேலைகளையும் இந்த அரசியல் கட்சிகள் செய்கின்றன!
இந்த நிலையை எப்படி மாற்றுவது? உண்மையில் மிகப் பெரிய 'சமூகக் கொலை' இங்கு நடந்துவருகிறது! தற்போதைய தலைமுறையினர் மட்டுமல்ல, எதிர்காலத் தலைமுறையினர்களும் மிகக் கடுமையான பாதிப்புகளுக்கு உட்படுவார்கள்!
மக்களைச் சரியான வழியில் சிந்திக்கவைக்க அரசியல் கட்சிகள் இங்குத் தோன்றாதா? வளராதா? எப்படி இவ்வளவு பெரிய 'சமூகக்கொலையைத்' தடுத்துநிறுத்துவது? எனக்குச் சமூக இயக்கத்தில் நம்பிக்கை உண்டு! சமுதாயம் உறுதியாகத் தனது பிரச்சினைகளைத் தீர்த்துக்கொள்ள வழிகளை உருவாக்கும்! இந்த நம்பிக்கை எனக்கு உண்டு! ஆனால் இது எப்படி, எப்போது நடைபெறும் என்பதுபற்றிக் கருத்து கூறமுடியவில்லை! 'காற்று அடித்துத் தூசி விலகும்' என்று எதிர்பார்ப்பது தவறு!
சமூக மாற்றத்தை உருவாக்க விழையும் அரசியல் உணர்வாளர்கள் முதலில் தமிழ்நாட்டில் சாதி, மதம், திரைப்படம் போன்றவை அரசியலில் தலையிடாமல் இருக்கத் தேவையான நடவடிக்கைகளைக் கொண்டுசெல்லவேண்டும். இது இன்றைய தலையாய அரசியல் பணி! இந்த மூன்றும் மிகப் பெரிய சமூக விரோதிகள்! மக்களைப் பிளவுபடுத்தவும், திசைதிருப்பவும் இந்த மூன்றும் தமிழகத்தில் கடுமையாக 'வேலை செய்கின்றன'!
இளைஞர்கள் இந்தச் 'சமூக விரோதிகளை' எதிர்த்துக் கடுமையாகப் போராடவேண்டும்! உண்மையான அரசியலை மக்களிடையே கொண்டுசெல்வதற்கு இவையே இன்று மிக முக்கியமான தடைக்கற்களாக நீடிக்கின்றன. சாதிய விரோதங்கள் திட்டமிட்டு வளர்க்கப்படுகின்றன! பிற்போக்கு மதக் கருத்துகள் திணிக்கப்படுகின்றன! திரைப்பட அரசியல் தலைதூக்கி நிற்கின்றன. இவை மூன்றையும் எதிர்த்த போராட்டங்கள் தமிழகத்தில் தீவிரமாக நடைபெறவேண்டும். மக்களின் ' மூளைகள்' 'சிந்தனைகள்' தொடர்ந்து மேற்கூறிய மூன்றுக்குப் பலியாகாமால் தடுக்கவேண்டும்!
மக்களின் 'மூளைகள்' சரியான திசையில் சிந்திக்கத் தொடங்கினால், உறுதியாக மாற்றம் ஏற்படும்! இது தானாக நடக்காது! இளைஞர்கள் உண்மையான, சரியான அரசியல் கருத்துகளைக் கற்று உணரவேண்டும்! அவற்றை மக்களிடையே கொண்டுசெல்லவேண்டும்!

"தமிழில் மென்பொருள்'' - ''தமிழுக்கான மென்பொருள் '' - வேறுபாடு என்ன?

 "தமிழில் மென்பொருள்'' - ''தமிழுக்கான மென்பொருள் '' - வேறுபாடு என்ன?

-----------------------------------------------------------------------------------------------------
இன்றைய கணினித்தொழில் நுட்ப வளர்ச்சியில் எந்தவொரு மென்பொருளையும் - பணம் இருந்தால் - உருவாக்கமுடியும். ஆனால் ஒன்றில்தான் சிக்கல் ஏற்படும்.
''தமிழில் மென்பொருள்'' என்பதும் ''தமிழுக்கான மென்பொருள்'' என்பதும் வேறுபட்டவை. தமிழில் மென்பொருள் என்பது இடைமுகம் தமிழில் அமைவதையே (Localization) குறித்துநிற்கிறது. இது சிக்கல் இல்லை.
ஆனால் தமிழைப் புரிந்துகொள்ளவும் தமிழில் பேச, எழுதவும் மென்பொருள்கள் தேவை. அதாவது கணினிக்கும் நமக்கும் இடையில் தமிழ்வழியே கருத்தாடல் நடைபெறவேண்டும் (Human - Computer Tamil Interface) . அதற்கான மென்பொருள் தொழில்நுட்பத்தை உருவாக்குவதே கணினிமொழியியல் (Computational Linguistics) அல்லது மொழித்தொழில்நுட்பம் (Language Technology) ஆகும்.
நானும் எனது குழுவினரும் அதற்கான பணிகளில்தான் ஈடுபட்டுவருகிறோம். சொற்பிழைதிருத்தியிலிருந்து மொழிபெயர்ப்புவரை பலவகைப்பட்ட மொழிச்செயல்பாட்டுத் திறன்களையும் கொண்டதாகத் தமிழ் மென்பொருள்கள் - தமிழைக் கையாளுகிற மென்பொருள்கள் - அமையவேண்டும்.
இதற்கு இன்றைய காலகட்டத்தில் இரண்டு வழிகளே உள்ளன.
முழுக்க முழுக்கப் பெரும்மொழிமாதிரியின் (Large Language Model - LLM) திறன்களில் தமிழையும் முழுமையாகக் கையாளும் திறன் உள்ளடங்கவேண்டும். அதற்குத் தேவையான பல கோடி தமிழ்த்தரவும் தேவையான கணினி வன்பொருள்களும் கிடைக்கவேண்டும். இதில் குறிப்பிட்ட மொழிகளின் இலக்கண அறிவு தேவைப்படாது; அல்லது மிகக் குறைந்த அளவே தேவைப்படும் (Unsupervised Learning).
மற்றொரு வழி, இருக்கின்ற பெரும்மொழிமாதிரியைத் தமிழுக்குக் குறிப்பிட்ட மொழிச் செயல்பாடுகளுக்காக மேம்படுத்தவேண்டும் (Fine -tuning) ) . குறைந்த அளவு மின்னணுத் தரவுகொண்ட இன்றைய தமிழுக்கு முழுக்க முழுக்க தரவுகளைக்கொண்டுமட்டுமே தமிழறிவைக் கொடுத்துவிடமுடியாது. குறைந்த அளவு தரவு இருப்பதால் இலக்கண அறிவோடு அத்தரவுகளைக்கொண்டு பெரும்மொழிமாதிரிகளைப் பயிற்றுவிக்கவேண்டும் (Supervised Learning) .
இந்த இரண்டாவது பணியில்தான் நம்மால் தற்போது ஈடுபடமுடியும். அதற்கே நிதி வசதி இல்லாமல்தான் திணறுகிறோம். இதுதான் இன்றைய நிலை.
எனவே, கூகுள், மைக்ரோசாப்ட், ஆப்பிள் போன்ற பன்னாட்டு நிறுவனங்கள் அல்லது பன்னாட்டு மூலதனங்களைக்கொண்டு பலவகைப்பட்ட மென்பொருள்களை உருவாக்குகிற நிறுவனங்களின் நோக்கம் வேறு.
கணினிமொழியியல், இயற்கைமொழி ஆய்வு, மொழித்தொழில்நுட்பம் ஆகியவற்றின் நோக்கம் வேறு. இந்த இரண்டாவது பணியைத் தமிழுக்குச் செய்வதில்தான் நாம் கவனம் செலுத்தவேண்டும். எங்களுடைய தமிழாய்வு மென்பொருள்களும்( மின்னிலக்கணம், தமிழ் மின்னகராதி, தமிழ்த் தரவகம் போன்றவை), தமிழ்ப் பயன்பாட்டு மென்பொருள்களும் (மென்தமிழ் போன்றவை) இந்த இரண்டாவது வகையைச் சேர்ந்ததே. இதற்கு யார் உதவி செய்யமுடியும்? உதவி செய்வார்கள்? இதுதான் இன்றைய பிரச்சினை!

1) கணினித்தமிழ் வளர்ச்சியின் முதல் கட்டத்தில் தமிழ் எழுத்துரு, தமிழ் விசைப்பலகை, மென்பொருளின் பட்டி அல்லது மெனுக்கள் தமிழ்ச்சொற்களாக அமைந்திருத்தல் (Localization) ஆகியவை உருவாக்கப்பட்டன. 2) இரண்டாவது கட்டத்தில் தமிழ்க்கோப்புகளின் சொற்பிழை திருத்திகள், ஒற்றுப்பிழை திருத்திகள் , அகராதிகள் ஆகியவை இடம்பெறத் தொடங்கின. 3) தற்போதைய மூன்றாவது கட்டத்தில் , தற்போதைய செய்யறிவுத்திறன் வளர்ச்சியில் எழுத்துரை - பேச்சுரை மாற்றியிலிருந்து மொழிபெயர்ப்பு, உரைச்சுருக்கம் தருதல், உரையாடல் போன்ற பலவகை மொழிப்பயன்பாடுகள் தமிழுக்குக் கிடைக்கின்றன.


செய்யறிவுத்திறனில் (Artificial Intelligence - AI) அமைந்துள்ள பெரும்மொழிமாதிரியின் (Large Language Model - LLM) அடிப்படையும் மொழியியலும் (Linguistics)

 செய்யறிவுத்திறனில் (Artificial Intelligence - AI) அமைந்துள்ள பெரும்மொழிமாதிரியின் (Large Language Model - LLM) அடிப்படையும் மொழியியலும் (Linguistics) . . . (மொழி, மொழியியல் மாணவர்களுக்குப் பயன்படும் ஒரு பதிவு இது)

-------------------------------------------------------------------------
மொழியியலில் வேறுபட்ட பல கோட்பாடுகள் உண்டு. இதற்கு இரண்டு முக்கியக் காரணங்கள் உண்டு. முதலாவது குறிப்பிட்ட மொழியியல் கோட்பாட்டின் நோக்கம்.
(1) மாற்றிலக்கணக் கோட்பாட்டின் (குறிப்பாக, நோம் சாம்ஸ்கி ) நோக்கம், பிறந்த குழந்தை எவ்வாறு குறைந்த காலத்தில் ( மூன்று ஆண்டுகளுக்குள்), தாய்மொழி அறிவை (இலக்கணம், சொற்களஞ்சியம்) நிறைவாகப் பெற்றுக்கொள்கிறது? அதற்கு அடிப்படையான மொழித்திறன் குழந்தை பிறக்கும்போதே - மனிதமூளைக்குள் - அத்திறன் நீடிக்கிறதா (Innate) ? அவ்வாறு நீடித்தால் அத்திறனின் அடிப்படைக் கூறுகள் (''பொதுமை இலக்கணம்'' - Universal Grammar - UG) என்ன? அத்திறன் மனிதமூளைக்கே உரிய மரபணுப் பண்பு சார்ந்ததா? குழந்தை தனது வளர்ச்சியில் மொழியைக் ''கற்றுக்கொள்கிறதா (learning)''? அல்லது ''பெற்றுக்கொள்கிறதா (acquring) ''? குழந்தைக்குப் பிற திறன்கள் - தவழுதல், நடத்தல் போன்ற திறன்கள் - தாமாகவே ''வருவதுபோல (comes to) '' அல்லது ''வளர்வதுபோல'' மொழியும் 'வளர்கிறதா (develops) ?''
கணினிமொழியியலில் நீடிக்கிற ''நரம்பு வலைப்பின்னல் (Neural Network) " வழிமுறையானது கணினிக்கு இயற்கைமொழியின் அறிவைக் கொடுப்பதற்குத் தேவையான ''வழிமுறையை (algorithm / architecture)'' உருவாக்குவதாகும். அதனுடைய இன்றைய வளர்ச்சியே செய்யறிவுத்திறனில் கூறப்படுகிற ''ஆழ்நிலைக் கற்றல் (Deep Learning)'' ஆகும். இந்த ஆழ்நிலைக் கற்றல் வழிமுறையே தனக்குக் கொடுக்கப்படுகிற மொழித்தரவுகளைக் கொண்டு, ''தேவையான'' மொழி அறிவைக் கணினி பெற்றுக்கொள்கிறது. ஆனால் இந்த அறிவு குழந்தையின் மூளையில் இருக்கின்ற இலக்கண. சொற்களஞ்சிய அறிவு என்று கூறிவிடமுடியாது. வேறுபட்ட ஒன்றாகத்தான் அது அமைகிறது. இருப்பினும் மாற்றிலக்கண மொழியியலின் அடிப்படை இதற்கு உள்ளது. 'மனிதமூளையின்' உள்ளே உள்ள ''பொதுமை இலக்கணம்'' போன்ற ஒன்றைக் கணினிக்குக் கொடுக்க முயல்கிறது. இந்த உள்ளார்ந்த ' ஆழ்நிலை கற்றல் பொறி' எந்தவொரு குறிப்பட்ட மொழி சார்ந்ததும் இல்லை. எந்தவொரு மொழியின் தரவுகள் கிடைத்தாலும் அதைக்கொண்டு அம்மொழிக்கான திறனைப் பெற்றுக்கொள்ளும். (சாம்ஸ்கியின் 'பொதுமை இலக்கணமும்' இதுபோன்றதுதான். எந்தவொரு குறிப்பிட்ட மொழி சார்ந்ததும் இல்லை! )
(2) அடுத்து, இங்கிலாந்தைச் சேர்ந்த ஃபிர்த் (Firth), ஹாலிடே (Halliday), சிங்க்ளயர் (Sinclair) போன்றோர் முன்வைக்கிற மொழியியல் கோட்பாடு. இக்கோட்பாடு ஆங்கிலத்தில் "Systemic Grammar" என்று அழைக்கப்படுகிறது. ஒருவர் மற்றவர் பேச்சை அல்லது மொழியைப் புரிந்துகொள்வதில் மூன்று முக்கியக் கூறுகள் உண்டு. ஒன்று , 'குறிப்பட்ட தொடர் அல்லது வாக்கியம்("Text") ' ; இரண்டு, அத்தொடருக்கு அல்லது வாக்கியத்திற்கு முந்தைய, பிந்தைய தொடர்கள் அல்லது வாக்கியங்கள் (Co-text)' ; மூன்று, குறிப்பிட்ட தொடர் அல்லது வாக்கியம் முன்வைக்கப்படுகிற மொழிசாராக் கூறுகள்( Context).
இம்மூன்றின் உதவியினால்தான் ஒருவர் மற்றொருவர் முன்வைக்கின்ற தொடரை அல்லது வாக்கியங்களின் பொருண்மையைப் புரிந்துகொள்ளமுடிகிறது.
செய்யறிவுத்திறன் மென்பொருளில் அமைந்துள்ள 'மொழித்திறன்' என்பது குறிப்பிட்ட சொல் அல்லது தொடரின் முந்தைய , பிந்தைய சொற்கள், தொடர்கள், பத்திகள் ஆகியவற்றன் அடிப்படையில்தான் அமைகிறது. இதைத்தான் செய்யறிவுத்திறனில் 'சூழற் சாளரம் "(Context Window") என்று அழைக்கிறார்கள். ஆனால் மனித மூளைக்கும் செய்யறிவுத்திறனுக்கும் இடையில் உள்ள ஒரு அடிப்படை வேறுபாடு, மனித மூளைக்கு ஒரு தொடரின் முன்னால் அல்லது பின்னால் அமைகிற ஒரு சில சொற்கள் போதும். ஏனெனில் சூழல்சார் அறிவு (Pragmatic knowledge) துணை செய்கிறது. பேசப்படுகிற சூழலை அல்லது பேசப்படுகிற பொருளைப் புரிந்துகொள்ளும் திறன் (உலக அறிவு - Ontology ) மனித மூளைக்கு உள்ளது. இதில் டெல் ஹைம்ஸ் (Dell Hymes) என்பவரின் கருத்தாடல் திறன் (Communicative Competence) என்பதும் அடங்கும்.
ஆனால் இந்த அறிவு கணினிக்கு இல்லாததால், அதற்கு ஒரு சொல் அல்லது தொடருக்கு முந்தைய , பிந்தைய ஆயிரக்கணக்கான , லட்சக்கணக்கான சொற்கள் அல்லது தொடர்கள் தேவைப்படுகின்றன. எனவேதான் செய்யறிவுத்திறன் மென்பொருளில் அமைந்துள்ள பெரும்மொழிமாதிரியில் கோடியே கோடியே சொற்கள் இடம்பெறுகின்றன. இச்சொற்களின் எண்ணிக்கை மேலும் கூடக்கூட, அதன் 'மொழித்திறமும்' கூடும்.
ஆகவே, மொழியியலின் அடிப்படைகளே செய்யறிவுத்திறனில் அமைந்துள்ள பெரும்மொழிமாதிரிகளில் நிலவுகின்றன. மொழியியல், கணினிமொழியியல் ஆகியவற்றின் கடந்த 150 ஆண்டுகால வளர்ச்சியே செய்யறிவுத்திறனின் பெரும்மொழிமாதிரிகளை (Pre-trained Large Language Model - LLM) உருவாக்குவதற்கு அடிப்படையாக அமைந்துள்ளன.
தமிழ்போன்ற மொழிகளில் கோடியே கோடி மின்தரவுகள் கிடைக்காததால்தான், ஆங்கிலத்திற்கு இருக்கிற மொழித்திறன் தமிழுக்குச் செய்யறிவுத்திறன் மென்பொருள்களில் கிடைப்பதில்லை. அதற்கு மாற்றுவழியே 'நுட்ப மேம்படுத்தல் (Fine-tuning) ' என்னும் வழிமுறையாகும். இந்த வழிமுறையில் மொழிதரவுகளுடன் மொழி இலக்கண அறிவும் இணைத்துக் கொடுக்கப்படுகிறது. இதற்குக் குறிப்பிட்ட மொழியின் இலக்கண அறிவும் மொழியியல் ஆய்வுமுறையும் தேவைப்படுகின்றன.
மேற்கூறியவை எல்லாம் முதல் காரணத்தில் அடங்கும். இரண்டாவது காரணம், ஒரே மொழியியல் கோட்பாட்டின் நோக்கத்தை வெவ்வேறு வழிமுறைகளில் நிறைவேற்ற முயல்வது ஆகும். மாற்றிலக்கண மொழியியல் கோட்பாட்டில் வெவ்வேறு வழிமுறைகளைக் கொண்ட மொழியியல் பிரிவுகள் உண்டு. அதுபற்றிய வேறொரு பதிவைப் பின்னால் இடுகிறேன்.

 
Design by Free WordPress Themes | Bloggerized by Lasantha - Premium Blogger Themes | Hot Sonakshi Sinha, Car Price in India