நண்பர் மாலன் அவர்கள் சேட்ஜிபிடி பற்றிய எனது பதிவுக்குத் தனது கருத்தை அளித்துள்ளார்கள். அதுபற்றிய எனது கருத்தை மேலும் இங்குப் பதிவிடுகிறேன்.
வெள்ளி, 31 மார்ச், 2023
சேட்ஜிபிடி - தேவையா?
வியாழன், 30 மார்ச், 2023
செயற்கை அறிவுத்திறன் (Artificial Intelligence) - AI) மென்பொருள்களும் மொழியியல் (Linguistics) அடிப்படையான தமிழ்மொழி ஆய்வுகளும்!
வெள்ளி, 24 மார்ச், 2023
காதல் . . . கலப்புத் திருமணம் கட்டாயமா?
காதல் . . . கலப்புத் திருமணம் கட்டாயமா?
நண்பர் வேல்முருகன் அவர்களே. நான் கூற வந்தது
நாளிதழ்களில் சாதி அடிப்படையில் வருகின்ற விளம்பரங்களைப்பற்றித்தான்! காதல்
திருமணம், கலப்புத்
திருமணம் ஆகியவற்றை ஒருவர் எதிர்க்கக்கூடாது என்பதுதான்! ஆனால் ஒருவர் காதலிக்கிற
அல்லது விரும்புகிற ஆண் அல்லது பெண் அவரது சாதியைச் சேர்ந்தவராக
இருந்தால், அந்தத்
திருமணம் கூடாது என்று நான் கூறவரவில்லை.
மேலும் காதலித்துத்தான் திருமணம் செய்யவேண்டும்; அது
கலப்புத் திருமணமாகவே இருக்கவேண்டும் என்று நான் கூறவரவில்லை.
இன்றைய இந்தியாவில் அனைவருக்கும் காதலிக்க வாய்ப்பு
உண்டு என்று கூறமுடியாது. மேலும் நகர்ப்புறங்களில்தவிர, பெரும்பான்மையான
ஊர்களில் பணிபுரியும் இளைஞர், இளைஞிகளுக்கு
நெருக்கமானவர்கள் அவர்கள் ஊரைச் சேர்ந்த - அல்லது அவர்களது உறவினர்கள்
குடும்பங்களைச் சேர்ந்தவர்களாக இருப்பார்கள். அவ்வாறு இருக்கும்போது ஒருவர்
காதலிக்கிற அல்லது விரும்புகிற காதலரோ அல்லது காதலியோ அவரது சாதியைச்
சேர்ந்தவர்களாக இருப்பார்கள். ( இன்று பலர் தங்களது சாதிகளைச் சேர்ந்தவர்களையே
பார்த்துக் காதலிக்கிறார்கள் ! அதற்குக் காரணம் . . . அவருக்குச் சாதி உணர்வு
இருக்கலாம். அல்லது திருமணத்திற்குப் பெற்றோர்கள் தடையாக அமைந்துவிடக்கூடாது என்று
எண்ணலாம்! ) அதனாலேயே அவர்களுக்குத் திருமணம் செய்யக்கூடாது என்று நான்
கூறவரவில்லை.
திருமண விவகாரங்களில் சுயமாக ஒருவர் சிந்தித்து முடிவு
எடுப்பதற்கான முதலாளித்துவச் சுதந்திரம்கூட இன்னும் இங்குப் பரவலாக ஏற்படவில்லை.
சொத்துப் பாதுகாப்பு, உணவுமுறை
ஆகியவற்றில் நீடிக்கிற நிலவுடமைக் கட்டுப்பாடுகள் இன்னும் மிக வலிமையாக ஆதிக்கம்
செலுத்திக்கொண்டிருக்கின்றன.
என்னுடைய கருத்து . . . ஒருவருக்குத் தனது
திருமணத்தில் தனது துணையைத் தேர்ந்தெடுப்பதற்குச் சாதியோ, மதமோ
தடையாக இருக்கக்கூடாது. குடும்ப உறவுகளும் தடையாக இருக்கக்கூடாது. அவ்வளவுதான்!
திருமணத்தில் சாதி, மதம், இனம், வர்க்கம், நாடு
என்ற எந்த ஒன்றும் தடையாக இருக்கக்கூடாது!
காதல், சாதி, மதம், வர்க்கம்
பார்க்காத திருமணம், பிரிந்துசெல்லும்
உரிமை, மறுமணம், விதவைத் திருமணம் போன்றவையே நீடிக்கிற
ஒரு சூழல் ஏற்படுவதற்கு . . . இங்கு நிலவுகிற நிலவுடமை உற்பத்தி உறவுகள் முழுமையாக
மறையவேண்டும். அதுவரை . . . இவையெல்லாம் ''விதிவிலக்குகளாகத்தான்'' நீடிக்கும்! சாதி, வர்க்கம் இரண்டையும் புறக்கணித்து நடைபெறும்
திருமணமுறை வரவேண்டும் என்பதே எனது கருத்து.
இன்று நாளிதழ்களில் சாதி அடிப்படையில் திருமண
விளம்பரம் வெளிவருவது மட்டுமல்ல . . . சாதி, மத அடிப்படையில் ''மணமகன், மணமகள் பார்க்கும்'' நிறுவனங்களும் இயங்கிக்கொண்டு இருக்கின்றன!
இவற்றையே நான் எதிர்க்கிறேன்.
தமிழ்மொழியானது தமிழ் இனத்தின் மொழிதான்! இன அடையாளம் உண்டு!
தமிழ்மொழியானது தமிழ் இனத்தின் மொழிதான்! இன அடையாளம் உண்டு!
--------------------------------------------------------------------------------------------------------------------------
எந்தவொரு மொழிக்கும் வர்க்க அடிப்படையோ அல்லது சாதி, மத அடிப்படையோ கிடையாது.
மொழித் தரவுச் சேகரிப்புக்கு நல்ல வருமானம் !
மொழித் தரவுச் சேகரிப்புக்கு நல்ல வருமானம் !
------------------------------------------------------------------------------------------------------------------
தற்போது பெங்களூரில் இயற்கைமொழி ஆய்வுக்கான நிறுவனங்கள் பல
உள்ளன. பெரும்பாலும் இந்த நிறுவனங்கள் செயற்கை அறிவுத்திறன் அடிப்படையிலான
ஆய்வுகளை மேற்கொண்டு வருகின்றன. மேலும் கூகுள்,
மைக்ரோசாப்ட் போன்ற நிறுவனங்களுக்கு இந்திய மொழிகளுக்கான
தேவையான தரவுகளை இந்த நிறுவனங்கள் அளித்துவருகின்றன.
நிகழ்தகவு புள்ளியியல் (Probabilistic statistics) , நரம்பு வலைப்பின்னல் ( neural network) , ஆழ்நிலை கற்றல் (Deep Learning) , செயற்கை அறிவுத்திறன் ( Artificial Intelligence) அடிப்படையில் மொழித்தொழில்நுட்பப் பணிகளை மேற்கொள்ளும் கணினித்திறன் ( வன்பொருள், மென்பொருள் இரண்டிலும்) கூகுள், மைக்ரோசாப்ட் போன்ற நிறுவனங்களுக்குத்தான் தற்போது இருக்கின்றன.
மேலும் நூற்றுக்கணக்கான மொழிகளுக்கு அவை மொழித்தொழில்நுட்பத்தை மேற்கொள்ள இயலுகின்றன. ஒவ்வொரு மொழிக்கும் கோடியே கோடித் தரவுகளை இந்த நிறுவனங்கள் அந்தந்த மொழி பேசுவோர் நாட்டிலிருந்து பெற்றுக்கொள்கின்றன. இந்த நிறுவனங்களின் மொழித்தொழில் நுட்பத்திற்கும் கணினிமொழியியல் - இலக்கணம் - விதிகள் அடிப்படையில் மேற்கொள்ளப்படுகிற ஆய்வுக்கும் வேறுபாடு உள்ளது.
கூகுள் போன்ற நிறுவனங்களுக்கு ஆங்கிலம்போன்ற மொழிகளுக்குத் தரவுகளைக் கோடியே கோடி எண்ணிக்கையில் இணையத்திலிருந்து பெற்றுக்கொள்வதில் சிக்கல் இல்லை. ஆனால் தமிழ்மொழி போன்ற மொழிகளுக்கு அவ்வாறு கிடைப்பது இல்லை. எனவே இந்திய மொழிகளுக்கான மொழித்தரவுகளை - பேச்சுத் தரவு, எழுத்துத்தரவு இரண்டுமே- பெறுவதற்குப் பன்னாட்டு நிறுவனங்கள் முயல்கின்றன. அதற்கு ஏராளமான பணத்தைச் செலவிடத் தயாராக அவை இருக்கின்றன.
ஆண் - பெண் தரவு,
இளையர் - முதியோர் தரவு என்று பல அடிப்படைகளில் தரவுகள்
அவற்றிற்குத் தேவைப்படுகின்றன. பெங்களூர்போன்ற நகரங்களில் செயல்படும் பல பெரிய
நிறுவனங்கள் இதில் மிகுந்த ஆர்வமும் கவனமும் செலுத்திவருகின்றன என்று நான்
கருதுகிறேன்.
தரவுகளைச் சேகரித்தல், பிழைகள் அகற்றல் (Proofreading) , சீர்மைப்படுத்தல் (Normalization) போன்ற பணிகளைமட்டுமே மேற்கொண்டு, நல்ல ஊதியம் பெறத் தற்போது வாய்ப்பு உள்ளது. ஆனால் முறையான தொடர்பு வேண்டும். அத்தரவுகளைக் கொண்டு, பல்வேறு வழிமுறைகளை மேற்கொண்டு, மொழித்தொழில்நுட்பக் கருவிகளை ( language tools - from Spellchecking to Machine Translation) இந்தப் பன்னாட்டு நிறுவனங்கள் உருவாக்கிக்கொள்ளும். இளைஞர்கள் இதற்குத் ''தரவுமொழியியல் (Corpus Linguistics) '' என்ற துறையில் பயிற்சிபெற்றால் நல்லது.
ஒரு காலகட்டத்தில் ஆங்கிலேய ஆட்சியாளர்கள் இந்தியாவிலிருந்து மூலப்பொருள்களைத் தங்கள் நாட்டிற்கு ஏற்றுமதி செய்து, அவற்றைக்கொண்டு நுகர்வோர் பொருள்களை உற்பத்திசெய்து, மீண்டும் இந்தியாவில் இறக்குமதி செய்து விற்றதுமாதிரி . . . தற்போது இந்தத் தரவுசேகரிப்பு இங்கு நடைபெறுகிறது.
தரவு ஏற்றுமதி - மொழிக்கருவிகள் உருவாக்கம் - அவற்றின் இறக்குமதி என்று தற்போது ஒரு நிலை ஏற்பட்டுள்ளது. ஏன் இதை இங்கேயே உருவாக்கக்கூடாது என்று நண்பர்கள் கேட்கலாம்! உற்பத்தித்திறன் , மூலதனம், தொழில்நுட்பம் - இங்கு இல்லையே!
அடுத்த கட்டமாகக் கூகுள் போன்ற நிறுவனங்கள் இந்தியாவிற்குத் தங்கள் நிதிமூலதனத்தை இறக்குமதிசெய்து, உள்ளூர் நிறுவனங்களை உருவாக்கி, உள்ளூர் உழைப்பைப் பயன்படுத்தி, கருவிகளை உருவாக்கி, இங்கேயேயும் விற்கும்; பிற நாடுகளுக்கும் ஏற்றுமதி செய்யும்.
இங்குள்ள உள்ளூர் நிறுவனங்கள் செக்கிழுத்த செம்மல் வ உ சி
போன்று . . . மூழ்கும் ''தேசியக் கப்பல் ''
ஓட்டவேண்டியதுதான்!
இன்று தமிழகத்தில்கூட நண்பர்கள் பலர் '"தமிழுக்குத் தேவையான மென்பொருள்களை கூகுள், மைக்ரோசாப்ட் கொடுத்துவிடும்; மேலும் அவை கொடுக்கும் மென்பொருள்களின் தரம் மிகச் சிறப்பாக இருக்கும்; என்னயிருந்தாலும் தமிழகத்திலேயே உருவாக்கப்படும் மென்பொருள்கள் அந்தத் தரத்திற்கு வரமுடியுமா?'' என்று தங்களுடைய ''சர்வதேசிய உணர்வோடு'' இருப்பதைப் பார்க்கலாம். கூகுள், மைக்ரோசாப்ட் நிறுவன உரிமையாளர்கள் அல்லது உயர் அதிகாரிகளை ( பில்கேட்ஸ், சுந்தர் பிச்சை, நாதெல்லா ) ஆகியோர்களுக்குச் ''சிவப்புக் கம்பள மரியாதை'' அளித்துக்கொண்டிருக்கிறோம்! அவர்கள் எதற்காக இந்தியாவைத் தேடிவருகிறார்கள் என்பதுபற்றிக் கவலைப்படுவதில்லை! நல்லதொரு தேசிய உணர்வு . . . நாட்டுப்பற்று!
இறைமறுப்புக்கொள்கையும் போலி நாத்திகவாதமும்!
---------------------------------------------------------------------------------------------------------------------------------
அறிவியல் அடிப்படையில் சிந்தித்துப் பார்த்து ஒருவர் இறைமறுப்பாளராக நீடிப்பது வேறு. வெறும் பிராமணிய எதிர்ப்பு, புராண விமர்சனங்கள் ஆகியவற்றின் அடிப்படையில் ஒருவர் தன் இளம்வயதில் நாத்திகராக நீடிப்பது வேறு.
புதன், 22 மார்ச், 2023
சாதி அடிப்படையில் திருமண விளம்பரங்கள்!
சாதி அடிப்படையில் திருமண விளம்பரங்கள்!
சாதிகள் மறையாதா? என்றுமே நீடிக்குமா?
செவ்வாய், 21 மார்ச், 2023
தமிழும் ஆங்கிலமும் - உச்சரிப்புமுறை
தமிழும் ஆங்கிலமும் - உச்சரிப்புமுறை
---------------------------------------------------------------------------------------------------------------------------------------
ஒலிவடிவே ஒரு மொழியின் அடிப்படை என்றாலும் அந்த மொழியின் எழுத்துக்களும் முக்கியத்துவம் வாய்ந்ததே. எனவே ஒவ்வொரு மொழியையும் அந்தந்த மொழிகளின் எழுத்துக்களில் எழுதுவதே சரி. ஏனென்றால் ஒரு மொழியின் பேச்சொலியியல், ஒலியனியல் ஆகியவை அந்த மொழியின் எழுத்துவடிவங்களுக்கு அடிப்படையாக அமைகிறது. தமிழில் எல்லா ஒலியன்களுக்கும் வரி வடிவம் - எழுத்துவடிவம் - உண்டு. க, கா, கி, கீ என்று உயிர்மெய்களுக்கும் எழுத்துக்கள் உண்டு. ஆனால் ஆங்கிலத்தில் 40-க்கு மேற்பட்ட ஒலியன்கள் இருக்கின்றன. ஆனால் அவற்றிற்கான எழுத்து வடிவங்கள் 26 தான்! ஆங்கிலத்தில் பல பேச்சொலிகள், ஒலியன்கள் ஆகியவற்றிற்கு நேரடியான எழுத்து வடிவங்கள் கிடையாது. cat - city - இதில் cat-இல் உள்ள "'c" என்ற எழுத்து [k] என்ற ஒலியனைக் குறிக்கிறது. இரண்டாவது சொல்லான city -யில் "c" என்ற எழுத்து 's" என்ற ஒலியனைக் குறிக்கிறது. ("c" யை அடுத்து முன்னுயிர் வந்தால் "s" உச்சரிப்பு; பின்னுயிர் வந்தால் k உச்சரிப்பு. ) இதுபோன்று பல வேறுபாடுகள் ஆங்கிலத்தில் ஒலியன்களுக்கும் எழுத்துக்களுக்கும் இடையில் இருக்கின்றன.
ஆனால் தமிழில் [k] [g] [x] ஆகிய மூன்று மாற்றொலிகளைக்கொண்ட /k/ ஒலியனுக்கு
ஒரு எழுத்துத்தான்! மாற்றொலிகளாக இருப்பதால், அவை வரும் சூழல்கள் தெளிவாக இருக்கின்றன. சொல்
முதலிலும் இடையில் இரட்டித்து வரும்போதும் [k] , /கடல்/, /அக்கா/; சொல்லிடையில்
மெல்லினங்களுக்கு ( மூக்கொலிகளுக்கு) அடுத்து வரும்போது [g] ,, /தங்கம்/; சொல்லிடையில்
இரண்டு உயிர்களுக்கு இடையில் [x],
/பகல்/. இவ்வாறு ஒரு ஒலியனுக்கு ( அவற்றின்
பேச்சொலிகளுக்கு இல்லை) ஒரு எழுத்து என்பதால் உச்சரிப்பில் சிக்கல் நேராது.
எழுதுவதை - மாற்றொலிகளின் சூழல்கள் அடிப்படையில் - அப்படியே உச்சரிக்கமுடியும்.
ஆனால் ஆங்கிலத்தில் சொல்லில் பயின்றுவரும்
எழுத்துக்கள் அடிப்படையைச் சார்ந்துமட்டும் உச்சரிப்பைத் தெரிந்துகொள்ளமுடியாது.
உச்சரிப்பைத் தனியே தெரிந்துகொள்ளவேண்டும். எனவேதான் ஆங்கிலத்திற்கு உச்சரிப்பு
அகராதிகளை Daniel jones, Gimpson போன்ற
மொழியியலாளர்கள் ( பேச்சு ஒலியியலாளர்கள் - phoneticians ) உருவாக்கியுள்ளார்கள். மேலும்
ஆங்கில அகராதிகளில் ஒவ்வொரு சொல்லுக்கும் உச்சரிப்பையும் அடைப்புக்குறிக்குள் கொடுக்கிறார்கள்.
மேலும் சொல்லுக்குள் அசை அழுத்தமும் ஆங்கிலத்தில் உண்டு. இது ஒரு சொல்லின் இலக்கண
வகைப்பாட்டைத் தீர்மானிக்கும். "permit" என்பதில் இரண்டு அசைகள். per , mit. இதில்
முதல் அசைக்கு அழுத்தம் கொடுத்தால் பெயர்; இரண்டாவது அசைக்கு அழுத்தம் கொடுத்தால் வினை. ஒரு
சொல்லில் மொழியசைகளின் அழுத்த வேறுபாடுகள் , பொருண்மை வேறுபாடுகளுக்குக் காரணமாக அமைகின்றன.
தமிழில் இந்தச் சிக்கல் கிடையாது. எனவே ஆங்கிலத்தைக் கற்கும்போது spelling மட்டும்
அல்லாமல், அசை
அழுத்தம், உச்சரிப்பு
ஆகியவற்றைக் குறிப்பாகக் கற்றுக்கொள்ளவேண்டியுள்ளது.