புதன், 16 அக்டோபர், 2024

ஒரு ஐயம் . . . செயற்கைச் செய்யறிவுத்திறனில் (Artificial Intelligence - AI) அமைந்துள்ள "பெரிய மொழிமாதிரி (Large Language Model - LLM)" பற்றி !

 ஒரு ஐயம் . . . செயற்கைச் செய்யறிவுத்திறனில் (Artificial Intelligence - AI) அமைந்துள்ள "பெரிய மொழிமாதிரி (Large Language Model - LLM)" பற்றி !

--------------------------------------------------------------------------
நான் தமிழ்மொழி ஆய்வாளன் . . . மொழியியல் ஆய்வாளன். கணினியியல் துறையைச் சார்ந்தவன் இல்லை. எனவேதான் இந்த 'அறியா வினா' ஐயம்.
மொழியியல் அறிஞரான சோம் சாம்ஸ்கி, ஒரு குழந்தை பிறக்கும்போது, அதனுடைய மூளையில் எந்தவொரு இயற்கைமொழியையும் பெற்றுக் கொள்ளும் திறன் உள்ள ''மொழி ஈட்டும் பொறி (Language Acquisition Device - LAD) ஒன்று அமைந்துள்ளது. இதற்குள அனைத்து மனித மொழிகளுக்கும் உள்ள பொதுவான இலக்கணம் (Universal Grammar - UG) ஒன்று உள்ளது. குழந்தையானது இதனைப் பயன்படுத்தி, தனக்குக் கிடைக்கிற சுற்றுப்புற மொழித்தரவுகளைக் கொண்டு, ஒரு குறிப்பிட்ட மொழியின் அமைப்பைக் (சொல்லறிவு, இலக்கண அறிவு) குறைந்த காலகட்டத்தில் நிறைவாகப் ''பெற்றுக்கொள்கிறது''. அதாவது மூன்று , நான்கு வயதில் குழந்தையின் மூளையில் ''மனித மொழி '' வளர்ந்துவிடுகிறது (Language Growth) .
அடுத்து, ''புறநடத்தை (Verbal behaviour) " கோட்பாட்டை 1950-இல் முன்வைத்த பி. எஃப். ஸ்கின்னர் மாறுபட்டைக் கோட்பாட்டை முன்வைத்திருந்தார். அவரது கோட்பாட்டின்படி, குழந்தைக்குப் பிறக்கும்போது எந்தவித மொழி அறிவும் கிடையாது; மூளையானது 'வெற்று எழுதுபலகையாகத்தான் (Empty Slate - "tabula rasa) '' இருக்கிறது. பிறந்தபிறகுதான் குழந்தை தனது சுற்றுப்புறச் சூழல் அளிக்கின்ற மொழித்தரவுகளைக் கொண்டு, ஒரு மொழியைக் ''கற்றுக்கொள்கிறது (learns) ''. உளவியல் அறிஞரான பாவ்லோவ் கோட்பாட்டை (Stimulus - Response) அடிப்படையாகக்கொண்டதுதான் இத்தத்துவம்.
இங்குக் குறிப்பாகப் பார்க்கவேண்டியது . . . இருவருக்கும் ஒரு ஒற்றுமை . . . குழந்தைக்கு மூன்று அல்லது நான்கு வயதில் அதனுடைய மூளைக்குள் மொழி வளர்ந்துவிடுகிறது; அதாவது மொழி அறிதிறன் கிடைத்துவிடுகிறது. அந்த மொழியறிவு எவ்வாறு குழந்தைக்குக் கிடைக்கிறது என்பதில்தான் இருவருக்கும் வேறுபாடு காணப்படுகிறது. சாம்ஸ்கியின் கருத்துப்படி . . . குழந்தைக்கு மொழியானது பிற திறன்கள் வளர்ச்சிபோல வளர்ந்துவிடுகிறது. ஸ்கின்னரின்படி, குழந்தை தரவுகளைக்கொண்டு, நமது உதவியுடன் , மொழியைக் கற்றுக்கொள்கிறது.
தற்போதைய கணினியுலகின் ''செயற்கைச் செய்யறிவுத்திறனின்படி'' கணினியானது ஒரு மொழி இல்லை, நூற்றுக்கணக்கான மொழிகளைப் பல்வேறு மொழிச்செயற்பாடுகளுக்கு ((Language functions / activities) ... மொழிபெயர்ப்பு (Translation), உரைச்சுருக்கம் (Text Summarization) , பயனர் உணர்வு அறிதல் (Sentimental Analysis) போன்ற பலவேறு மொழிச்செயற்பாடுகளுக்கு - பயன்படுத்தும் திறனைப் பெறுகிறது. இந்தத் திறன்தான் - செய்யறிவுத்திறன்தான் - ''பெரிய மொழிமாதிரி (Large Language Model - LLM) என்று கூறப்படுகிறதா? இயற்கைமொழிகளின் சொல்லறிவு, இலக்கண அறிவு இரண்டும் இதில் அடங்கியுள்ளதா?
என்னுடைய அறிவுக்கு எட்டியது . . . நூற்றுக்கணக்கான மொழிகளின் தரவுகளைப் பல கோடி எண்ணிக்கையில் பெற்று, ஒரு சொல் அல்லது தொடரின் பண்புகளை (பொருண்மை, இலக்கணக்கூறு) . . . அவற்றின் சூழல்களின் அடிப்படையில் - மிக அதிகமான தொலைவுக்கு (Context Window) - எண்ம அடிப்படையிலான புள்ளியியல் அறிவாக - ''ஆழ்நிலைக் கற்றல் (Deep Learning) , அல்லது பிற வழிமுறைகளில் - பெற்றுக்கொள்கிறது. அதன்பின்னர், இந்த ''அறிவை'' நிகழ்தகவு புள்ளியியல் (Probabilistic Statistics) அடிப்படையில் பயன்படுத்தி, ''செயற்கைச் செய்யறிவுத்திறனானது'' தனக்கு இடப்பட்ட ''மொழிச் செயல்பாடுகளை'' மேற்கொள்கிறது. நான் புரிந்துகொண்டது சரிதானா என்பது எனக்குத் தெரியவில்லை.
இங்குத்தான் எனது ஐயம் . . . செயற்கைச் செய்யறிவுத்திறன் மென்பொருளில் உள்ள மேற்குறிப்பிட்ட ''மொழி அறிவானது'' சாம்ஸ்கி, ஸ்கின்னர் போன்றவர்கள் கூறுகிற ''மொழி அறிவு '' அல்லது ''மொழி அறிதிறன்'' தானா? அல்லது ''புள்ளியியல் அறிவா''? இந்தப் புள்ளியியல் அறிவைக்கொண்டு, ''மொழி அறிவைப் பெற்ற '' மனிதர்கள் செய்கிற பல்வேறு மொழிச் செயற்பாடுகளைச் ''செயற்கைச் செய்யறிவுத்திறன்'' செய்கிறது என்பதில் ஐயம் இல்லை! அதுமட்டுமல்ல, ஒரு மொழியில் அல்லாமல், நூற்றுக்கணக்கான மொழிகளின்வழியே மொழிச்செயற்பாடுகளைக் கணினி மேற்கொள்கிறது. அதாவது ''மொழிச்செய்யறிவுத்திறன் '' அதற்கு உள்ளது.
ஆனால் மனிதமூளையில் உள்ள ''இயற்கைமொழிகளின் மொழி அறிதிறன்'' போன்ற ஒன்றைக் கணினி பெற்றுச் செய்கிறதா? அல்லது இன்றைய கணினி வளர்ச்சி, புள்ளியியல் வளர்ச்சி ஆகியவற்றை அடிப்படையாகக்கொண்டு செய்கிறதா? இந்த இரண்டாவது ''அறிவாக'' இருந்தால், அதை ''மொழிமாதிரி (Language Model) '' என்று கூறலாமா? மனித மூளைக்குள் உள்ள ''மொழிமாதிரி'' போன்றதுதான் இது என்று கூறமுடியுமா? இதுவே எனது ஐயம்!
அடுத்து, அவ்வாறு இருந்தால், தற்போது இந்த ''மொழிமாதிரியைக்''கொண்டு, இயற்கைமொழிகளின் வழியே இனிக் கணினிக்கு நிரல்கள் எழுதமுடியுமா? கணினியால் மனித மொழிகளில் நிலவும் பல்வேறு ''மயக்கங்களைக்'' கையாளமுடியாததால்தானே, செயற்கை நிரல்கள் மொழிகள் (Programming languages) உருவாக்கப்பட்டுள்ளன. இனி, அவை தேவை இல்லையா?
எந்தவகை ''அறிவு '' இருந்தால் என்ன? நாம் செய்யமுடிகிற ''மொழிச்செயல்பாடுகளை'' எல்லாம் கணினியானது நம்மைவிட மிக வேகமாகவும் துல்லியமாகவும் செய்கிறதே! பிறகு இதற்கு எந்த ஐயம் என்று சிலர் கருதலாம். சரிதான்! ஆனாலும் ஆய்வு மாணவர்களுக்கு இந்த ஐயம் வருவது தவறு இல்லையே. கணினித்துறை சார்ந்த நண்பர்கள் இந்த ஐயத்திற்கு விளக்கம் தந்தால் நல்லது.
விருப்பம்
கருத்திடுக
அனுப்புக
பகிர்க

0 கருத்துகள்:

கருத்துரையிடுக

 
Design by Free WordPress Themes | Bloggerized by Lasantha - Premium Blogger Themes | Hot Sonakshi Sinha, Car Price in India