சனி, 4 பிப்ரவரி, 2023

சேட்ஜிபிடி (ChatGPT) - செயற்கை அறிவுத்திறன் மென்பொருளைத் தமிழ்மொழிக்குச் சிறப்பாகப் பயன்படுத்த நாம் செய்யவேண்டியது என்ன?

 சேட்ஜிபிடி (ChatGPT) - செயற்கை அறிவுத்திறன் மென்பொருளைத் தமிழ்மொழிக்குச் சிறப்பாகப் பயன்படுத்த நாம் செய்யவேண்டியது என்ன?

---------------------------------------------------------------------------------------------------------
கணினிக்கு அதற்குரிய முறையில் தமிழ்மொழியைக் கற்றுக்கொடுத்தால்தான் (விதிகள் அடிப்படையிலோ -rule based அல்லது இயந்திரவழிக் கற்றல்வழியோ - machine learning), நாம் அதற்குக் கொடுக்கிற தமிழ்த்தொடர்களைப் புரிந்துகொள்ளமுடியும்.
பிறந்த குழந்தைக்கு எந்தவொரு இயற்கை மொழியையும் கற்றுக்கொள்ளும் ( உண்மையில் பெற்றுக்கொள்ளும்- acquire ) திறன் உள்ளது; அனைத்து இயற்கைமொழிகளுக்கும் உரிய பொதுமை இலக்கணம் Universal Grammar) பிறக்கும்போதே மனிதமூளைக்குள் (innate in the human brain) உள்ளது. அதைப் பயன்படுத்தித்தான் , குழந்தை தான் வாழுகிற சூழலில் உள்ள மொழியின் தரவுகளின் (linguistic data) உதவிகொண்டு, அந்த மொழியைப் பெற்றுக் கொள்கிறது.
அதுபோன்றே கணினியின் மூளைக்கு ( சில்லுவில் உள்ள மின்துகளியச்சுற்று - electronic circuits in the computer chip / processor) + மென்பொருள் ) இயற்கைமொழியைக் கற்றுக்கொள்ளும் திறன் அளிக்கப்படுகிறது; அந்தத் திறனைப் பயன்படுத்தி, அதற்கு அளிக்கப்படும் மொழித்தொடர்களின் உதவியுடன், கணினியானது இயற்கைமொழியைக் கற்றுக்கொள்ளும்.
இதை நாம்தான் - மனிதர்கள்தான்- செய்யவேண்டும்.
மந்திரத்தில் மாங்காய் காய்க்காது. ChatGPT - ஆனது கணினிக்கு இயற்கைமொழியைக் கற்றுக்கொள்ளும் திறனை ( Competence) அளிக்கிறது. ஆனால் அதைப் பயன்படுத்தி, கணினி ஒரு குறிப்பிட்ட இயற்கை மொழியின் தொடர்களைப் புரிந்துகொள்ளவோ அல்லது உருவாக்கவோ வேண்டும் (Performance) என்றால், அதற்குத் தேவையான அளவுக்குக் குறிப்பிட்ட மொழியின் தரவுகளை அளிக்கவேண்டும்.
ஆங்கிலத்திற்கு அதைக் கொடுத்துள்ளார்கள். எனவே இந்தச் செயற்கை அறிவுத்திறன் மென்பொருள் ஆங்கிலத்தொடர்களைப் புரிந்துகொள்கிறது; உருவாக்குகிறது. அதனால் கணினியானது தனக்குக் கொடுக்கப்படுகிற பணிகளைச் ( வினாவுக்கு விடை அளிப்பதோ, மொழிபெயர்ப்பதோ) செய்யமுடிகிறது.
ஆகவே தமிழ்த் தரவுகளை - கோடியே கோடி அளவிலான தரவுகளை - முறையாக இந்த மென்பொருளுக்கு அளித்தால், அதனுடைய தமிழ்மொழித்திறன் வளரும். அதன் உதவிகொண்டு, நாம் தமிழ்வழியே அதற்குக் கொடுக்கிற பணிகளை மேற்கொள்ளும்.
நாம் ஒருவருக்கு ஒரு கட்டளையைக் கொடுக்கும்போது, அவருக்கு நமது மொழி தெரிந்திருக்கவேண்டும் அல்லவா? இல்லையென்றால், நமது கட்டளையை எவ்வாறு புரிந்துகொள்ளமுடியும்? விடை தரமுடியும்?
எனவே, கணினியின் இன்றைய செயற்கை அறிவுத்திறனைத் தமிழர்களும் பயன்படுத்த வேண்டுமென்றால், தமிழ்மொழியின் அமைப்பு ஆழத்தைக் கணினிக்குப் புரியவைக்கவேண்டும்.
அதுவரை தமிழில் அது தவறுதான் செய்யும். படித்தான் என்பதைப் பிரிக்கச் சொன்னால், படித்து + தான் என்று பிரித்து, படித்து வினையடி, தான் இறந்தகாலவிகுதி என்று தவறாகத்தான் இன்று அது கூறுகிறது. இது அதனுடைய தவறு இல்லை. கணினிமொழியியல் அடிப்படையில் தமிழ் அமைப்பைப்பற்றிய ஆய்வு இங்கு வளரவில்லை! அவ்வளவுதான்!

''நாம் அசைக்காமல் மணி ஒலிக்காது'' '' நாம் பெருக்காமல் தூசி விலகாது''; எனவே , ''காற்று அடிக்கும் . . . மணி ஒலிக்கும் . . . தூசி விலகும்'' என்று எதிர்பார்ப்பது எவ்வளவு தவறானதோ, அதுபோன்றே நாம் ''எப்படியாவது மைக்ரோசாஃப்ட், கூகுள் போன்ற நிறுவனங்கள் தமிழுக்கும் இதைச் செய்துவிடும் என்று எதிர்பார்த்து இருப்பது தவறு! (Bell won't ring unless we swing it! Dust never vanishes itself without sweeping !)

0 கருத்துகள்:

கருத்துரையிடுக

 
Design by Free WordPress Themes | Bloggerized by Lasantha - Premium Blogger Themes | Hot Sonakshi Sinha, Car Price in India