வியாழன், 16 மே, 2024

செய்யறிவுத்திறன் மென்பொருள்களும் தமிழ்மொழி நுட்பங்களும் - (1)

 செய்யறிவுத்திறன் மென்பொருள்களும் தமிழ்மொழி நுட்பங்களும் !

-----------------------------------------------------------------------
பேராசிரியர் மகேஸ்வரன்
-----------------------------------------
"எம்மொழியின் நுட்பங்களையும் கணினிக்குக் கற்றுக் கொடுக்க முடியாது" - இது பட்டறிவின்பாற்பட்ட அருமையான கருத்து .
ந. தெய்வ சுந்தரம்
----------------------------------------
பேரா. மகேஸ்வரன் அவர்களே. முதலில் நாம் மொழியின் நுட்பங்கள் எவை எவை என்று வரையறுத்துக் கொள்ளவேண்டும்.
பின்னர் தற்போது கூறப்படுகிற செய்யறிவுத்திறன் (Artificial Intelligence) பெரிய மொழி மாதிரி (Large Language Modal) துறையில் ஆய்வுசெய்பவர்களிடம் இதுபற்றிக் கூறி, இந்த நுட்பங்களை எல்லாம் கணினிக்குக் கற்றுக்கொடுக்கமுடியுமா, ஆங்கிலம் போன்ற மொழிகளுக்குக் கொடுத்திருக்கிறார்களா? எந்த நுட்பங்களையெல்லாம் கொடுக்கமுடியவில்லை? என்பதுபற்றி விவாதிக்கவேண்டும்.
அந்தத் துறையில் ஒரு மொழியின் அறிவை எவ்வாறு கொடுக்கிறார்கள், அது எந்த அளவு வெற்றி பெறுகிறது என்பதுபற்றிச் சோதித்துப் பார்க்கவேண்டும். பின்னர் தமிழ்மொழிக்குத் தற்போது உள்ள LLM எந்த அளவுக்கு உதவுகிறது, எங்கே வெற்றி அடைகிறது, எங்கே தோல்வி அடைகிறது என்று சோதிக்கவேண்டும். ஏன் ஆங்கிலம், பிரஞ்சு போன்ற மொழிகளுக்கு வெற்றிகரமாகச் செயல்படுகிற இந்தச் செய்யறிவுத்திறன் தமிழுக்குச் செயல்படவில்லை என்று விவாதிக்கவேண்டும்.
பின்னர் பின்பற்றப்பட்ட LLM - ஐத் தமிழ்மொழிக்குச் சிறப்பாகச் செயல்படுத்த எவ்வாறு Fine-tuning செய்யவேண்டும் என்று விவாதிக்கவேண்டும். அதன்பின்னர் நாம் முடிவுக்கு வரவேண்டும். இதுதான் அறிவியல் ஆய்வுமுறை. இது கணினித்தொழில்நுட்பம் சார்ந்த ஒரு பிரச்சினை.
எனவே பொதுவாக, மொழிநுட்பங்களைக் கணினிக்குக் கொடுக்கமுடியாது என்ற ஒரு முடிவுக்கு வரவேண்டாம். இது ஒரு பெரிய தத்துவார்த்தப் பிரச்சனையும் ஆகும். நோம் சாம்ஸ்கியின் debate ஒன்று இணையதளத்தில் கிடைக்கும். அது கூகுள் ஆய்வுப்பிரிவு தலைவர் பீட்டர் நார்விக் என்பவருடன் நடைபெற்ற ஒரு விவாதம். அதைத்தொடர்ந்து சாம்ஸ்கி பல பேட்டிகள் இதுபற்றி அளித்துள்ளார். அதையும் படித்துப்பார்க்கவேண்டும்.
நானும் இதே முகநூலில் மொழிநுட்பங்களைச் செய்யறிவுத்திறன் மென்பொருளில் கொடுக்கமுடியாது என்று பல பதிவுகள் இட்டேன். பின்னர் அந்தத் துறைபற்றி சற்று ஆழமாகப் படித்தபிறகு, எனது கருத்துக்களைச் சற்று மாற்றிக்கொண்டிருக்கிறேன். சோதித்துப் பார்த்தும் வருகிறேன். அதில் அறிவும் திறனும் உள்ள கணினியியலாளர்களுடன் இதுபற்றித் தொடர்ந்தும் பேசிவருகிறேன்.
100 விழுக்காடு செய்யறிவுத்திறனில் கொடுக்கமுடியவில்லையா, பரவாயில்லை எந்த அளவு அது சரியாகச் செய்கிறதோ, அதை அடிப்படையாகக்கொண்டு தமிழ்ச் சமூகத்திற்கும் ஏதாவது செய்யமுடியுமா என்பதைத் தமிழ் மொழி ஆய்வாளர்கள் ஆய்வுசெய்யவேண்டும். குறிப்பாக, மொழியியல் துறையைச் சேர்ந்தவர்கள் ஆய்வுசெய்யவேண்டும்.
அறிவியல் வளர்ச்சியோடு தமிழ்மொழி ஆய்வாளர்களும் பயணம் செய்யவேண்டும்.
நாமே கதவை மூடிக்கொள்ளக்கூடாது. அப்போதுதான் தமிழ்ச்சமூகத்திற்குத் தமிழ்மொழிப் பயன்பாடுகளில் வளர்ச்சிகளை அளிக்கமுடியும்.

0 கருத்துகள்:

கருத்துரையிடுக

 
Design by Free WordPress Themes | Bloggerized by Lasantha - Premium Blogger Themes | Hot Sonakshi Sinha, Car Price in India