கணினிமொழியியலின் இன்றைய வளர்ச்சியும் தமிழும்---------------------------------------------------------------------------------------------------------------------------எனது உரையின் தொடக்கத்தில் மொழிபற்றிய மூன்றுவகையான ஆய்வுப் பிரிவுகளைத் தெளிவுபடுத்திக்கொள்ள விரும்புகிறேன். முதலாவது, ஒரு இயற்கைமொழியின் இலக்கணம்; இரண்டாவது, இயற்கைமொழிகள்பற்றிய பொது அறிவியலான மொழியியல்; மூன்றாவது, இயற்கைமொழிகளைக் கணினியானது புரிந்துகொண்டு, மனிதர்கள் மேற்கொள்கிற மொழிச்செயல்பாடுகளை மேற்கொள்வதற்கான வழிமுறைகளைப்பற்றிய அறிவியலான கணினிமொழியியல். எந்தவொரு இயற்கைமொழிக்கும் ஒரு கட்டமைப்பு உண்டு. குறிப்பிட்ட மொழியின் அகராதிச் சொற்களின் பொருண்மை, அச்சொற்களைக்கொண்டு மொழிவழிச்செயல்பாடுகளை மேற்கொள்வதற்கான கருத்தாடலை மேற்கொள்வதற்கான வரைமுறைகள் ஆகியவைபற்றிய ஒரு பொது உடன்பாடு உண்டு. அவ்வாறு இல்லையென்றால்...
புதன், 16 அக்டோபர், 2024
ஒரு ஐயம் . . . செயற்கைச் செய்யறிவுத்திறனில் (Artificial Intelligence - AI) அமைந்துள்ள "பெரிய மொழிமாதிரி (Large Language Model - LLM)" பற்றி !
ஒரு ஐயம் . . . செயற்கைச் செய்யறிவுத்திறனில் (Artificial Intelligence - AI) அமைந்துள்ள "பெரிய மொழிமாதிரி (Large Language Model - LLM)" பற்றி !--------------------------------------------------------------------------நான் தமிழ்மொழி ஆய்வாளன் . . . மொழியியல் ஆய்வாளன். கணினியியல் துறையைச் சார்ந்தவன் இல்லை. எனவேதான் இந்த 'அறியா வினா' ஐயம். மொழியியல் அறிஞரான சோம் சாம்ஸ்கி, ஒரு குழந்தை பிறக்கும்போது, அதனுடைய மூளையில் எந்தவொரு இயற்கைமொழியையும் பெற்றுக் கொள்ளும் திறன் உள்ள ''மொழி ஈட்டும் பொறி (Language Acquisition Device - LAD) ஒன்று அமைந்துள்ளது. இதற்குள அனைத்து மனித மொழிகளுக்கும் உள்ள பொதுவான இலக்கணம் (Universal Grammar - UG) ஒன்று உள்ளது. குழந்தையானது இதனைப் பயன்படுத்தி, தனக்குக் கிடைக்கிற சுற்றுப்புற மொழித்தரவுகளைக் கொண்டு, ஒரு குறிப்பிட்ட மொழியின் அமைப்பைக் (சொல்லறிவு, இலக்கண அறிவு) குறைந்த...