செவ்வாய், 9 மே, 2023

செய்யறிவுத்திறன் மென்பொருள்களும் தமிழ்மொழியியல் ஆய்வும்

 செய்யறிவுத்திறன் மென்பொருள்களும் தமிழ்மொழியியல் ஆய்வும் . . . -----------------------------------------------------------------------------------------------------------------

செய்யறிவுத் திறன்கொண்ட ( இந்தத் தொடரை நண்பர் சுந்தர் இலட்சுமணன் அவர்களிடமிருந்து பெற்றேன்) சேட்ஜிபிடி தனது மொழிச்செயல்பாட்டுக்கு நிகழ்தகவுப் புள்ளியியலைமட்டுமே அடிப்படையாகக் கொண்டுள்ளதா அல்லது மொழியியல் ஆய்வையும் உட்படுத்திச் செயல்படுகிறதா என்ற ஒரு ஐயத்தை சேட்ஜிபிடி-யிடமே கேட்டேன்.
அது அளித்த பதிலின்படி மொழியியல் அறிவையும் உட்படுத்தித்தான் அது செயல்படுகிறது என்று தெரியவருகிறது.
ந. தெய்வ சுந்தரம்
------------------------------------------------------------------------
Whether ChatGPT Language modelling is purely depending on Probabilistic statistics or it uses the linguistic knowledge wherever it is necessary?
சேட்ஜிபிடி-யின் பதில்
--------------------------------------------------------------------------
ChatGPT's language modelling is a combination of probabilistic statistics and linguistic knowledge.
At its core, ChatGPT is based on a neural network architecture that has been trained on massive amounts of text data. During training, the model is exposed to patterns and structures within language and learns to predict the most likely word to come next given a sequence of previous words. This approach is known as probabilistic language modelling and is based on the statistical properties of language.
However, the model's ability to make accurate predictions also relies on its ability to understand the underlying linguistic structure of language. The neural network architecture that underlies ChatGPT is designed to capture and model syntactic, semantic, and pragmatic information in language. This allows the model to go beyond simple statistical patterns and make more sophisticated predictions based on its understanding of the meaning and context of the text.
So, while probabilistic statistics play a central role in ChatGPT's language modelling, the model also relies on its knowledge of linguistic structures and patterns to make accurate predictions.
--------------------------------------------------------------------
செய்யறிவுத்திறன்பற்றி நேற்று நான் முகநூலில் இட்ட பதிவுபற்றி. அந்த ஆய்வில் ஈடுபட்டுவரும் எனது நண்பரும் கணினியியல் அறிஞருமான திரு. சுந்தர் இலட்சுமணன் அவர்களின் கருத்துக்காக மிக ஆவலுடன் எதிர்பார்த்திருந்தேன். தவறாக நான் ஏதாவது புரிந்திருக்கிறேனா என்பதை அவர்மூலம் தெரிந்துகொள்ள விரும்பினேன். என்னுடைய எதிர்பார்ப்பு வீணாகவில்லை. தனது தெளிவான பதிலை இட்டிருந்தார். அவருக்கு எனது நன்றி.
அவர் தன் பதிவில் கீழ்க்கண்டவாறு பதிவிட்டிருந்தார்:
''மிக நன்றாக எழுதியிருக்கிறீர்கள் , ஐயா! எனினும் மொழியியல் அடிப்படையிலான ஆய்வு அறவே தேவைப்படாது என்று நான் நினைக்கவில்லை. சில இடங்களில் புள்ளியியல்வழி மாதிரிகளை மேம்படுத்த உதவுமென்றே தோன்றுகிறது. மொழியியல் ஆய்வுகளும் இந்தச் செய்யறிவு மாதிரிகளைப் பயன்படுத்திக் கொள்ளலாம்''.
நன்றி நண்பரே. தாங்கள் கூறியிருக்கிறமாதிரி, ஆங்கிலம் போன்ற மொழிகளுக்கு மொழியியல் அடிப்படையிலான ஆய்வுகள் நிறைய நடைபெற்றுள்ளதால், அவற்றையும் பயன்படுத்தித்தான் கூகுள், மைக்ரோசாஃப்ட் போன்ற நிறுவனங்கள் தங்கள் செய்யறிவு மென்பொருள்களை உருவாக்கியுள்ளார்கள். எனவே ஆங்கிலம் தொடர்பான பல வினாக்களுக்கும் ஐயங்களுக்கும் அவற்றால் சரியான பதில்களை அளிக்கமுடிகிறது.
ஆனால் தமிழ்மொழிக்கு அதுபோன்ற மொழியியல் ஆய்வுகள் - குறிப்பாக, கணினிமொழியியல் நோக்கிலான ஆய்வுகள் - இல்லாததால், தமிழ்மொழி தொடர்பான வினாக்களுக்குப் பல இடங்களில் அவை தவறு செய்கின்றன. எனவே இது அவற்றின் தவறு என்று கூறுவதைவிட, தமிழ் மொழியியல் ஆய்வின் பற்றாக்குறையே என்று கூறலாம். ஆங்கிலம் - தமிழ் மொழிபெயர்ப்புக்களில் அதனால்தான் நிறைவு இல்லை என்று கூறலாம்.
எனவே, தமிழுக்குத் தேவையான அனைத்தையும் கூகுள், மைக்ரோசாப்ட் நிறுவனங்களே கொடுத்துவிடும்; எனவே மொழியியல் நோக்கிலான தமிழ்மொழி ஆய்வு தேவையில்லை என்று கருதுவது மிகத் தவறானது என்பதைத் தமிழுலகம் புரிந்துகொள்ளவேண்டும்.
மேலும் தமிழ்மொழியியல் ஆய்வுக்கும் செய்யறிவுத்திறன் மென்பொருள்களின் பயன்பாட்டைப் பயன்படுத்திக்கொள்ளவேண்டும்.

0 கருத்துகள்:

கருத்துரையிடுக

 
Design by Free WordPress Themes | Bloggerized by Lasantha - Premium Blogger Themes | Hot Sonakshi Sinha, Car Price in India