புதன், 30 ஜூன், 2021

கணினியின் எதிர்கால வளர்ச்சியும் தமிழின் சிறப்பும்...

 

கணினியின் எதிர்கால வளர்ச்சியும் தமிழின் சிறப்பும்...

------------------------------------------------------------------------------------------------------------------------------------------------------------

நண்பர் திரு. மாலன் அவர்களும் நண்பர் திரு. இராச. தியாகராசன் அவர்களும் கூறியுள்ள கணினித்திறன் வளர்ச்சி உறுதியாக எதிர்காலத்தில் ஏற்படும் என்பதில் ஐயம் இல்லை.

கணினியானது நாம் செய்யும் தவறுகளைத் தவறுகள் என்று தெரிந்துகொள்ளவும் அவற்றிற்கு மாற்றாகச் சரியான தொடர்களை அளிக்கவும் முதலில் நாம் கணினிக்குச் சரியான தரவுகளை (அகரமுதலி, இலக்கணம் ) அளிப்பது தேவையான ஒன்றாகும். அதற்குத் தமிழின் முறையான இலக்கணமும் அகரமுதலியும் தேவை. அவற்றைக்கொண்டுதான் நாம் கணினியைப் பயிற்றுவிக்க இயலும்.

கடந்த பல ஆண்டு ஆய்வுகளைத் தொடர்ந்து, எங்கள் குழுவினர் தானியங்கு பரிந்துரை (auto-suggestion) கருவி ஒன்றை உருவாக்கியுள்ளோம். தற்போது கூகில் போன்றவற்றில் உள்ள இதுபோன்ற கருவிகள் ... அவற்றின் தரவுத்தளங்களில் காணப்படுகிற தொடர்களை அடிப்படையாகவும் புள்ளியியலை அடிப்படையாகவும் கொண்டவை. எடுத்துக்காட்டாக , ''படி'' என்று தட்டச்சு செய்தவுடன் ''படித்தான், படித்தாள், படித்தார், படித்தால் '' என்ற தொடர்கள் தோன்றும். அவற்றில் நாம் தட்டச்சு செய்ய விரும்பிய தொடர் இருந்தால், அதைத் தேர்ந்தெடுத்துக் கொள்ளலாம். அதாவது முழுத்தொடரை நாம் தட்டச்சு செய்யவேண்டாம்.

ஆனால் ''படித்துக்கொண்டிருக்கவேண்டும்'' என்ற ஒரு நீண்ட தொடரை நாம் தட்டச்சு செய்ய விரும்பியிருந்தால், அது கணினியில் தோன்றாது. புள்ளியியல் - குறிப்பாக Probabilistic statistics துறை அறிவைப் பயன்படுத்தி, கணினி பரிந்துரை அளிக்கிறது.

இங்குச் சிக்கல் என்னவென்றால் ஆங்கிலம் போன்ற மொழிகளுக்கு இதுபோன்ற தானியங்கு பரிந்துரை உருவாக்கம் சற்று எளிது. ஆனால் தமிழ் போன்ற மொழிகளில் ஒரு வினைச்சொல்லுக்குப் பல லட்சம் விகுதி ஏற்ற வடிவங்கள் உண்டு. ஒரு பெயர்ச் சொல்லுக்கும் அப்படியே. ஆனால் அனைத்தும் தெளிவான, குறிப்பிட்ட விதிகளின் அடிப்படையில்தான் உருவாகுகின்றன. இவை அனைத்தையும் நாம் முதலில் உருவாக்கி, அவற்றைத் தானியங்கு பரிந்துரைக்கான தரவுத்தளத்தில் ஏற்றவேண்டிய தேவை உள்ளது.

அதற்குப் பதிலாக, தட்டச்சு செய்யும்போதே அவற்றை உருவாக்கிக்கொள்ளும் தொடர் உருவாக்கிக் கருவி இருந்தால் சிறப்பு. அந்த அடிப்படையில் தற்போது நாங்கள் தமிழுக்கு இந்தக் கருவியை உருவாக்கியுள்ளோம். எந்த சொல் வடிவம் என்றாலும் இந்தக் கருவி அதற்குரிய தேவையான அனைத்து வடிவங்களையும்... நாம் தட்டச்சு செய்யச் செய்ய. (in real-time).. கணினி அளிக்கும்வகையில் இந்தக் கருவி அமைகிறது. இதற்குத் தேவையான சரியான தமிழ் அகரமுதலியையும் சரியான இலக்கணத்தையும் அவற்றைப் பயன்படுத்தித் தொடர்களை உருவாக்கும் தொடர் உருவாக்கிக் கருவியையும் தற்போது உருவாக்கியுள்ளோம்.

இந்தப் பணியை வெற்றிகரமாகச் செய்துமுடிக்க எங்களுக்கு தமிழ்ச் சொல் இலக்கணத்தைப்பற்றிய - குறிப்பாகப் புணர்ச்சி, சாரியை, ஆக்க விகுதிகள், திரிபு விதிகள் , அவை செயல்படும் முறை ஆகியவைபற்றிய - மிகத் தெளிவான அறிவு தேவைப்பட்டது. பல சிக்கல்கள் எழுந்தன. இவற்றையெல்லாம் ஓரளவிற்குத் தீர்த்துள்ளோம்.

இங்கு நான் குறிப்பிட விரும்புவது... இப்பணியில் ஈடுபட விரும்புகிறவர்களுக்கு முதலில் முறையான இலக்கணப் பயிற்சியும், கணினியியல் தொழில்நுட்பமும் (கணினிமொழியியல், மொழித்தொழில்நுட்பம்) தேவை.

தற்போதைய எங்கள் ''தானியங்கு பரிந்துரை'' மென்பொருள் கருவி எடுத்துக்காட்டுவது .... தமிழ்ச்சொல் இலக்கணவிதிகள் 100 விழுக்காடு கணித அடிப்படையில் அமைந்துள்ளன என்ற உண்மையேயாகும். இல்லையென்றால் இந்தக் கருவியை உருவாக்க இயலாது. இதனையே தமிழ்மொழியின் சிறப்பாகவும் எங்கள் ஆய்வின் சிறப்பாகவும் நான் கருதுகிறேன்.

0 கருத்துகள்:

கருத்துரையிடுக

 
Design by Free WordPress Themes | Bloggerized by Lasantha - Premium Blogger Themes | Hot Sonakshi Sinha, Car Price in India