கணினியின்
எதிர்கால வளர்ச்சியும் தமிழின் சிறப்பும்...
------------------------------------------------------------------------------------------------------------------------------------------------------------
நண்பர் திரு. மாலன் அவர்களும் நண்பர் திரு.
இராச. தியாகராசன் அவர்களும் கூறியுள்ள கணினித்திறன் வளர்ச்சி உறுதியாக
எதிர்காலத்தில் ஏற்படும் என்பதில் ஐயம் இல்லை.
கணினியானது நாம் செய்யும் தவறுகளைத் தவறுகள்
என்று தெரிந்துகொள்ளவும் அவற்றிற்கு மாற்றாகச் சரியான தொடர்களை அளிக்கவும் முதலில்
நாம் கணினிக்குச் சரியான தரவுகளை (அகரமுதலி, இலக்கணம் ) அளிப்பது தேவையான
ஒன்றாகும். அதற்குத் தமிழின் முறையான இலக்கணமும் அகரமுதலியும் தேவை.
அவற்றைக்கொண்டுதான் நாம் கணினியைப் பயிற்றுவிக்க இயலும்.
கடந்த பல ஆண்டு ஆய்வுகளைத் தொடர்ந்து, எங்கள் குழுவினர் தானியங்கு பரிந்துரை (auto-suggestion) கருவி ஒன்றை உருவாக்கியுள்ளோம். தற்போது கூகில் போன்றவற்றில் உள்ள
இதுபோன்ற கருவிகள் ... அவற்றின் தரவுத்தளங்களில் காணப்படுகிற தொடர்களை
அடிப்படையாகவும் புள்ளியியலை அடிப்படையாகவும் கொண்டவை. எடுத்துக்காட்டாக ,
''படி'' என்று தட்டச்சு செய்தவுடன் ''படித்தான், படித்தாள், படித்தார்,
படித்தால் '' என்ற தொடர்கள் தோன்றும்.
அவற்றில் நாம் தட்டச்சு செய்ய விரும்பிய தொடர் இருந்தால், அதைத்
தேர்ந்தெடுத்துக் கொள்ளலாம். அதாவது முழுத்தொடரை நாம் தட்டச்சு செய்யவேண்டாம்.
ஆனால் ''படித்துக்கொண்டிருக்கவேண்டும்''
என்ற ஒரு நீண்ட தொடரை நாம் தட்டச்சு செய்ய விரும்பியிருந்தால்,
அது கணினியில் தோன்றாது. புள்ளியியல் - குறிப்பாக Probabilistic
statistics துறை அறிவைப் பயன்படுத்தி, கணினி
பரிந்துரை அளிக்கிறது.
இங்குச் சிக்கல் என்னவென்றால் ஆங்கிலம் போன்ற
மொழிகளுக்கு இதுபோன்ற தானியங்கு பரிந்துரை உருவாக்கம் சற்று எளிது. ஆனால் தமிழ்
போன்ற மொழிகளில் ஒரு வினைச்சொல்லுக்குப் பல லட்சம் விகுதி ஏற்ற வடிவங்கள் உண்டு.
ஒரு பெயர்ச் சொல்லுக்கும் அப்படியே. ஆனால் அனைத்தும் தெளிவான, குறிப்பிட்ட விதிகளின் அடிப்படையில்தான் உருவாகுகின்றன. இவை அனைத்தையும்
நாம் முதலில் உருவாக்கி, அவற்றைத் தானியங்கு பரிந்துரைக்கான
தரவுத்தளத்தில் ஏற்றவேண்டிய தேவை உள்ளது.
அதற்குப் பதிலாக, தட்டச்சு செய்யும்போதே அவற்றை உருவாக்கிக்கொள்ளும் தொடர் உருவாக்கிக்
கருவி இருந்தால் சிறப்பு. அந்த அடிப்படையில் தற்போது நாங்கள் தமிழுக்கு இந்தக்
கருவியை உருவாக்கியுள்ளோம். எந்த சொல் வடிவம் என்றாலும் இந்தக் கருவி அதற்குரிய
தேவையான அனைத்து வடிவங்களையும்... நாம் தட்டச்சு செய்யச் செய்ய. (in
real-time).. கணினி அளிக்கும்வகையில் இந்தக் கருவி அமைகிறது.
இதற்குத் தேவையான சரியான தமிழ் அகரமுதலியையும் சரியான இலக்கணத்தையும் அவற்றைப்
பயன்படுத்தித் தொடர்களை உருவாக்கும் தொடர் உருவாக்கிக் கருவியையும் தற்போது
உருவாக்கியுள்ளோம்.
இந்தப் பணியை வெற்றிகரமாகச் செய்துமுடிக்க
எங்களுக்கு தமிழ்ச் சொல் இலக்கணத்தைப்பற்றிய - குறிப்பாகப் புணர்ச்சி, சாரியை, ஆக்க விகுதிகள், திரிபு
விதிகள் , அவை செயல்படும் முறை ஆகியவைபற்றிய - மிகத் தெளிவான
அறிவு தேவைப்பட்டது. பல சிக்கல்கள் எழுந்தன. இவற்றையெல்லாம் ஓரளவிற்குத்
தீர்த்துள்ளோம்.
இங்கு நான் குறிப்பிட விரும்புவது...
இப்பணியில் ஈடுபட விரும்புகிறவர்களுக்கு முதலில் முறையான இலக்கணப் பயிற்சியும், கணினியியல் தொழில்நுட்பமும் (கணினிமொழியியல், மொழித்தொழில்நுட்பம்)
தேவை.
தற்போதைய
எங்கள் ''தானியங்கு பரிந்துரை'' மென்பொருள் கருவி எடுத்துக்காட்டுவது .... தமிழ்ச்சொல் இலக்கணவிதிகள் 100
விழுக்காடு கணித அடிப்படையில் அமைந்துள்ளன என்ற உண்மையேயாகும்.
இல்லையென்றால் இந்தக் கருவியை உருவாக்க இயலாது. இதனையே தமிழ்மொழியின் சிறப்பாகவும்
எங்கள் ஆய்வின் சிறப்பாகவும் நான் கருதுகிறேன்.
0 கருத்துகள்:
கருத்துரையிடுக