திங்கள், 9 நவம்பர், 2015

தமிழும் மொழித்தொழில்நுட்பமும்

                    தமிழும் மொழித்தொழில்நுட்பமும்
                           
தமிழின் சிறப்பு

உலக மொழிகளில் தொன்மையும் தொடர்ச்சியும் வளர்ச்சியும் உடைய ஒரு மொழி தமிழ்மொழி என்பது மொழியாய்வு உலகம் ஏற்றுக்கொண்ட ஒரு உண்மை. பல ஆயிரம் ஆண்டுகளாகத் தமிழ்ச் சமூகத்தின் தேவைகளைப் பல முனைகளில் நிறைவேற்றிக் கொண்டிருக்கிற ஒரு வளர்ச்சியடைந்த மொழியாகத் தமிழ்மொழி திகழ்கிறது. தமிழ் மக்களின் அன்றாடக் கருத்தாடல் தேவைகளை மட்டுமன்றி, தனது பண்டை வரலாற்றில் தத்துவம், இலக்கியம், இலக்கணம், சித்த மருத்துவம் என்று பல துறைகளைச் சார்ந்த அறிஞர்களின் படைப்புகளையும் வெளிப்படுத்தி நின்றுள்ள ஒரு பயன்பாட்டுமொழியாகத் தமிழ் நீடிக்கிறது.

வரலாற்றில் எந்த ஒரு மொழியும் முதலில் பேச்சுமொழியாகவே தோன்றி நீடித்திருக்கமுடியும். பின்னர் அம்மொழி பேசும் சமூகத்தின் தேவையும் அறிவுத்திறன் வளர்ச்சியும் அம்மொழிக்கு எழுத்துவடிவத்தை அளித்து, எழுத்துமொழியாகவும் வளர்த்திருக்கமுடியும். அந்த வகையில் தமிழ்மொழியானது பல ஆயிரம் ஆண்டுகளுக்கு முன்னரே எழுத்துமொழியாகவும் வளர்ச்சியடைந்துள்ளது என்பது அனைவரும் ஏற்றுக்கொள்கிற ஒரு வரலாற்று உண்மையாகும்.

பேச்சுமொழியின் உயிரியல் அடிப்படை

மனிதகுல வரலாற்றில் மனித மூளையின் ஒரு வியக்கத்தக்க படைப்பேவிளைபொருளே- மனிதனின் இயற்கைமொழிகளாகும். மனிதர் அல்லாத ஏனைய உயிரினங்கள் பெற்றிராத ஒரு திறன் மொழித்திறனாகும். பிறக்கின்ற ஒரு குழந்தைக்கு அதனுடைய வளர்ச்சியில் நடக்கும்திறன் எவ்வாறு தானாகவே வளர்ச்சியடைகிறதோஅவ்வாறே மொழித்திறனும் வளர்ச்சியடைகிறது என்பது இன்றைய மொழியியல் அறிஞர்கள் நோம் சாம்ஸ்கி போன்றோர் கண்டறிந்துள்ள ஒரு மாபெரும் உண்மையாகும். மனித மூளையின் ஒரு உள்ளார்ந்த  திறனே மொழித்திறன் ( innate one)  ஆகும். தேவையான மூளை வளர்ச்சியும் செவித்திறனும் உடைய எந்த ஒரு குழந்தையும் தான் பிறந்து வளர்கிற சமூகத்தின் மொழியைதாய்மொழியை- குறைந்த அனுபவத்தில் குறைந்த காலத்தில் – ( கற்றுக்கொள்கிறது என்று சொல்வதைவிட) பெற்றுக்கொள்கிறது என்பது மொழியியல் அறிஞர் சாம்ஸ்கியின் கருத்தாகும். எனவே மொழித்திறன் என்பது உயிரியல் அடிப்படையில் அனைத்து மனிதர்களுக்கும் உள்ள ஒரு இயற்கைத் திறனாகும் ( Genetically given biological endowment).  

தொழில்நுட்பம்

கைகளையும் கால்களையும் இயற்கையாகப் பெற்றுள்ள மனிதன், தனது தேவைகளுக்காக அந்த உறுப்புகளுக்குத் துணையாக  வில், அம்பு போன்ற பல கருவிகளைப் படைத்துக்கொண்டான்வரலாற்று வளர்ச்சியில் தனது ஒவ்வொரு உறுப்புக்கும் துணையாகப் பல கருவிகளைப் படைத்துக்கொண்டு வருகிறான். இதன் பயனாக இன்று கண், காது, கை, கால் போன்ற நமது அனைத்து உடல் உறுப்புகளின் செயல்திறன்களும் வியக்கத்தகும்வகையில் வளர்ச்சியடைந்துள்ளன. வெறும் கண்ணால் பார்க்கமுடியாத நுண்ணுயிர்களையும் நுண்துகள்களையும் இன்று நுண்ணோக்கிமூலம் காணமுடிகிறது. பல கோடி கிலோமீட்டர் தூரத்தில் உள்ள கிரகங்களையும் நட்சத்திரங்களையும் இன்று தொலைநோக்கிமூலம் காணமுடிகிறது. தொலைவில் உள்ள குரல்களையும் நமது செவிக்குக் கொண்டுவந்து சேர்க்கும் கருவிகளை இன்று உருவாக்கியுள்ளோம். வெறும் கால்களால் தொலைதூரப் பயணத்தை வேகமாக மேற்கொள்ளமுடியாத சூழலில், இன்று பல ஆயிரக்கணக்கான கிலோமீட்டர் தொலைவை வாகனங்கள் உதவியால் குறைந்த நேரத்தில் குறைந்த உடல் உழைப்பில் மேற்கொள்ளமுடிகிறது. நடப்பது மட்டுமல்ல, இன்று நம்மால் பல ஆயிரக்கணக்கான கிலோமீட்டர் தொலைவை விமானங்கள்மூலம்  பறந்தும் கடக்கமுடிகிறது. பல இலட்சம் கிலோமீட்டர் தொலைவில் உள்ள கிரகங்களுக்கு விண்கலங்கள் உதவியுடனும் செல்லமுடிகிறது. வெறும் கைகளால் செய்ய இயலாத பணிகளையும் பல கருவிகளின் உதவியுடன் செய்யமுடிகிறது. மிக நுட்பமான அறுவைசிகிச்சைகளைக்கூட இயந்திரக் கைகளின் உதவியுடன் ( ரோபோட் ) மேற்கொள்ளமுடிகிறது.

இவ்வாறு மனித உடலின் ஐம்புலன் உறுப்புகளுக்கும் அவற்றின் பயன்பாடுகளை விரிவாக்கம் செய்வதற்குப் பல கருவிகளை இன்றைய தொழில்நுட்பம் உருவாக்கித் தந்துள்ளது என்பதை நாம் அறிவோம். இவையெல்லாம்   உயிரியல் அடிப்படையில் மனிதன் பெற்றவை அல்ல. மனிதன் தனது சமூக வரலாற்றில் உருவாக்கிக்கொண்டவையாகும். இவை மனிதனின் படைப்புகள் ஆகும். இவற்றையே தொழில்நுட்பம் என்று கூறுகிறோம்.

கணினித் தொழில்நுட்பம்

இயற்கை அளித்துள்ள மற்றொரு சிறந்த மனித உறுப்பு மூளையாகும். உலகில் உள்ள பொருள்களிலேயேகுறிப்பாக உயிர் உறுப்புகளில்மிகவும் சிக்கலான , வளர்ச்சியடைந்த உறுப்பு இதுவே. மூளையின் பாகங்களைக் கணினியின் பாகங்களுக்கும், அதில் பொதிந்துள்ள அறிவுத்திறனை மென்பொருளுக்கும் ஒப்பிடலாம். நமது அறிவுத்திறனுக்கும் பேச்சுத்திறனுக்கும் ( மென்திறன்கள்)  அடிப்படையான உறுப்பு இது. இந்த உறுப்பின் திறனையும் விரிவாக்கம் செய்யும் பல தொழில்நுட்பங்களை மனிதன் உருவாக்கி வந்துள்ளான். அறிவியல் கோட்பாடுகளும் வாய்பாடுகளும் இவற்றில் அடங்கும்மனிதனின் இந்த அறிவுத்திறத்தினால் இன்று அணுவையும் பிளக்கமுடிகிறது. அண்டத்தின் அனைத்துக் கிரகங்களையும் அணுகவும் முடிகிறது. பிற புலன் உறுப்புகளுக்குத் துணையாகக் கருவிகள் பயன்படுவதுபோலவே மனித மூளைக்கு உறுதுணையாகச் செயல்படவும் உருவாக்கப்பட்டுள்ள ஒரு தொழில்நுட்பக் கருவியே கணினி ஆகும்


                                         
எழுத்துகளின் தோற்றமும் மொழித்தொழில்நுட்பமும்

மனித மூளையின் சிறப்புத் திறனான மொழித்திறனையும் வளர்த்தெடுக்க மனித சமுதாயம் தொடர்ந்து முயன்றுவந்துள்ளது. அதன் ஒரு பயனே இயற்கைமொழிகளுக்கான வரிவடிவங்கள்எழுத்துகள் ஆகும். மொழியின் எழுத்து வடிவம்எழுத்து வழக்குஎன்பது மனிதன் உருவாக்கிய ஒரு மொழித்தொழில்நுட்பம் ( Language Technology)  – முதல் மொழித்தொழில்நுட்பமாகும். தனது கருத்துகளைக் காலம் கடந்து, இடம் கடந்து நிலைத்து வைக்க மனித சமுதாயம் உருவாக்கிய தொழில்நுட்பமே எழுத்து மொழியாகும். பானைகள், பாறைகள், கற்கள், ஓலைச்சுவடிகள் என்று பல ஊடகங்களில் மனிதன் தனது கருத்துகளைப் பொதிந்துவைக்கத் தொடங்கினான். அதன் இன்றைய வளர்ச்சியே , தட்டச்சு , அச்சு மற்றும் கணினி எழுத்துருக்கள் ஆகும்.

உலகில் இன்றும் பல மொழிகளுக்கு எழுத்துகள் கிடையாது. வரிவடிவம் கிடையாது. ஆனால் தமிழுக்குப் பல ஆயிரம் ஆண்டுகளுக்கு முன்னரே எழுத்துத் தொழில்நுட்பம் தோன்றி வளர்ந்துள்ளது என்பது தமிழர்கள் பெருமைப்படத்தக்க ஒரு சிறப்பாகும்.

மேற்கூறிய ஊடகங்களில் தமிழ்ச்சமுதாயம் தனது அறிவுச் செல்வங்களைத் தேக்கி வைத்ததினால்தான்  இன்று நம்மால் சங்க இலக்கியங்களையும் திருக்குறளையும் தொல்காப்பியத்தையும் பெற முடிந்துள்ளது. தமிழர் வரலாற்றைக் கல்வெட்டுகளின்மூலம் அறியமுடிகிறது. அதுபோல அச்சுத் தொழில்நுட்பத்தில் தமிழ் இடம் பெற்றதினால்தான் இன்று தமிழ் ஒரு உயர்ந்தகட்ட வளர்ச்சிநிலையை அடைந்துள்ளது. பாரதி விரும்பியபஞ்சபூதச் செயல்களின் நுட்பங்கள் கூறும் புத்தம் புதிய கலைகளும்கூட”  இன்று அடிமட்டக் கிராமங்களுக்கும் எட்ட முடிகிறது. “எட்டுத் திக்குக் கலைச் செல்வங்களும் யாவும் கொணர்ந்திங்கு சேர்க்கமுடிகிறது”.

ஒரு மொழியின் தொடர்ச்சியும் வளர்ச்சியும் அம்மொழியின் பயன்பாட்டு எல்லையின் அளவைப் பொறுத்தே உள்ளது. குறிப்பிட்ட மொழிச் சமுதாயம் தனது மொழியின் பயன்பாட்டு எல்லைகளை விரிவாக்க விரிவாக்க, அம்மொழியும் வளர்ச்சியடையும். அதன் பயனாக அச்சமுதாயமும் பயனடையும். சிறப்பு பெறும்.

மின்தமிழ் - மொழித்தொழில்நுட்பத்தின் அடுத்த கட்ட வளர்ச்சி

இன்றைய கணினி உலகில் கணினிப் பயன்பாட்டின் முக்கியத்துவம் அனைவரும் அறிந்ததே. குழந்தைகளிலிருந்து முதியவர்கள்வரை கணினியின் பயன்பாடுகளை நுகர்ந்துவருகின்றனர். செல்பேசி, கணினி என்று பலவகை மின்னணுச் சாதனங்களைப் பயன்படுத்திவருகின்றனர். இக்கருவிகளில் ஒரு மொழி இடம் பெற்றால்தான் அம்மொழியின் பயன்பாட்டு எல்லை விரிவடையும். வளர்ச்சியடையும். செல்பேசிவழி குறுஞ்செய்தி அனுப்புவதுமுதல் மொழிபெயர்ப்புவரை அனைத்து மொழிப்பயன்பாடுகளிலும் ஒரு மொழியின் பயன்பாடு நீடித்தால்தான் இன்றைய உலகில் ஒரு சிறந்த வாழும்மொழியாக அது நீடிக்கமுடியும். இல்லையென்றால் மெல்ல மெல்ல வழக்கிழந்தசிறப்பிழந்தமொழியாக மாறிவிடும்
கல்வெட்டில்ஓலைச்சுவடியில்அச்சில் நீடித்துவந்துள்ள தமிழ்மொழி இன்று கணினிபோன்ற மின்னணுச் சாதனங்களிலும் பயன்பாடுடைய ஒரு மொழியாக நீடிக்கவேண்டும். இதற்கான தொழில்நுட்பம் வளரவேண்டும். இதுவே தமிழ் மொழித்தொழில்நுட்பத்தின் இன்றைய கட்டத் தேவையாகும். இதற்கான திட்டத்தைக் கணினித்தமிழ் வளர்ச்சித் திட்டம் என்று அழைப்பதைவிட  மின்தமிழ் வளர்ச்சித்திட்டம் என்று அழைக்கலாம். ஏனென்றால் இச்சொற்றொடர் கணினியைமட்டும் உட்படுத்தாமல், செல்பேசி போன்ற பிற மின்னணுக் கருவிகளையும் உள்ளடக்கி நிற்கிறது.

மின்தமிழின் தொடக்கக்கட்ட வளர்ச்சி

சுமார் 30 ஆண்டுகளுக்கு முன்னர், கணினியில் தமிழை உள்ளீடு செய்வதற்கே வசதி கிடையாது. தமிழ் எழுத்துருக்கள், விசைப்பலகைகள் உருவாக்கப்படவில்லை. முதலில் தமிழை உள்ளீடு செய்வதற்கு வசதிகள் உருவாக்கப்பட்டால்தானே பிற பயன்பாடுகளை எண்ணிப் பார்க்கமுடியும். பின்னர் மெல்ல மெல்லத் தமிழ் உரையை ரோமன் எழுத்துகளில் உள்ளீடு செய்து, அதைத் தமிழ் எழுத்துருக்களில் மாற்றும் வசதி உருவாக்கப்பட்டது. ஆதமி போன்ற மென்பொருட்கள் உருவாக்கப்பட்டன. தமிழ்  எழுத்துகளுக்கான  எழுத்துருக்கள் உருவாக்கப்பட்டன.

அடுத்த கட்ட வளர்ச்சியாக , தமிழ் விசைப்பலகைகள் உருவாக்கப்பட்டன. இதன் பயனாக, நேரடியாகவே தமிழைக் கணினியில் உள்ளீடு செய்யும் வசதி ஏற்பட்டது. வோர்ட், வோர்டுபெர்ஃபெக்ட் , வோர்டு ஸ்டார், பேஜ்மேக்கர் , வெஞ்சுரா போன்ற மென்பொருட்களில் தமிழைப் பயன்படுத்தும் வாய்ப்புவளர்ச்சி ஏற்பட்டது.

இருப்பினும், தமிழ் எழுத்துருக்களைக் கணினியில் குறியேற்றம் செய்வதில் பல சிக்கல்கள் நீடித்தன. தமிழ் எழுத்துருக்களுக்கான குறியேற்றத்தில் தரப்படுத்தம் இல்லாமல் இருந்தது. ஒரு குறிப்பிட்ட தமிழ்மென்பொருளைக் கொண்டு தட்டச்சு செய்யப்பட்ட ஒரு தமிழ் ஆவணத்தை மற்றொரு தமிழ் மென்பொருளைக்கொண்டு வாசிக்கவோ, பதிப்பிக்கவோ இயலாத ஒரு நிலை நீடித்தது. இதற்கு அஸ்கி ( ASCII)  என்ற குறியேற்றமுறையும் ஒரு தடையாக அமைந்தது. தமிழ் விசைப்பலகைகளும் தரப்படுத்தப்படவில்லை.

இருப்பினும் தமிழில் இணையதளங்கள், வலைப்பூக்கள் தோன்ற ஆரம்பித்தன. அச்சில் இடம்பெற்ற அனைத்தும் கணினியிலும் இடம்பெற்றன. இந்த நூற்றாண்டின் தொடக்கத்தில் ஒருங்குறிக் குறியேற்றம் ( Unicode encoding)   பன்னாட்டுக் கணினிநிறுவனங்களின் வணிக முயற்சிகளினால் அறிமுகப்படுத்தப்பட்டன. தமிழுக்குத் தனியே ஒருங்குறி குறியேற்ற எண்கள் வழங்கப்பட்டது. இதன் பயனாக, தற்போது மின்னணுச் சாதனங்களில் தமிழை உள்ளீடு செய்வதற்கான தடை எதுவும் கிடையாது. செல்பேசியில்கூட தமிழைத் தற்போது உள்ளீடு செய்து, அனைத்துப் பயன்பாடுகளையும் மேற்கொள்ளலாம்.

மின்தமிழின் அடுத்த கட்ட வளர்ச்சி

கல்வெட்டு , ஓலைச்சுவடி, தட்டச்சு, அச்சுப்பொறி , கணினி ஆகியவற்றில் இதுவரை நாம் பார்த்த தமிழ் மொழித்தொழில்நுட்பமானது, தமிழ் உரை அல்லது பனுவலை அவற்றில் பொதிந்து அல்லது பதிந்து வைக்கப் பயன்பட்ட தொழில்நுட்பமே ஆகும். காலம் கடந்து, இடம் கடந்து, தமிழ்ப் பனுவல்களைச் சேமித்துவைக்கப் பயன்பட்ட மொழித்தொழில்நுட்பமேயாகும். கல்வெட்டாலோ அல்லது ஓலைச்சுவடியாலோ அல்லது அச்சாலோ அல்லது கணினியாலோ தங்கள்வழி அல்லது தங்கள்மீது பதியப்பட்ட தமிழ்ப்பனுவலை அல்லது உரையைப் புரிந்துகொள்ளமுடியாது. பதியப்பட்டவற்றைப் பாதுகாப்பாகச் சேமித்துமட்டுமே வைக்கமுடியும்.

இந்த வகை மொழித்தொழில்நுட்பத்தைத் தன்முனைப்பில்லா / செயலூக்கமில்லா   மொழித்தொழில்நுட்பம் ( Passive Language Technology) என்றழைக்கலாம். “தன்முனைப்பில்லாஅல்லதுசெயலூக்கமில்லாஎன்ற சொல்லாக்கத்தை இங்கு ஒரு கலைச்சொல்லாக மட்டுமே பார்க்கவேண்டும். இத்தொழில்நுட்பமானது ஒரு உருவத்தைச் சிலையில் செதுக்கிவைப்பது போன்றதாகும் இது. உருவம் பொறிக்கப்பட்டுள்ள அசையாச் சிலையானது தன்னைப் புரிந்துகொள்ளாது. நாம் சொல்வதைப் புரிந்துகொண்டும் செயல்படாது.

                                                   இயங்காச் சிலை


                                           இயங்கும் இயந்திர மனிதன்                        


கணினியானது தன்மீது பதியப்பட்ட தமிழ் உரையை நாம் புரிந்துகொள்வதுபோல புரிந்துகொண்டால், புரிந்துகொண்டு செயல்பட்டால் , அதுவே தன்முனைப்புள்ள அல்லது செயலூக்கமுள்ள மொழித்தொழில்நுட்பமாகும் ( Active Language Technology). இது ஒரு இயந்திர மனிதன் போன்றதாகும். இயந்திர மனிதன் ஏதோ ஒரு வகையில் நாம் சொல்வதைப் புரிந்துகொண்டு செயல்படுகிறான் அல்லவா, அதுபோல  நாம் சொல்வதைப் புரிந்துகொண்டு செயல்படும் மொழித்தொழில்நுட்பம் இதுவாகும். .  இந்த வகை மொழித்தொழில்நுட்பமும் தற்போது  ஆங்கிலம், ஜெர்மன் போன்ற மேலைநாட்டு மொழிகளுக்கு உருவாக்கப்பட்டுள்ளது.

சொல்லாளர் முதல் இயந்திர மொழிபெயர்ப்புவரை

எம் எஸ் வோர்டு போன்ற ஆங்கிலச் சொல்லாளர் மென்பொருட்களைக்கொண்டு ஆங்கில உரையைத் தட்டச்சு செய்யும்போது, எழுத்துப்பிழைகள், இலக்கணப் பிழைகள் இருந்தால் உடனே அவை கண்டறியப்பட்டு, சிவப்புக் கோடு இடப்பட்டுக் காட்டப்படுகின்றன. நாம் உடனே அவற்றைத் திருத்திக்கொள்ள அந்த மென்பொருட்கள் சரியான சொற்களை அளிப்பதன்மூலம் உதவியும் செய்கின்றன. அதாவது, மொழி ஆசிரியர் செயல்படுவதுபோன்று இந்த மென்பொருள்களும் செயல்படுகின்றன. ஆசிரியர் பெற்றிருக்கிற மொழி அறிவை இந்த மென்பொருட்களும் பெற்றிருப்பதால், இவ்வாறு செய்யமுடிகின்றது. தானியங்கு சொற்பிழை திருத்தி, இலக்கணப்பிழை திருத்திகள் இவற்றில் இடம் பெற்றுள்ளன.

டிராகன் போன்ற சில மென்பொருட்கள் நாம் ஆங்கிலத்தில் கணினிமுன் பேசினாலே போதும்,  அதுவே கணினியில் தட்டச்சு செய்துவிடுகிறது. இதைப் பேச்சுஎழுத்து மாற்றி ( Automatic Speech Recognizer – ASR)  என்று அழைக்கின்றனர். இதுபோன்று, கணினியில் உள்ளதை அப்படியே நமக்கு வாசித்துக் காட்டும் மென்பொருட்களும் உள்ளன. இவற்றை எழுத்துபேச்சு மாற்றி ( Text to Speech – TTS)  என்று அழைக்கின்றனர். இதையும் தாண்டி, சில பக்கங்களைக் கணினியில் உள்ளீடு செய்தால், அவற்றில் உள்ள கருத்துகளைப் புரிந்துகொண்டு, நமக்குக் கூறும் மென்பொருட்களும் இருக்கின்றன. இதைப் பனுவல் சுருக்கக் கருத்துருவாக்கம் ( Text Summarization)  என்று அழைக்கின்றனர். தற்போது ஒரு மொழியில் உள்ள உரை அல்லது பனுவலை மற்றொரு மொழியில் மொழிபெயர்த்துத் தரும் மென்பொருளை உருவாக்குவதற்கான முயற்சியும்  ( Machine Translation – MT) நடைபெற்றுவருகின்றன.

இவையெல்லாம் மேலைநாட்டு மொழிகளுக்கு எவ்வாறு சாத்தியமாகி உள்ளன? அம்மொழிகளின் சொற்களஞ்சிய அறிவும், இலக்கண அறிவும் கணினிக்கு நிரல்களாக உருவாக்கப்பட்டு கொடுக்கப்பட்டுள்ளன. எனவே, நமது மூளை எவ்வாறு மொழியைப் புரிந்துகொண்டு செயல்படுகிறதோ, அவ்வாறே கணினியும் புரிந்துகொண்டு செயல்படுகிறது. நமது மூளைக்குள் நமது மொழியின் அறிவு இருப்பதால்தான் மூளைக்கு நாம் பேசுவதும், எழுதுவதும் புரிகிறது ; நாம் நினைக்கும் கருத்துகளை மொழியில் வெளிப்படுத்தவும் முடிகிறது. இந்த மொழியறிவு கணினிக்கு நிரல்களாகக் கொடுக்கப்படவேண்டும். அப்போதுதான் மேற்சொன்ன மொழித்தொழில்நுட்பம் வளரும்.

தமிழில் முடியுமா?

மேற்கூறிய மொழித்தொழில்நுட்பம் எல்லாம் தமிழ்மொழிக்கும் செயல்படுத்தப்படவேண்டும். அப்போதுதான் தமிழின் பயன்பாட்டு எல்லை விரிவடையும். தமிழ்மொழி அறிவைக் கணினிக்குப் புரியக்கூடிய வகையில்கணித முறையில்- அளித்தால்தான் இப்பணி வெற்றியடையமுடியும். அதற்கான துறையாகக் கணினிமொழியியல் மற்றும் மொழித்தொழில்நுட்பத்துறை  ( Computational Linguistics and Language Technology) என்ற ஒரு துறை இன்று வளர்ந்துவருகிறது. அத்துறை அறிவின் அடிப்படையில் தமிழ்மொழி ஆய்வு நடைபெற்றால்தான் மின்தமிழ்கணினித்தமிழ்வளர்ச்சியடையும்.  

தொல்காப்பியம், நன்னூல் போன்ற இலக்கண நூல்களும் இன்றைய மொழியியலார் ஆய்வுகளும் மனித மூளைக்காக உருவாக்கப்பட்டவையாகும். அவற்றை அப்படியே கணினிக்குக் கொடுத்தால், கணினியால் புரிந்துகொள்ளமுடியாது. கணினியில் அமைந்துள்ள மின்னணுச் சில்லுகளுக்குப் புரியக்கூடிய கணினிநிரல்களாக ( program )  அவை மாற்றப்படவேண்டும். மனித மூளைக்காக உருவாக்கப்பட்டுள்ள இன்றைய தமிழ் அகராதிகள் எல்லாம் கணினிக்குப் புரியக்கூடிய வகையில் மின்னகராதிகளாக மாற்றப்படவேண்டும். மனித மூளையின் திறன் வேறு. கணினியின் திறன் வேறு. பின்புல அறிவைக்கொண்டு நமது மூளையால் ஒரு கருத்தைச் சுருங்கச்சொன்னாலும் மறைமுகமாகச் சொன்னாலும் புரிந்துகொள்ளமுடியும். ஆனால் கணினியால் அவ்வாறு முடியாது. அதற்கு எதையும் தெளிவாக, முறையாக, நேரடியாகக் கூறவேண்டும். எனவே தமிழ் இலக்கணமும் அகராதியும் கணினியின் புரிந்துகொள்ளும் முறைக்கு ஏற்ற  வடிவில் கொடுக்கப்படவேண்டும்.  

இன்றைய தலையாய பணி

இன்று மின்தமிழ் வளர்ச்சியில் தமிழை உள்ளீடு செய்வதற்கான பணிகள் பெருமளவில் வெற்றிபெற்றுள்ளன. தமிழ் எழுத்துருக்கள், விசைப்பலகைகள் உருவாக்கத்தில் நீடித்த பல சிக்கல்கள் தீர்க்கப்பட்டுவிட்டன. அதையொட்டி, தமிழ் விக்கிபீடியா, வலைப்பூக்கள், இணையதளங்கள் பெருகிக்கொண்டிருக்கின்றன. இவையெல்லாம் வரவேற்கத்தக்க, நாம் மகிழ்ச்சியடையவேண்டிய தமிழ்ப்பணிகள் என்பதில் சிறிதும் ஐயமில்லை. ஆனால் இவையெல்லாம் கணினித்தமிழ் வளர்ச்சியின் முதல்கட்டமே ஆகும். முன்னர்க் கூறிய தன்முனைப்பில்லாசெயலூக்கமில்லா மொழித்தொழில்நுட்பமாகும். இந்தத் தேவையான  முதல் கட்டத்தை நாம் தற்போது தாண்டிவிட்டோம். இனி அடுத்த கட்ட வளர்ச்சியான தன்முனைப்புள்ளசெயலூக்கமுள்ள மொழித்தொழில்நுட்பத்தைநோக்கி நம் பணி அமையவேண்டும்.

நாம் கணினி உட்பட பல மின்னணுச் சாதனங்களில் ( எழுத்துவழியாகவோ அல்லது பேச்சுவழியாகவோ) உள்ளீடு செய்கிற தமிழ்ப் பனுவலை அல்லது உரையை அவை புரிந்துகொண்டு செயல்படவேண்டும். சொற்பிழை திருத்தி முதல் இயந்திரமொழிபெயர்ப்புவரை தமிழ்மொழிக்கு மென்பொருட்கள் உருவாக்கப்படவேண்டும். அப்போதுதான் தமிழ் உலகளவில் வளர்ச்சியடைந்த பிறமொழிகளுக்கு இணையாக வலம் வரமுடியும். “  மறைவாக நமக்குள்ளே பழங்கதைகள் சொல்வதிலோர் மகிமை இல்லைஎன்ற பாரதியின் கூற்றை உணர்ந்து, மின்னணுக் கருவிகளுக்கான மொழித்தொழில்நுட்பம்மெத்த வளருது மேற்கேஅந்த மேன்மைக் கலைகள் தமிழினில் இல்லை “  என்று எவரும் சொல்லமுடியாத அளவிற்கு அம்மொழித்தொழில்நுட்பங்கள் யாவற்றையும் தமிழுக்குக் கொணர்ந்து இங்கு சேர்ப்பது நமது இன்றைய தலையாய தாய்மொழிக் கடமையாகும். முத்தமிழானது இனி மென்தமிழாகவும்மின்தமிழாகவும்மலரவேண்டும், நிச்சயமாக மலரும்.      

( இக்கட்டுரை எழுதுவதற்குத் தூண்டுதலாக அமைந்த நூல் - "Language, Technology and Society " by Richard Sproat  - 2010)


     

2 கருத்துகள்:

ந.தெய்வ சுந்தரம் சொன்னது…
இந்த கருத்து ஆசிரியரால் அகற்றப்பட்டது.
ந.தெய்வ சுந்தரம் சொன்னது…

அன்புள்ள ஐயா!
கட்டுரையைக் கருத்தூன்றி முழுவதுமாகப் படித்தேன். Language Technology பற்றிய பொதுவான கருத்துகளையும், தமிழின் இன்றைய தேவைகளையும் சிறப்பாக விளக்கியுள்ளீர்கள். மிக்க நன்றி.
ப.பாண்டியராஜா

கருத்துரையிடுக

 
Design by Free WordPress Themes | Bloggerized by Lasantha - Premium Blogger Themes | Hot Sonakshi Sinha, Car Price in India