தமிழும் மொழித்தொழில்நுட்பமும்
தமிழின்
சிறப்பு
உலக மொழிகளில் தொன்மையும்
தொடர்ச்சியும் வளர்ச்சியும் உடைய ஒரு மொழி தமிழ்மொழி என்பது மொழியாய்வு உலகம் ஏற்றுக்கொண்ட
ஒரு உண்மை. பல ஆயிரம் ஆண்டுகளாகத் தமிழ்ச்
சமூகத்தின் தேவைகளைப் பல முனைகளில் நிறைவேற்றிக் கொண்டிருக்கிற ஒரு வளர்ச்சியடைந்த
மொழியாகத் தமிழ்மொழி திகழ்கிறது. தமிழ்
மக்களின் அன்றாடக் கருத்தாடல் தேவைகளை மட்டுமன்றி, தனது
பண்டை வரலாற்றில் தத்துவம், இலக்கியம்,
இலக்கணம்,
சித்த
மருத்துவம் என்று பல துறைகளைச் சார்ந்த அறிஞர்களின் படைப்புகளையும் வெளிப்படுத்தி நின்றுள்ள
ஒரு பயன்பாட்டுமொழியாகத் தமிழ் நீடிக்கிறது.
வரலாற்றில் எந்த ஒரு மொழியும்
முதலில் பேச்சுமொழியாகவே தோன்றி நீடித்திருக்கமுடியும். பின்னர்
அம்மொழி பேசும் சமூகத்தின் தேவையும் அறிவுத்திறன் வளர்ச்சியும் அம்மொழிக்கு எழுத்துவடிவத்தை
அளித்து, எழுத்துமொழியாகவும் வளர்த்திருக்கமுடியும்.
அந்த
வகையில் தமிழ்மொழியானது பல ஆயிரம் ஆண்டுகளுக்கு முன்னரே எழுத்துமொழியாகவும் வளர்ச்சியடைந்துள்ளது
என்பது அனைவரும் ஏற்றுக்கொள்கிற ஒரு வரலாற்று உண்மையாகும்.
பேச்சுமொழியின் உயிரியல் அடிப்படை
மனிதகுல வரலாற்றில் மனித
மூளையின் ஒரு வியக்கத்தக்க படைப்பே – விளைபொருளே-
மனிதனின்
இயற்கைமொழிகளாகும். மனிதர் அல்லாத ஏனைய உயிரினங்கள்
பெற்றிராத ஒரு திறன் மொழித்திறனாகும். பிறக்கின்ற
ஒரு குழந்தைக்கு அதனுடைய வளர்ச்சியில் நடக்கும்திறன் எவ்வாறு தானாகவே வளர்ச்சியடைகிறதோ, அவ்வாறே மொழித்திறனும் வளர்ச்சியடைகிறது
என்பது இன்றைய மொழியியல் அறிஞர்கள் நோம் சாம்ஸ்கி போன்றோர் கண்டறிந்துள்ள ஒரு மாபெரும்
உண்மையாகும். மனித மூளையின் ஒரு உள்ளார்ந்த திறனே மொழித்திறன்
( innate one) ஆகும்.
தேவையான
மூளை வளர்ச்சியும் செவித்திறனும் உடைய எந்த ஒரு குழந்தையும் தான் பிறந்து வளர்கிற சமூகத்தின்
மொழியை – தாய்மொழியை-
குறைந்த
அனுபவத்தில் குறைந்த காலத்தில் – ( கற்றுக்கொள்கிறது
என்று சொல்வதைவிட) பெற்றுக்கொள்கிறது என்பது
மொழியியல் அறிஞர் சாம்ஸ்கியின் கருத்தாகும். எனவே
மொழித்திறன் என்பது உயிரியல் அடிப்படையில் அனைத்து மனிதர்களுக்கும் உள்ள ஒரு இயற்கைத்
திறனாகும் ( Genetically given biological endowment).
தொழில்நுட்பம்
கைகளையும் கால்களையும் இயற்கையாகப்
பெற்றுள்ள மனிதன், தனது தேவைகளுக்காக அந்த
உறுப்புகளுக்குத் துணையாக வில், அம்பு
போன்ற பல கருவிகளைப் படைத்துக்கொண்டான். வரலாற்று வளர்ச்சியில் தனது ஒவ்வொரு
உறுப்புக்கும் துணையாகப் பல கருவிகளைப் படைத்துக்கொண்டு வருகிறான்.
இதன்
பயனாக இன்று கண், காது, கை,
கால்
போன்ற நமது அனைத்து உடல் உறுப்புகளின் செயல்திறன்களும் வியக்கத்தகும்வகையில் வளர்ச்சியடைந்துள்ளன.
வெறும்
கண்ணால் பார்க்கமுடியாத நுண்ணுயிர்களையும் நுண்துகள்களையும் இன்று நுண்ணோக்கிமூலம்
காணமுடிகிறது. பல கோடி கிலோமீட்டர் தூரத்தில்
உள்ள கிரகங்களையும் நட்சத்திரங்களையும் இன்று தொலைநோக்கிமூலம் காணமுடிகிறது.
தொலைவில்
உள்ள குரல்களையும் நமது செவிக்குக் கொண்டுவந்து சேர்க்கும் கருவிகளை இன்று உருவாக்கியுள்ளோம்.
வெறும்
கால்களால் தொலைதூரப் பயணத்தை வேகமாக மேற்கொள்ளமுடியாத சூழலில்,
இன்று
பல ஆயிரக்கணக்கான கிலோமீட்டர் தொலைவை வாகனங்கள் உதவியால் குறைந்த நேரத்தில் குறைந்த
உடல் உழைப்பில் மேற்கொள்ளமுடிகிறது. நடப்பது
மட்டுமல்ல, இன்று நம்மால் பல ஆயிரக்கணக்கான
கிலோமீட்டர் தொலைவை விமானங்கள்மூலம் பறந்தும் கடக்கமுடிகிறது.
பல
இலட்சம் கிலோமீட்டர் தொலைவில் உள்ள கிரகங்களுக்கு விண்கலங்கள் உதவியுடனும் செல்லமுடிகிறது.
வெறும்
கைகளால் செய்ய இயலாத பணிகளையும் பல கருவிகளின் உதவியுடன் செய்யமுடிகிறது.
மிக
நுட்பமான அறுவைசிகிச்சைகளைக்கூட இயந்திரக் கைகளின் உதவியுடன்
( ரோபோட் ) மேற்கொள்ளமுடிகிறது.
இவ்வாறு மனித உடலின் ஐம்புலன்
உறுப்புகளுக்கும் அவற்றின் பயன்பாடுகளை விரிவாக்கம் செய்வதற்குப் பல கருவிகளை இன்றைய
தொழில்நுட்பம் உருவாக்கித் தந்துள்ளது என்பதை நாம் அறிவோம்.
இவையெல்லாம் உயிரியல் அடிப்படையில் மனிதன்
பெற்றவை அல்ல. மனிதன் தனது சமூக வரலாற்றில் உருவாக்கிக்கொண்டவையாகும்.
இவை
மனிதனின் படைப்புகள் ஆகும். இவற்றையே
தொழில்நுட்பம் என்று கூறுகிறோம்.
கணினித்
தொழில்நுட்பம்
இயற்கை அளித்துள்ள மற்றொரு
சிறந்த மனித உறுப்பு மூளையாகும். உலகில்
உள்ள பொருள்களிலேயே – குறிப்பாக
உயிர் உறுப்புகளில் – மிகவும்
சிக்கலான , வளர்ச்சியடைந்த உறுப்பு
இதுவே. மூளையின் பாகங்களைக் கணினியின்
பாகங்களுக்கும், அதில் பொதிந்துள்ள அறிவுத்திறனை
மென்பொருளுக்கும் ஒப்பிடலாம். நமது
அறிவுத்திறனுக்கும் பேச்சுத்திறனுக்கும் ( மென்திறன்கள்)
அடிப்படையான உறுப்பு இது.
இந்த
உறுப்பின் திறனையும் விரிவாக்கம் செய்யும் பல தொழில்நுட்பங்களை மனிதன் உருவாக்கி வந்துள்ளான்.
அறிவியல்
கோட்பாடுகளும் வாய்பாடுகளும் இவற்றில் அடங்கும். மனிதனின் இந்த அறிவுத்திறத்தினால்
இன்று அணுவையும் பிளக்கமுடிகிறது. அண்டத்தின்
அனைத்துக் கிரகங்களையும் அணுகவும் முடிகிறது. பிற
புலன் உறுப்புகளுக்குத் துணையாகக் கருவிகள் பயன்படுவதுபோலவே மனித மூளைக்கு உறுதுணையாகச்
செயல்படவும் உருவாக்கப்பட்டுள்ள ஒரு தொழில்நுட்பக் கருவியே கணினி ஆகும்.
எழுத்துகளின்
தோற்றமும் மொழித்தொழில்நுட்பமும்
மனித மூளையின் சிறப்புத்
திறனான மொழித்திறனையும் வளர்த்தெடுக்க மனித சமுதாயம் தொடர்ந்து முயன்றுவந்துள்ளது.
அதன்
ஒரு பயனே இயற்கைமொழிகளுக்கான வரிவடிவங்கள் – எழுத்துகள்
ஆகும். மொழியின் எழுத்து வடிவம்
– எழுத்து வழக்கு – என்பது
மனிதன் உருவாக்கிய ஒரு மொழித்தொழில்நுட்பம் (
Language Technology) – முதல்
மொழித்தொழில்நுட்பமாகும். தனது கருத்துகளைக்
காலம் கடந்து, இடம் கடந்து நிலைத்து வைக்க மனித
சமுதாயம் உருவாக்கிய தொழில்நுட்பமே எழுத்து மொழியாகும். பானைகள்,
பாறைகள்,
கற்கள்,
ஓலைச்சுவடிகள்
என்று பல ஊடகங்களில் மனிதன் தனது கருத்துகளைப் பொதிந்துவைக்கத் தொடங்கினான்.
அதன்
இன்றைய வளர்ச்சியே , தட்டச்சு
, அச்சு மற்றும் கணினி எழுத்துருக்கள் ஆகும்.
உலகில் இன்றும் பல மொழிகளுக்கு
எழுத்துகள் கிடையாது. வரிவடிவம் கிடையாது.
ஆனால்
தமிழுக்குப் பல ஆயிரம் ஆண்டுகளுக்கு முன்னரே எழுத்துத் தொழில்நுட்பம் தோன்றி வளர்ந்துள்ளது
என்பது தமிழர்கள் பெருமைப்படத்தக்க ஒரு சிறப்பாகும்.
மேற்கூறிய ஊடகங்களில் தமிழ்ச்சமுதாயம்
தனது அறிவுச் செல்வங்களைத் தேக்கி வைத்ததினால்தான் இன்று நம்மால் சங்க இலக்கியங்களையும்
திருக்குறளையும் தொல்காப்பியத்தையும் பெற முடிந்துள்ளது. தமிழர்
வரலாற்றைக் கல்வெட்டுகளின்மூலம் அறியமுடிகிறது. அதுபோல
அச்சுத் தொழில்நுட்பத்தில் தமிழ் இடம் பெற்றதினால்தான் இன்று தமிழ் ஒரு உயர்ந்தகட்ட
வளர்ச்சிநிலையை அடைந்துள்ளது. பாரதி
விரும்பிய “பஞ்சபூதச் செயல்களின் நுட்பங்கள்
கூறும் புத்தம் புதிய கலைகளும்கூட” இன்று அடிமட்டக் கிராமங்களுக்கும்
எட்ட முடிகிறது. “எட்டுத் திக்குக் கலைச்
செல்வங்களும் யாவும் கொணர்ந்திங்கு சேர்க்கமுடிகிறது”.
ஒரு மொழியின் தொடர்ச்சியும்
வளர்ச்சியும் அம்மொழியின் பயன்பாட்டு எல்லையின் அளவைப் பொறுத்தே உள்ளது.
குறிப்பிட்ட
மொழிச் சமுதாயம் தனது மொழியின் பயன்பாட்டு எல்லைகளை விரிவாக்க விரிவாக்க,
அம்மொழியும்
வளர்ச்சியடையும். அதன் பயனாக அச்சமுதாயமும் பயனடையும்.
சிறப்பு
பெறும்.
மின்தமிழ்
- மொழித்தொழில்நுட்பத்தின் அடுத்த கட்ட வளர்ச்சி
இன்றைய கணினி உலகில் கணினிப்
பயன்பாட்டின் முக்கியத்துவம் அனைவரும் அறிந்ததே. குழந்தைகளிலிருந்து
முதியவர்கள்வரை கணினியின் பயன்பாடுகளை நுகர்ந்துவருகின்றனர்.
செல்பேசி,
கணினி
என்று பலவகை மின்னணுச் சாதனங்களைப் பயன்படுத்திவருகின்றனர்.
இக்கருவிகளில்
ஒரு மொழி இடம் பெற்றால்தான் அம்மொழியின் பயன்பாட்டு எல்லை விரிவடையும்.
வளர்ச்சியடையும்.
செல்பேசிவழி
குறுஞ்செய்தி அனுப்புவதுமுதல் மொழிபெயர்ப்புவரை அனைத்து மொழிப்பயன்பாடுகளிலும் ஒரு
மொழியின் பயன்பாடு நீடித்தால்தான் இன்றைய உலகில் ஒரு சிறந்த வாழும்மொழியாக அது நீடிக்கமுடியும்.
இல்லையென்றால்
மெல்ல மெல்ல வழக்கிழந்த – சிறப்பிழந்த- மொழியாக மாறிவிடும்.
கல்வெட்டில்
– ஓலைச்சுவடியில் – அச்சில்
நீடித்துவந்துள்ள தமிழ்மொழி இன்று கணினிபோன்ற மின்னணுச் சாதனங்களிலும் பயன்பாடுடைய
ஒரு மொழியாக நீடிக்கவேண்டும். இதற்கான
தொழில்நுட்பம் வளரவேண்டும். இதுவே
தமிழ் மொழித்தொழில்நுட்பத்தின் இன்றைய கட்டத் தேவையாகும். இதற்கான
திட்டத்தைக் கணினித்தமிழ் வளர்ச்சித் திட்டம் என்று அழைப்பதைவிட மின்தமிழ் வளர்ச்சித்திட்டம் என்று
அழைக்கலாம். ஏனென்றால் இச்சொற்றொடர் கணினியைமட்டும்
உட்படுத்தாமல், செல்பேசி போன்ற பிற மின்னணுக்
கருவிகளையும் உள்ளடக்கி நிற்கிறது.
மின்தமிழின்
தொடக்கக்கட்ட வளர்ச்சி
சுமார்
30 ஆண்டுகளுக்கு முன்னர், கணினியில்
தமிழை உள்ளீடு செய்வதற்கே வசதி கிடையாது. தமிழ்
எழுத்துருக்கள், விசைப்பலகைகள் உருவாக்கப்படவில்லை.
முதலில்
தமிழை உள்ளீடு செய்வதற்கு வசதிகள் உருவாக்கப்பட்டால்தானே பிற பயன்பாடுகளை எண்ணிப் பார்க்கமுடியும்.
பின்னர்
மெல்ல மெல்லத் தமிழ் உரையை ரோமன் எழுத்துகளில் உள்ளீடு செய்து,
அதைத்
தமிழ் எழுத்துருக்களில் மாற்றும் வசதி உருவாக்கப்பட்டது. ஆதமி
போன்ற மென்பொருட்கள் உருவாக்கப்பட்டன. தமிழ் எழுத்துகளுக்கான எழுத்துருக்கள் உருவாக்கப்பட்டன.
அடுத்த கட்ட வளர்ச்சியாக
, தமிழ் விசைப்பலகைகள் உருவாக்கப்பட்டன.
இதன்
பயனாக, நேரடியாகவே தமிழைக் கணினியில்
உள்ளீடு செய்யும் வசதி ஏற்பட்டது. வோர்ட்,
வோர்டுபெர்ஃபெக்ட்
, வோர்டு ஸ்டார், பேஜ்மேக்கர்
, வெஞ்சுரா போன்ற மென்பொருட்களில் தமிழைப் பயன்படுத்தும் வாய்ப்பு
– வளர்ச்சி ஏற்பட்டது.
இருப்பினும்,
தமிழ்
எழுத்துருக்களைக் கணினியில் குறியேற்றம் செய்வதில் பல சிக்கல்கள் நீடித்தன.
தமிழ்
எழுத்துருக்களுக்கான குறியேற்றத்தில் தரப்படுத்தம் இல்லாமல் இருந்தது.
ஒரு
குறிப்பிட்ட தமிழ்மென்பொருளைக் கொண்டு தட்டச்சு செய்யப்பட்ட ஒரு தமிழ் ஆவணத்தை மற்றொரு
தமிழ் மென்பொருளைக்கொண்டு வாசிக்கவோ, பதிப்பிக்கவோ
இயலாத ஒரு நிலை நீடித்தது. இதற்கு
அஸ்கி ( ASCII) என்ற குறியேற்றமுறையும் ஒரு தடையாக
அமைந்தது. தமிழ் விசைப்பலகைகளும் தரப்படுத்தப்படவில்லை.
இருப்பினும் தமிழில் இணையதளங்கள்,
வலைப்பூக்கள்
தோன்ற ஆரம்பித்தன. அச்சில் இடம்பெற்ற அனைத்தும்
கணினியிலும் இடம்பெற்றன. இந்த நூற்றாண்டின்
தொடக்கத்தில் ஒருங்குறிக் குறியேற்றம் ( Unicode
encoding) பன்னாட்டுக் கணினிநிறுவனங்களின்
வணிக முயற்சிகளினால் அறிமுகப்படுத்தப்பட்டன. தமிழுக்குத்
தனியே ஒருங்குறி குறியேற்ற எண்கள் வழங்கப்பட்டது. இதன்
பயனாக, தற்போது மின்னணுச் சாதனங்களில்
தமிழை உள்ளீடு செய்வதற்கான தடை எதுவும் கிடையாது. செல்பேசியில்கூட
தமிழைத் தற்போது உள்ளீடு செய்து, அனைத்துப்
பயன்பாடுகளையும் மேற்கொள்ளலாம்.
மின்தமிழின்
அடுத்த கட்ட வளர்ச்சி
கல்வெட்டு
, ஓலைச்சுவடி, தட்டச்சு,
அச்சுப்பொறி
, கணினி ஆகியவற்றில் இதுவரை நாம் பார்த்த தமிழ் மொழித்தொழில்நுட்பமானது,
தமிழ்
உரை அல்லது பனுவலை அவற்றில் பொதிந்து அல்லது பதிந்து வைக்கப் பயன்பட்ட தொழில்நுட்பமே
ஆகும். காலம் கடந்து,
இடம்
கடந்து, தமிழ்ப் பனுவல்களைச் சேமித்துவைக்கப்
பயன்பட்ட மொழித்தொழில்நுட்பமேயாகும். கல்வெட்டாலோ
அல்லது ஓலைச்சுவடியாலோ அல்லது அச்சாலோ அல்லது கணினியாலோ தங்கள்வழி அல்லது தங்கள்மீது
பதியப்பட்ட தமிழ்ப்பனுவலை அல்லது உரையைப் புரிந்துகொள்ளமுடியாது.
பதியப்பட்டவற்றைப்
பாதுகாப்பாகச் சேமித்துமட்டுமே வைக்கமுடியும்.
இந்த வகை மொழித்தொழில்நுட்பத்தைத்
தன்முனைப்பில்லா / செயலூக்கமில்லா மொழித்தொழில்நுட்பம்
( Passive Language Technology) என்றழைக்கலாம்.
“தன்முனைப்பில்லா”
அல்லது
“செயலூக்கமில்லா”
என்ற
சொல்லாக்கத்தை இங்கு ஒரு கலைச்சொல்லாக மட்டுமே பார்க்கவேண்டும்.
இத்தொழில்நுட்பமானது
ஒரு உருவத்தைச் சிலையில் செதுக்கிவைப்பது போன்றதாகும் இது. உருவம்
பொறிக்கப்பட்டுள்ள அசையாச் சிலையானது தன்னைப் புரிந்துகொள்ளாது.
நாம்
சொல்வதைப் புரிந்துகொண்டும் செயல்படாது.
இயங்காச் சிலை
இயங்கும் இயந்திர மனிதன்
கணினியானது தன்மீது பதியப்பட்ட
தமிழ் உரையை நாம் புரிந்துகொள்வதுபோல புரிந்துகொண்டால், புரிந்துகொண்டு
செயல்பட்டால் , அதுவே தன்முனைப்புள்ள அல்லது
செயலூக்கமுள்ள மொழித்தொழில்நுட்பமாகும் ( Active Language
Technology). இது ஒரு இயந்திர மனிதன் போன்றதாகும்.
இயந்திர
மனிதன் ஏதோ ஒரு வகையில் நாம் சொல்வதைப் புரிந்துகொண்டு செயல்படுகிறான் அல்லவா,
அதுபோல நாம் சொல்வதைப் புரிந்துகொண்டு
செயல்படும் மொழித்தொழில்நுட்பம் இதுவாகும். . இந்த வகை மொழித்தொழில்நுட்பமும்
தற்போது ஆங்கிலம்,
ஜெர்மன்
போன்ற மேலைநாட்டு மொழிகளுக்கு உருவாக்கப்பட்டுள்ளது.
சொல்லாளர்
முதல் இயந்திர மொழிபெயர்ப்புவரை
எம் எஸ் வோர்டு போன்ற ஆங்கிலச்
சொல்லாளர் மென்பொருட்களைக்கொண்டு ஆங்கில உரையைத் தட்டச்சு செய்யும்போது,
எழுத்துப்பிழைகள்,
இலக்கணப்
பிழைகள் இருந்தால் உடனே அவை கண்டறியப்பட்டு, சிவப்புக்
கோடு இடப்பட்டுக் காட்டப்படுகின்றன. நாம் உடனே
அவற்றைத் திருத்திக்கொள்ள அந்த மென்பொருட்கள் சரியான சொற்களை அளிப்பதன்மூலம் உதவியும்
செய்கின்றன. அதாவது,
மொழி
ஆசிரியர் செயல்படுவதுபோன்று இந்த மென்பொருள்களும் செயல்படுகின்றன.
ஆசிரியர்
பெற்றிருக்கிற மொழி அறிவை இந்த மென்பொருட்களும் பெற்றிருப்பதால்,
இவ்வாறு
செய்யமுடிகின்றது. தானியங்கு சொற்பிழை திருத்தி,
இலக்கணப்பிழை
திருத்திகள் இவற்றில் இடம் பெற்றுள்ளன.
டிராகன் போன்ற சில மென்பொருட்கள்
நாம் ஆங்கிலத்தில் கணினிமுன் பேசினாலே போதும், அதுவே கணினியில் தட்டச்சு செய்துவிடுகிறது.
இதைப்
பேச்சு – எழுத்து மாற்றி
( Automatic Speech Recognizer – ASR) என்று
அழைக்கின்றனர். இதுபோன்று,
கணினியில்
உள்ளதை அப்படியே நமக்கு வாசித்துக் காட்டும் மென்பொருட்களும் உள்ளன.
இவற்றை
எழுத்து – பேச்சு மாற்றி
( Text to Speech – TTS) என்று
அழைக்கின்றனர். இதையும் தாண்டி,
சில
பக்கங்களைக் கணினியில் உள்ளீடு செய்தால், அவற்றில்
உள்ள கருத்துகளைப் புரிந்துகொண்டு, நமக்குக்
கூறும் மென்பொருட்களும் இருக்கின்றன. இதைப்
பனுவல் சுருக்கக் கருத்துருவாக்கம் ( Text Summarization) என்று அழைக்கின்றனர்.
தற்போது
ஒரு மொழியில் உள்ள உரை அல்லது பனுவலை மற்றொரு மொழியில் மொழிபெயர்த்துத் தரும் மென்பொருளை
உருவாக்குவதற்கான முயற்சியும் ( Machine Translation – MT) நடைபெற்றுவருகின்றன.
இவையெல்லாம் மேலைநாட்டு
மொழிகளுக்கு எவ்வாறு சாத்தியமாகி உள்ளன? அம்மொழிகளின்
சொற்களஞ்சிய அறிவும், இலக்கண அறிவும் கணினிக்கு
நிரல்களாக உருவாக்கப்பட்டு கொடுக்கப்பட்டுள்ளன. எனவே,
நமது
மூளை எவ்வாறு மொழியைப் புரிந்துகொண்டு செயல்படுகிறதோ, அவ்வாறே
கணினியும் புரிந்துகொண்டு செயல்படுகிறது. நமது
மூளைக்குள் நமது மொழியின் அறிவு இருப்பதால்தான் மூளைக்கு நாம் பேசுவதும்,
எழுதுவதும்
புரிகிறது ; நாம் நினைக்கும் கருத்துகளை
மொழியில் வெளிப்படுத்தவும் முடிகிறது. இந்த
மொழியறிவு கணினிக்கு நிரல்களாகக் கொடுக்கப்படவேண்டும். அப்போதுதான்
மேற்சொன்ன மொழித்தொழில்நுட்பம் வளரும்.
தமிழில்
முடியுமா?
மேற்கூறிய மொழித்தொழில்நுட்பம்
எல்லாம் தமிழ்மொழிக்கும் செயல்படுத்தப்படவேண்டும். அப்போதுதான்
தமிழின் பயன்பாட்டு எல்லை விரிவடையும். தமிழ்மொழி
அறிவைக் கணினிக்குப் புரியக்கூடிய வகையில் – கணித
முறையில்- அளித்தால்தான் இப்பணி வெற்றியடையமுடியும்.
அதற்கான
துறையாகக் கணினிமொழியியல் மற்றும் மொழித்தொழில்நுட்பத்துறை ( Computational Linguistics and Language
Technology) என்ற ஒரு துறை இன்று வளர்ந்துவருகிறது.
அத்துறை
அறிவின் அடிப்படையில் தமிழ்மொழி ஆய்வு நடைபெற்றால்தான் மின்தமிழ்
– கணினித்தமிழ் – வளர்ச்சியடையும்.
தொல்காப்பியம்,
நன்னூல்
போன்ற இலக்கண நூல்களும் இன்றைய மொழியியலார் ஆய்வுகளும் மனித மூளைக்காக உருவாக்கப்பட்டவையாகும்.
அவற்றை
அப்படியே கணினிக்குக் கொடுத்தால், கணினியால்
புரிந்துகொள்ளமுடியாது. கணினியில் அமைந்துள்ள மின்னணுச்
சில்லுகளுக்குப் புரியக்கூடிய கணினிநிரல்களாக (
program ) அவை மாற்றப்படவேண்டும்.
மனித
மூளைக்காக உருவாக்கப்பட்டுள்ள இன்றைய தமிழ் அகராதிகள் எல்லாம் கணினிக்குப் புரியக்கூடிய
வகையில் மின்னகராதிகளாக மாற்றப்படவேண்டும். மனித
மூளையின் திறன் வேறு. கணினியின் திறன் வேறு.
பின்புல
அறிவைக்கொண்டு நமது மூளையால் ஒரு கருத்தைச் சுருங்கச்சொன்னாலும் மறைமுகமாகச் சொன்னாலும்
புரிந்துகொள்ளமுடியும். ஆனால் கணினியால் அவ்வாறு
முடியாது. அதற்கு எதையும் தெளிவாக,
முறையாக,
நேரடியாகக்
கூறவேண்டும். எனவே தமிழ் இலக்கணமும் அகராதியும்
கணினியின் புரிந்துகொள்ளும் முறைக்கு ஏற்ற வடிவில் கொடுக்கப்படவேண்டும்.
இன்றைய
தலையாய பணி
இன்று மின்தமிழ் வளர்ச்சியில்
தமிழை உள்ளீடு செய்வதற்கான பணிகள் பெருமளவில் வெற்றிபெற்றுள்ளன.
தமிழ்
எழுத்துருக்கள், விசைப்பலகைகள் உருவாக்கத்தில்
நீடித்த பல சிக்கல்கள் தீர்க்கப்பட்டுவிட்டன. அதையொட்டி,
தமிழ்
விக்கிபீடியா, வலைப்பூக்கள்,
இணையதளங்கள்
பெருகிக்கொண்டிருக்கின்றன. இவையெல்லாம்
வரவேற்கத்தக்க, நாம் மகிழ்ச்சியடையவேண்டிய தமிழ்ப்பணிகள்
என்பதில் சிறிதும் ஐயமில்லை. ஆனால்
இவையெல்லாம் கணினித்தமிழ் வளர்ச்சியின் முதல்கட்டமே ஆகும். முன்னர்க்
கூறிய தன்முனைப்பில்லா /
செயலூக்கமில்லா மொழித்தொழில்நுட்பமாகும்.
இந்தத்
தேவையான முதல் கட்டத்தை நாம் தற்போது தாண்டிவிட்டோம்.
இனி
அடுத்த கட்ட வளர்ச்சியான தன்முனைப்புள்ள / செயலூக்கமுள்ள மொழித்தொழில்நுட்பத்தைநோக்கி
நம் பணி அமையவேண்டும்.
நாம் கணினி உட்பட பல மின்னணுச்
சாதனங்களில் ( எழுத்துவழியாகவோ அல்லது
பேச்சுவழியாகவோ) உள்ளீடு செய்கிற தமிழ்ப் பனுவலை
அல்லது உரையை அவை புரிந்துகொண்டு செயல்படவேண்டும். சொற்பிழை
திருத்தி முதல் இயந்திரமொழிபெயர்ப்புவரை தமிழ்மொழிக்கு மென்பொருட்கள் உருவாக்கப்படவேண்டும்.
அப்போதுதான்
தமிழ் உலகளவில் வளர்ச்சியடைந்த பிறமொழிகளுக்கு இணையாக வலம் வரமுடியும்.
“ மறைவாக நமக்குள்ளே பழங்கதைகள்
சொல்வதிலோர் மகிமை இல்லை” என்ற பாரதியின்
கூற்றை உணர்ந்து, மின்னணுக் கருவிகளுக்கான மொழித்தொழில்நுட்பம்
“ மெத்த வளருது மேற்கே – அந்த
மேன்மைக் கலைகள் தமிழினில் இல்லை “ என்று எவரும் சொல்லமுடியாத அளவிற்கு
அம்மொழித்தொழில்நுட்பங்கள் யாவற்றையும் தமிழுக்குக் கொணர்ந்து இங்கு சேர்ப்பது நமது
இன்றைய தலையாய தாய்மொழிக் கடமையாகும். முத்தமிழானது
இனி மென்தமிழாகவும் – மின்தமிழாகவும்
– மலரவேண்டும், நிச்சயமாக
மலரும்.
( இக்கட்டுரை எழுதுவதற்குத் தூண்டுதலாக அமைந்த நூல் - "Language, Technology and Society " by Richard Sproat - 2010)
2 கருத்துகள்:
அன்புள்ள ஐயா!
கட்டுரையைக் கருத்தூன்றி முழுவதுமாகப் படித்தேன். Language Technology பற்றிய பொதுவான கருத்துகளையும், தமிழின் இன்றைய தேவைகளையும் சிறப்பாக விளக்கியுள்ளீர்கள். மிக்க நன்றி.
ப.பாண்டியராஜா
கருத்துரையிடுக