Monday, July 09, 2007

கணினி, செல்பேசிகளில் இந்திய மொழிகள்

இன்று தமிழ் வலைப்பதிவுகளில் இயங்கும் நம் பலருக்கும் யூனிகோட் எழுத்துருக்கள் கொண்டு கணினியில் இந்திய மொழிகளைக் கையாளத் தெரிந்துள்ளது. இந்தியாவின் பல மாநிலங்களிலும் அந்தந்த மொழி பேசும் மக்கள் இதனைச் செய்யத் தொடங்கியுள்ளனர்.

சில செல்பேசிகளில் யூனிகோட் எழுத்துரு கிடைக்கிறது. அதைக்கொண்டு தமிழ், ஹிந்தி ஆகியவற்றில் குறுஞ்செய்திகளை அனுப்ப முடிகிறது.

ஆனால் இன்றும்கூட பல விஷயங்கள் ஒரு புது கணினி, செல்பேசி பயனருக்கு எளிமையானதாக இருப்பதில்லை.

பொதுவாக ஓர் இந்திய மொழியைப் பயன்படுத்த விரும்பும் பயனருக்கு என்னென்ன தேவைகள் இருக்கும் என்று பட்டியலிடலாம்:

கணினியில்:
  1. மின்னஞ்சல், இணையப் பக்கம் ஆகியவற்றில் உள்ள செய்திகளை, தங்கு தடையின்றிப் படிக்கவேண்டும்.
  2. ரோமன் கீபோர்டை வைத்துக்கொண்டு எந்த மொழியில் எழுத ஆசைப்படுகிறோமோ அந்த மொழியில் எழுதக்கூடிய திறன் வேண்டும்.
  3. இந்தியர்கள் பலருக்கும் ஆங்கிலம் மற்றும் தம் மொழியைத் தவிர்த்து வேறு ஒரு (சில) இந்திய மொழி(கள்) புரியக்கூடும். ஆனால் அந்த மொழியின் வரி வடிவம் தெரியாமல் இருக்கும். பலருக்கு தமது தாய்மொழியின் வரிவடிவமே தெரியாமல் இருக்கும். அவர்களுக்குத் தெரிந்த ஒரே வரிவடிவம் ஆங்கில (ரோமன்) எழுத்துகளாக இருக்கும். இதற்கு ஏற்ற வகையில் ஒரு வரிவடிவை இன்னொரு வரிவடிவாக, ஆனால் அதே ஒலிவடிவாக இருக்குமாறு மாற்றுதல் - அதாவது transliteration - வரிவடிவ மாற்றம் தேவைப்படுகிறது.
  4. பிழையின்றித் தம் மொழியில் எழுத ஒரு spellchecker (சொல் பிழைதிருத்தி) வேண்டும். தவறான சொற்களை அடிக்கோடிட்டு, சரியான பதங்களைக் காண்பித்து, நம்மைத் தேர்ந்தெடுக்க வைக்கும் செயலி.
  5. இலக்கணத் திருத்தி (Grammar checking): சொற்களில் உள்ள பிழையைப் போலவே வாக்கியங்களில், வாக்கிய அமைப்பில் உள்ள பிழைகள், சந்திப்பிழை போன்றவற்றைத் திருத்தும் செயலி.
  6. அகராதி: ஆங்கிலத்திலிருந்து இந்திய மொழிக்கு, இந்திய மொழியிலிருந்து ஆங்கிலத்துக்கு, ஓர் இந்திய மொழியிலிருந்து மற்றோர் இந்திய மொழிக்கு முழுமையான ஆன்லைன் அகராதி(கள்), உச்சரிப்புக்கான உதவிகள், ஒரே பொருளைக் குறிக்கும் பல சொற்கள் (thesaurus), படங்கள்...
  7. எழுத்திலிருந்து ஒலிக்கு... (Text-to-Speech): ஒலிப்பான்களை (Phonemes) துணையாகக் கொண்டு எழுதப்பட்டிருக்கும் ஒரு வாக்கியத்தை கணினியால் படித்துச் சொல்லுமாறு மாற்றுதல். ஆங்கிலத்துக்கும் வெறு சில மேற்கத்திய மொழிகளுக்கும் இந்த வசதி உண்டு. இந்திய மொழிகளுக்கு இதனைச் செய்வது எளிதான ஒரு காரியம்தான். ஆனால் அனைவரும் உபயோகிக்கக்கூடிய செயலிகள் இல்லை.
  8. ஒலியிலிருந்து எழுத்துக்கு... (Speech recognition): IVR Systems (Interactive Voice Response Systems) போன்றவை நாம் பேசுவதைக் கொண்டு நமக்கு என்ன தேவை என்பதைப் புரிந்துகொண்டு அதற்கேற்ப நமக்குத் தேவையானதைத் தரும். ஆங்கிலத்தில் இது செயல்முறையில் உள்ளது. இந்திய மொழிகளுக்கும் தேவைப்படுகிறது.
  9. Understanding diglossia: இந்திய மொழிகள் அனைத்துமே எழுத்து மொழி, பேச்சு மொழி என்று இரண்டாகப் பிரிகின்றன. பேச்சு மொழியிலும் பல வட்டார வழக்குகள் உள்ளன. இப்படிப்பட்ட வட்டார வழக்குச் சொற்களை இனங்கண்டு, அவற்றுக்குச் சமமான அகராதி வழக்கைக் கொண்டுவருதல். அதேபோல இலக்கண வழக்கில் எழுதப்பட்டதை வட்டார வழக்குக்கு மாற்றுதல்.
  10. மொழிமாற்றம்: ஆங்கிலத்தில் எழுதப்பட்ட வாக்கியத்தை இந்திய மொழிகளுக்கு மாற்றுதல்; இந்திய மொழிகளில் எழுதப்பட்ட வாக்கியத்தை ஆங்கிலத்தில் மாற்றுதல்; ஓர் இந்திய மொழியிலிருந்து மற்றோர் இந்திய மொழிக்கு மாற்றுதல்.

செல்பேசியில்:

மேலே சொன்னவற்றில் பல சேவைகள் செல்பேசிகளிலும் தேவைப்படுகின்றன.

*

தன்னார்வலர்கள், கணினித்துறை ஆராய்ச்சியாளர்கள், கணினி மென்பொருள் நிறுவனங்கள் என அனைவரும் சேர்ந்து வேலை செய்தால்தான் மேலே குறிப்பிட்ட பல விஷயங்கள் நடைபெறும்.

உதாரணத்துக்கு இன்றும்கூட பலருக்கு கணினியில் 'உடையா எழுத்துகளில்' தமிழைப் படிப்பது எப்படி என்பது தெரியவில்லை. தமிழெல்லாம்கூடக் கணினிகளில் வருமா என்று கேட்பவர் பலர் இருக்கிறார்கள்.

அதேபோல 100 மில்லியனுக்கும் மேற்பட்ட செல்பேசிகளில் 1 மில்லியன் செல்பேசிகளில்கூட (1%) இந்திய மொழிகளில் எழுதமுடியாத நிலை. ஆனால் சீனாவிலோ சீன மொழி இடைமுகம் இல்லாவிட்டால் அந்த செல்பேசிகளை விற்கவே முடியாது.

நம் நாட்டில் அதைப்போன்ற சட்டம் இயற்றப்படப்போவதில்லை. எனவே இருக்கும் செல்பேசிகளில் யூனிகோட் எழுத்துகளில் படிக்க, எழுத வகைசெய்யக்கூடிய மென்பொருளை எழுதவேண்டும்.

*

என் நிறுவனம் வழியாக, லாப நோக்குள்ள வகையில், மேலே குறிப்பிட்ட சிலவற்றில் மென்பொருள் அல்லது இணையம் வழிச் சேவைகளை உருவாக்க ஆராய்ச்சிகளை மேற்கொண்டுள்ளோம். இவைபற்றி மேற்கொண்டு தகவல் அறிய விரும்புவோர் என்னைத் தொடர்பு கொள்ளலாம்.

4 comments:

  1. //இந்தியர்கள் பலருக்கும் ஆங்கிலம் மற்றும் தம் மொழியைத் தவிர்த்து வேறு ஒரு (சில) இந்திய மொழி(கள்) புரியக்கூடும். ஆனால் அந்த மொழியின் வரி வடிவம் தெரியாமல் இருக்கும். பலருக்கு தமது தாய்மொழியின் வரிவடிவமே தெரியாமல் இருக்கும். அவர்களுக்குத் தெரிந்த ஒரே வரிவடிவம் ஆங்கில (ரோமன்) எழுத்துகளாக இருக்கும். இதற்கு ஏற்ற வகையில் ஒரு வரிவடிவை இன்னொரு வரிவடிவாக, ஆனால் அதே ஒலிவடிவாக இருக்குமாறு மாற்றுதல் - அதாவது transliteration - வரிவடிவ மாற்றம் தேவைப்படுகிறது.//

    www.higopi.com தளத்தில் பல இந்திய மொழிகளுக்கு இந்த வசதி இருக்கிறது.

    இன்னும் சில தமிழ்க் கணிமை தேவைகளுக்கு http://microblog.ravidreams.net/?p=46


    உங்கள் முயற்சிகளுக்கு வாழ்த்துக்கள்

    ReplyDelete
  2. நல்ல விடயம். வாழ்த்துகள்.


    சிங்கையில் இது சம்பந்தமாக முரசு நெடுமாறன் சில செய்திருந்தார். வலையில் தேடினால் விபரம் கிடைக்கலாம். சிங்கை ஆசிரியர் ரெ.கலைமணி இத்துறையில் ஆர்வம் கொண்டவர்.

    ReplyDelete
  3. ஒரு நல்ல சொல் பிழைதிருத்தி தமிழுக்கு தேவை.
    உங்கள் முயற்சிக்கு நல் வாழ்துக்கள்.

    ReplyDelete