ഒരു പെട്ടി..... പെട്ടിക്കുള്ളിലൊരു ലോകം... പെട്ടിതുരന്ന് പുറത്തേക്കൊരോട്ടം ..

Friday, December 7, 2007

യൂണിക്കോഡ് 5.1 ന്റെ കരട് പുറത്തിറങ്ങി.

യൂണിക്കോഡ് 5.1 ന്റെ കരട് രൂപം പുറത്തിറങ്ങി. ഇത് തെറ്റുകള്‍ റിപ്പോര്‍ട്ട് ചെയ്യാനുള്ള സമയമാണ്. വിവരങ്ങള്‍ http://www.unicode.org/versions/Unicode5.1.0/#Significant_Character_Additions എന്ന വിലാസത്തിലുണ്ട്.
http://www.unicode.org/reporting.html എന്ന വിലാസത്തിലാണ് തെറ്റുകള്‍ ചൂണ്ടിക്കാണിക്കുകയോ നിര്‍ദ്ദേശങ്ങള്‍ സമര്‍പ്പിക്കുകയോ ചെയ്യേണ്ടത്.

പെട്ടെന്നുള്ള ഒരു നോട്ടമേ ഞാന്‍ നടത്തിയിട്ടുള്ളൂ. പെട്ടെന്ന് ശ്രദ്ധയില്‍ പെട്ട ചിലത് താഴെക്കൊടുക്കുന്നു. കൂടുതല്‍ വിശദമായി പരിശോധിച്ച ശേഷം പോസ്റ്റ് അപ്ഡേറ്റ് ചെയ്യുന്നതാണ്.

പൊതുവേ യൂണിക്കോഡിന്റെ ഈ പുതിയ കരട് സ്റ്റാന്‍ഡേര്‍ഡിന്റെ സവിശേഷതയായി തോന്നുന്നത് യൂണിക്കോഡ് കണ്‍സോര്‍ഷ്യം ന്റ , റ്റ , കുത്തക്ഷരങ്ങള്‍ എന്നിവയിലെ ഭാഷാപരമായ അവ്യവസ്ഥകളെ പിന്തുടരുന്നതാണ്.

'ന്റ' ക്ക് ('റ്റ' യ്ക്കും) മലയാളത്തില്‍ തെറ്റായ പ്രതിനിധാനം നിലനില്‍ക്കുന്നുണ്ട്. അത് ഭാഷാപരമായ പ്രയോഗരീതിയെക്കുറിച്ചുള്ള അജ്ഞത മൂലമുണ്ടാകുന്നതാണ്. പക്ഷേ യൂണിക്കോഡ് ഭാഷാപരമായ സാധുതയല്ല ഉപയോഗരൂപങ്ങളെ (തെറ്റായാലും) മാത്രം പരിഗണിച്ച് തീരുമാനത്തിലെത്തിയിരിക്കുകയാണെന്ന് തോന്നുന്നു.

യൂണിക്കോഡ് 5.1 ല്‍ ചില്ലുവരുന്നതിനെക്കുറിച്ച് സ്വതന്ത്രമലയാളം കമ്പ്യൂട്ടിങ്ങിന് പറയാനുള്ളത് ഇവിടെയുണ്ട് . (ഇതൊരു പഴയ പ്രസന്റേഷനാണ്)
യൂണിക്കോഡ് എന്താണെന്നറിയാത്തവര്‍ അടിസ്ഥാന ധാരണയ്ക്കായി ദാ ഇതും കാണുക

7 comments:

സുറുമ || suruma said...

"ചില ക്രാന്തദര്‍ശി"കളുടെ നിര്‍ദ്ദേശങ്ങള്‍ പ്രവചനങ്ങളായിത്തീര്‍ന്നിരിക്കുകയാണ് ഈ കരടുരൂപത്തിലൂടെ.'കൈരളി' ചാനലിലെ 'സാക്ഷി' വീമ്പു പറയുന്നപോലെ 'അതെ, ഒറ്റക്കണ്ണന്മാരാണ് ഞങ്ങള്‍' എന്നു് യൂണിക്കോഡിനും പറയാവുന്നതാണു്.

aneel kumar said...

തെറ്റുകള്‍ ചൂണ്ടിക്കാണിക്കുകയോ നിര്‍ദ്ദേശങ്ങള്‍ സമര്‍പ്പിക്കുകയോ ചെയ്യാനുള്ള ലിങ്ക് ഈ പോസ്റ്റിലുള്ളപ്പോള്‍ യൂണിക്കോഡ് തെറ്റായ കാര്യങ്ങള്‍ക്ക് പരിഗണന നല്‍കിയെങ്കില്‍ അവരെ മനസിലാക്കിക്കാന്‍ ശ്രമിച്ചുകൂടേ?
അതോ എത്ര പറഞ്ഞാലും മനസിലാകാത്ത ടൈപ്പ് ടീമാണോ അവര്‍?

Anivar said...

അനിലേട്ടാ, വസ്തുതകളേക്കാള്‍ ആരു പറയുന്നു എന്നത് പ്രധാനമാകുന്നത് എപ്പോഴും ഖേദകരമാണ്. എവിടെയാനെങ്കിലും . ലിപിപരിഷ്കരണ അംഗഭംഗം വന്ന മലയാളം കമ്പ്യൂട്ടിങ്ങിനെ യൂണിക്കോഡ് ശരിയാക്കിത്തരുമെന്നാണ് മലയാളി ധരിച്ചു വച്ചത്. പക്ഷേ ഞാനിവിടെ പറഞ്ഞതുപോലെ പ്രതിനിധാന രൂപങ്ങളാണ് (സ്കാനുകളാണ്) യൂണിക്കോഡ് പരിശോധിച്ചത് (ന്റ, റ്റ എന്നിവയുടെ കാര്യത്തില്‍) അത് /ന്റ/ യെന്നും /ന്‍റ/ യെന്നും ഒക്കെ പലവിധത്തില്‍ ലിപിപരിഷ്കരണം അംഗവൈകല്യം വരുത്തിയ ലിപിയുപയോഗിച്ച് പലരും എഴുതിയത് ഉപയോഗരൂപങ്ങളുടെ തെളിവായി. അതിനെ യൂണിക്കോഡ് കണക്കിലാക്കുമ്പോള്‍ അതെങ്ങനെ ഉണ്ടാകുമെന്ന നിയമമായി മാറുകയാണ്.

മറിച്ച് ഭാഷാപരമായ സാധുതയാണ് കണക്കിലാക്കുന്നതെങ്കില്‍ യൂണിക്കോഡിനുമുന്നില്‍ ആധികാരികമായ അഭിപ്രായം ആരുടേതാണ്? ഗവണ്‍മെന്റും സിഡിറ്റും ചില വെണ്ടര്‍മാരും സ്കോര്‍ ചെയ്യുന്നതിവിടെയാണ്.

മലയാളിക്ക് തെറ്റായ കാര്യങ്ങളെ പ്രതിരോധിച്ചേ ശീലമുള്ളൂ, എന്തുവേണമെന്ന് തെറ്റ് നടപ്പിലാക്കാന്‍ നോക്കുമ്പോഴേ അവര്‍ പറയൂ,തിരിച്ചറിയൂ. അതേസമയം ഉദ്ദിഷ്ടകാര്യസിദ്ധിക്ക് ശ്രമിക്കുന്നവര്‍ തങ്ങളുടെ ഭാഷാപരമായ അജ്ഞത മൂടിവച്ച് കാമ്പെയിനുകളിറക്കും പ്രപ്പോസലുകളെഴുതിവിടും . ബൂലോകത്തിന്റെ സകല സ്പന്ദനങ്ങളും ആണവ ചില്ലുകളിലാണെന്നു വരെ പറയും .
അതേസമയം യൂണിക്കോഡ് ഇവരെയല്ലാതെ ആരെ പരിഗണിക്കും ?

ഇതാണു യഥാര്‍ത്ഥപ്രശ്നം .എന്തായാലും മുട്ടിക്കൊണ്ടേയിരിക്കുക. നഷ്ടപ്പെടാനുള്ളത് മലയാളഭാഷയ്ക്കും മലയാളിക്കുമാണല്ലോ

Anivar said...

സിഡിറ്റും എന്നത് സിഡാക്കും എന്ന് തിരുത്തിവായിക്കാനപേക്ഷ

aneel kumar said...

നന്ദി അനിവര്‍.
ചുരുക്കത്തില്‍ ചിലരുടെയെങ്കിലും ഉദ്ദിഷ്ടകാര്യസിദ്ധിക്കാണ് വസ്തുകളെക്കാള്‍ മുന്‍‌തൂക്കം.
പുകമറകള്‍ ഒഴിവാക്കി ഒക്കെയും തുറന്നുകാട്ടാന്‍ ആര്‍ക്കെങ്കിലും കഴിയുന്ന ഒരു കാലം വരുന്നതുവരെ തെറ്റുകള്‍ നടപ്പിലായിക്കൊണ്ടേയിരിക്കട്ടെ. മുള്ളും മുനയും വച്ചല്ലാതെ ‘മലയാളി’യ്ക്ക് മനസിലാവുന്ന തരത്തില്‍ ഇത്തരം പ്രശ്നങ്ങള്‍ ഒരിടത്തും അവതരിപ്പിച്ചുകാണുന്നില്ല എന്നത് എന്നെപ്പോലുള്ള വിവരദോഷികളെ കൂടുതല്‍ ആശയക്കുഴപ്പങ്ങളിലേയ്ക്കു നയിക്കുകയേയുള്ളൂ. വിവരദോഷികള്‍ വിവരസാങ്കേതികവിദ്യയുടെ കാലത്ത് എവിടെയും ഓഫ്‌ടോപ്പിക് ആവുന്നതു തന്നെയാണഭികാമ്യം.
എങ്കിലും മലയാളത്തിനു വന്നുഭവിച്ചുപോയ അംഗഭംഗം ശരിയാക്കാന്‍ ശ്രമിക്കാന്‍ പോലും ആര്‍ക്കും കഴിയാതെവരുന്നു എന്നത് ഖേദകരം തന്നെ.

Cibu C J (സിബു) said...

പ്രോസസ്സിനെ പറ്റിയുള്ള ചോദ്യങ്ങള്‍ മനസ്സിലായി. പക്ഷെ, ഞാനുത്തരം പറയേണ്ടവയല്ലല്ലോ അത്‌. എന്നാല്‍ ന്റ, റ്റ തുടങ്ങിയവയെ പറ്റി 5.1-ലെ പ്രശ്നങ്ങള്‍ അറിയാന്‍ തീര്‍ച്ചയായും താല്പര്യമുണ്ട്.

Anivar said...

സിബൂ, യൂണിക്കോഡിനെപ്പറ്റിയുള്ള ചോദ്യങ്ങള്‍ക്കെല്ലാം സിബുതന്നെ ഉത്തരം പറയേണ്ടതുണ്ടെന്ന് സ്വയം കരുതുന്നുണ്ടോ? . "തിരുവനന്തപുരത്തോട്ടു വിളിച്ച് ഞാനതു ശരിയാക്കിത്തരാമെന്നു വീമ്പിളക്കുന്ന തരം അധികാര ദല്ലാളായി" സിബുവിനെക്കാണാന്‍ ഞാനേതായാലും തയ്യാറല്ല. യൂണിക്കോഡെന്തായാലും /ന്റ/ ക്കാര്യത്തില്‍ സിബൂന്റെ ഈ കുറിപ്പിനേക്കാള്‍ ഇപ്പോഴും ഭേദമാണ് എന്നു കരുതുന്നു.അതോണ്ട് യൂണിക്കോഡിന് നേരിട്ടെഴുതാന്‍ തീരുമാനിച്ചു. ഒന്നു വിശദമായി യൂണിക്കോഡ് 5.1 വായിക്കാന്‍ ഇതുവരെ സമയം കിട്ടീട്ടില്ല. എന്നിട്ടെഴുതാം.

സിബൂന്റെ മോളില്‍ക്കാണിച്ച (ആധികാരികമായ?) കുറിപ്പില്‍ 2 വങ്കത്തരങ്ങളുണ്ട്.
1. ചില്ലക്ഷരം കൂട്ടക്ഷരമുണ്ടാക്കില്ലെന്ന മിനിമം ധാരണയുടെ കുറവും (യൂണിക്കോഡും ഇത് പിന്തുടരുന്നു) /ന്റ/ യുടെ ഫോര്‍മേഷന് പിന്തുടര്‍ന്ന രീതിയുടെ തെറ്റായ വ്യാഖ്യാനവും.

2. /ങ്ക/ യും /ഞ്ച/ യും /ണ്ട/ യും /ന്ത/ യും /മ്പ/ യും പോലെ അനുനാസികവും ഖരവും ചേര്‍ന്നുണ്ടാകുന്ന ലിപി ലോപിച്ചുപോയ റ്റവര്‍ഗ്ഗത്തിന്റെ കൂട്ടക്ഷരമാണ് /ന്റ/ എന്നറിവ്.

സിബു ആണവചില്ലുവാദത്തിന് ന്റയെ കരുവാക്കിയതിന്റെ പ്രത്യാഘാതമാണ് ഇപ്പോള്‍ അനുഭവിക്കുന്നതെന്ന് പ്രത്യേകം പറയേണ്ടല്ലോ.
ആണവ ചില്ലിന്റെ പുലിവാലുകള്‍ എടുത്താല്‍ പൊങ്ങാത്തവയും.