Monday, June 4, 2012
29. संगणक है थोडासा इलेक्ट्रॉनिक्स -- हो
29. संगणक है थोडासा इलेक्ट्रॉनिक्स
संगणक दिमागवाला यंत्र है यह उसकी विशेषता तो है क्योंकि दूसरे यंत्रोंका दिमाग नही होता। लेकिन यह दिमाग आया कहाँसे? या यह पूछें कि संगणकका मस्तिष्क बनाना मनुष्य के लिये कैसे संभव हुआ?
इसका रहस्य है सेमीकण्डक्टरकी खोज। ये सेमीकण्डक्टर सिलीकन धातूसे बनाये जाते हैं। दुनियाभरमें फैली हुई बालू सिलीकनका ही पदार्थ -- सिलीकन डायऑक्साइड है।
रसायनशास्त्रके विद्यार्थि जानते हैं कि सिलिकनके परमाणुमें अन्तिम Orbit पर ४ इलेक्ट्रॉन घूमते रहते है। स्टेबल ऑरबिट के लिये आठ चाहिये। इसलिये शुद्ध सिलिकनके दो परमाणु एकत्र होकर अपने अपने ४-४ इलेक्ट्रॉन शेअर करते हैं। ऐसे सिलिकनकी एक पतली परत (जिसे वेफर कहते हैं) बिजलीकी कुचालक होती है, लेकिन थोडेसे प्रयत्न से उसे थोडे प्रमाणमें सुचालक बनाया जा सकता है, इसीलिये सिलिकनको सेमीकण्डक्टर कहते हैं। कतिपय अन्य धातू भी सेमीकण्डक्टर हैं।
इसी प्रकार बोरोन धातुके परमाणूमें आखरी Orbit में ३ इलेक्ट्रॉन घूमते हैं, जबकि फॉस्फरस धातुके परमाणुमें आखरी Orbit में ५ इलेक्ट्रॉन घूमते हैं।
सिलीकनकी पतली पट्टीमें अत्यल्प मात्रामें अशुध्दीके रूपमें यदि फॉस्फरसके परमाणु हों तो उसके परमाणूके ऑरबिट से केवल चार इलेक्ट्रॉन सिलीकनके परमाणूके साथ शेअर होंगे लेकिन पाँचवा इलेक्ट्रॉन जो अब एक्स्ट्रा हो गया है, वह ऑरबिट छोडकर घूमने निकलता है। वह सिलीकनके किसी परमाणूके एक इलेक्ट्रॉनको धक्का देकर उसकी जगह ले लेता है। यह नया इलेक्ट्रॉन फिर किसी और परमाणुके इलेक्ट्रॉनको धक्का देता है।
इस प्रकार फॉस्फोरसे सिलीकनकी ओर जानेवाले एक अति सूक्ष्म इलेक्ट्रॉनके प्रवाहका निर्माण होता है। इस प्रक्रियाको N डोपिंग कहते हैं क्योंकि विद्युत्-भार ले जानेवाला कारक घटक इलेक्ट्रॉन ऋणात्मक है। इसके विपरित सिलीकन-बोरोनकी जोडी हो तो उसे पॉझिटिव्ह डोपिंग या P डोपिंग कहते हैं।
अब यदि हम एक P डोपिंग और एक N डोपिंग वाली दो पट्टियाँ एक साथ चिपकायें, तो उसे PN junction कहते हैं और यह जोडी किसी डायोड (व्हाल्व्ह) की तरह काम करती है। जोड-पट्टीके दोनों ओर इलेक्ट्रोड लगाकर छोटे पेन्सिल सेलसे बिजली सप्लाय देनेपर एक छोटा विद्युत-प्रवाह एक दिशामें बहने लगता है लेकिन दूसरी दिशामें अटक जाता है। इसीलिये इससे डायोड जैसा काम लिया जा सकता है, परन्तु अति सूक्ष्म पैमानेपर इसे जंक्शन डायोड भी कहते हैं। डायोड मतलब जैसे वन-वे ट्रॅफिक चलवानेवाला पुलिस।
डायोडसे अगली क्रिया है ट्रायोड। यदि एक PN जंक्शन की पट्टी और एक NP जंक्शन की पट्टी एकसाथ जोडनेपर वे ट्रायोडकी तरह काम करते हैं। इन्हें NPN अथवा PNP दोनों पद्धतीसे जोड सकते हैं। ऐसे ट्रायोडको चलानेके लिये बहुत कम बिजली की आवश्यकता होती है। ऐसे सेमीकण्डक्टर ट्रायोड के आविष्कारसे पहले 1903 से 1910 के दौरान वॅक्यूम ट्यूब आधारित डायोड व ट्रायोडका आविष्कार इलेक्ट्रॉनिक्सकी दुनियाका अति महत्वपूर्ण आविष्काार था, बल्कि सही कहा जाय तो वहींसे इलेक्ट्रॉनिक्सका आरंभ माना जाता है। ट्रायोड दो प्रकारसे काम करता है -- amplifier व oscillator की तरह। उसीकी सहायतासे रेडियो ट्रान्समिशन का आविष्कार संभव हुआ था। लेकिन ऐसे वॅक्यूम ट्यूब आधारित ट्रायोडके लिये बडी जगह और २१० व्होल्टका बिजलीका सप्लाय चाहिये। और भी एक मर्यादा थी कि ये ट्रायोड ऍनालॉग (analog) पद्धतीसे काम करते हैं
लेकिन १९६० के आसपास सेमीकण्डक्टरका आविष्कार होनेपर छोटे सेलपर चलनेवाले छोटे आकारके ट्रायोड बनाना संभव हुआ और उनका नाम पडा ट्रान्झिस्टर. रेडियो ट्रान्समिशन के क्षेत्रमें सेमीकण्डक्टर ट्रायोड अर्थात ट्रान्झिस्टर्सने ऐसी धूम मचाई कि रेडियो स्टेशन के कार्यक्रम सुननेके लिये रेडियोकी जगह जो नया छोटा उपकरण आया उसका नाम भी ट्रान्झिस्टर ही पडा।
इस प्रकार सेमीकण्डक्टर ट्रायोड अर्थात ट्रान्झिस्टरका ऍनालॉग पद्धतीसे उपयोग कर amplifier किंवा oscillator सर्किटके डिजाइनमें सुधार करने और ट्रान्समिशन तथा रिसेप्शन की क्वालिटीमें सुधार लानेके नयो नयो प्रयोग रेडियो व संगीत-प्रसारणकी दुनिया में चलही रहे हैं। इसके लिये पीसीबी (Printed Circuit Board) पर अलग-अलग ट्रान्झिस्टर जोडकर सर्किट तैयार करते हैं और उनसे कित्येक काम करवा लेते हैं। इन्हें इंटिग्रेटेड सर्किट (आय सी) कहते हैं।
लेकिन किसी प्रज्ञावान को सूझा कि उस संगीतकी और रेडियो ट्रान्समिशन की दुनिया को छोड दें तो ट्रान्झिस्टरका एक अलग ही उपयोग है जिसमें उससे मुख्यतः digital पद्धतीसे काम करवाया जा सकता है। इस प्रकार डिजिटल इलेक्ट्रॉनिक्सका आरंभ हुआ। इंटिग्रेटेड सर्किटमें भी डिजिटल सर्किट आने लगे। इंटिग्रेटेड सर्किट में ट्रान्झिस्टर्सको अलग- अलग प्रकारसे जोडकर (कॉम्बिनेशन कर) गेट्स बनाते हैं। OR-NOR, AND-NAND, XOR - XNOR, और NOT ये सात मुख्य गेट्स हैं। ये सभी गेट इंटिग्रेटेड सर्किटके प्रकार होते हैं । विविध गेटं खास खास पद्धतीसे जोडनेसे उनके मार्फत विशिष्ट काम कराये जा सकते हैं।
इससे अगली सीढी है मायक्रोप्रोसेसर। एक जमानेमें लाखों और अब करोडों गेट्स को विशिष्ट पद्धतीसे जोडकर मायक्रोप्रोसेसर बनता है जो स्पीडमें और विविध कामोंमें आयसी का अपेक्षा हजारों गुना भारी काम करता है। तंत्रज्ञान को छोटे आकार तक ले जानेका यह एक उदाहरण है। एक-एक मायक्रोप्रोसेसरके डिझाइनके रिसर्चमें लाखो डॉलर्सका खर्च होता है लेकिन उससे उतनेही भारीभरकम काम भी करवाये जा सकते हैं।
ये हुआ मायक्रोप्रोसेसरोंका इतिहास। यही संगणकका मस्तिष्क बनकर अपने काम करता है।
----------------------------------------------------------------------
संगणककी इलेक्ट्रॉनिक भाषा और ग्रंथ-संग्रह (e-data storage)
दुनियाभरकी साडेछः अरब जनसंख्यामें करीब डेढ अरब लोग भारतीय भाषा बोलते, लिखते हैं और संगणक तथा इंटरनेटपर लिखना चाहते हैं। उनके पास हजारों वर्षोंके साहित्यकी जमापूँजी है। यह सारी हम सबोंकी साझा या एकत्रित सांस्कृतिक विरासत है जो हमें संगणकपर एकात्म पद्धतीसे संभालकर रखना पडेगा। लेकिन यह सब कैसे होगा?
विश्वमें कुल चार वर्णमाला हैं –
1) ब्राह्मी से उत्पन्न जो भारत, तिब्बत, नेपाल, मलेशिया, थायलंड, इंडोनेशिया, श्रीलंका की मूल भाषाओंकी वर्णमाला है। मोटामोटी इसे हम देवनागरी कह सकते हैं -- जिसकी विभिन्न वर्णाकृतियाँ हमें इन भाषाओंकी सद्यतन लिपियोंमें देखनेको मिलती हैं।
2) चायनीज, मंगोलियन, जपान तथा कोरियन भाषाओंकी वर्णमाला
3) अरेबिक व फारसी भाषाओंकी वर्णमाला
4) ग्रीकसे उत्पन्न अथवा उसकी सदृश लॅटिन, रोमन, सिरीलीक इत्यादी यूरोपीय वर्णमालाएँ।
संगणकपर टायपिंग करनेके लिये हुमें कौनसी लिपियाँ उपलब्ध हैं यह जाननेके लिये हम कण्ट्रोल पॅनलके रिजनल और लँग्वेज मेनूमें जाते हैं। वहाँ हमें दुनियाभरकी कितनी सारी वर्णमाला और भाषाओंके पर्याय दिखते हैं -- अरेबिक, चीनी, कोरियन, व्हिएतनामी, हिब्रू, बाल्टिक, सिरिलिक, रशियन, ग्रीक.... लेकिन एकभी भारतीय भाषा का नाम वहाँ नही दिखेगा। यह किस निकम्मेपनके कारण है, वह कैसे जायगा?
लेकिन पहले जरा यह भी देखें कि संगणककी भाषाका मानवी भाषासे क्या संबंध है और इसमें अंगरेजी का रोल क्या रहा है।
पहले देखते हैं कि संगणककी इलेक्ट्रॉनिक भाषा, जिसे मशीन-भाषा (machine language) कहते हैं, क्या है। मानवी-भाषा और मशीन-भाषामें परस्पर आदानप्रदान होनेके लिये किस किस तंत्रका ध्यान रखना पडता है। मशीन-भाषा का अर्थ है द्वि-अंश पद्धतीकी गणिती-भाषा जहाँ मशीन केवल 0 व 1 नामक दो संकेत ही समझ सकता है, लेकिन उनकी आठ-बिटवाली अक्षर-श्रृंखला बनाकर अंग्रेजीकी पूरी वर्णमाला (ग्रीको-रोमन) संगणक पर उतारी जा सकती है। इस वर्णमाला की विशेषता है कि इसमें सबसे कम अक्षर हैं और यह लीनीयर है अर्थात एक अक्षरको दूसरे में मिलाया नही जाता बल्कि एक के बाद एक लिखा जाता है। अन्य तीनों वर्णमालाओंमें अक्षर भी अधिक हैं और उन्हें एक दूसरेमें गूँथकर लिखा जाता है।
कॅरॅक्टर-कोड स्टॅण्डर्डायझेशन (अंगरेजी का उदाहरण लेकर)--
मैंने अपनी सहेलीसे कहा कि मेरा नाम लिखनेके लिये अंग्रेजी वर्णमालाका बारहवाँ, पांचवाँ, पांचवाँ, चौदहवाँ और पहला अक्षर लिखो, तो वह लिखेगी - LEENA क्योंकि वर्णमालामें इन अक्षरोंकी नियत जगह होती है।
संगणकमें भी अक्षरोंकी जगह उनकी अक्षर-श्रृंखला के रूपमें नियत करनी पडेगी। हमने पहले देखा कि आठ-बिटकी पद्धतिमें मशीन-भाषाके लिये कुल 256 अक्षर-श्रृंखलाएँ उपलब्ध हैं। इनमेंसे निश्चित कौनसी श्रृंखला किस अक्षरको दी है यह सारणी-रूपमें लिखकर संगणकके प्रोसेसरको निर्देशके रूपमें बताना पडता है। इस सारणीको कॅरॅक्टर-कोड कहते हैं। दो अलग तज्ज्ञ (प्रोग्रामर्स) अपने अपने अलग कॅरॅक्टर-कोड बना सकते हैं लेकिन फिर दोनों संगणक एकदूसरे पर लिखी बात को नही पढ सकते। संगणक-विकासके आरंभिक दिनोंमें ऐसा हुआ।
तब कई दूरदर्शी व्यक्ति एकत्रित हुए और खूब सोच-विचारपूर्वक तय किया कि अंग्रेजी अक्षरोंका एक ही स्टॅण्डर्ड कॅरॅक्टर-कोड रखना पडेगा। इस स्टॅण्डर्ड कॅरॅक्टर-कोड का निर्णय करनेसे पहले भाषाविद्, संगणक शास्त्रके जानकार और जिन्होंने बारंबार संगणकके साथ काम किया ऐसे सब लोगोंकी राय ली गई। इस प्रकार अंग्रेजीके लिये ASCII स्टॅण्डर्ड बना। यह प्रक्रिया1960 से ही आरंभ हुई। तब A, B, C, D … के लिये जो मशीन-अक्षर-श्रृंखला तय हुई वही आज विश्वके प्रत्येक संगणकपर लागू है।
उदाहरण के लिये A का कोड है 0100, 0001. (यहाँ पढनेकी सुविधाके लिये मैंने चार-चार बिटोंके बीच अंतर छोडा है). इस प्रकार अंग्रेजी अक्षरोंकी मशीन-भाषाकी जगह निश्चित हो गई।
बडी क्षमतावाले प्रोसेसर और विकसित संगणक आनेके बाद 1986 के आसपास ASCII स्टॅण्डर्ड से अधिक उपयोगी युनीकोड स्टॅण्डर्ड धीरे धीरे विकसित होने लगा। उसमें सोलह-बिटोंकी अक्षर-श्रृंखला प्रस्तावित हुई जिससे अक्षरोंके लिये कुल 65536 स्थान प्राप्त हुए। फिरभी अंग्रेजी अक्षरोंके लिये ASCII स्टॅण्डर्ड में जो स्थान थे उन्हें बदलनेका प्रस्ताव नही उठाया गया -- केवल प्रत्येक अक्षरके ASCII संकेतके पीछे 8 शून्य लगा दिये।
इस प्रकार आठ-बिट पध्दतिमें
A अक्षर के लिये 0100 0001 तथा
a अक्षर के लिये 0110 0001 संकेत हैं।
तो सोलह-बिट पध्दतिमें
A अक्षर के लिये 0000 0000 0100 0001 तथा
a अक्षर के लिये 0000 0000 0110 0001 लिखना निश्चित हुआ।
इसी सूत्रको रखते हुए अंग्रेजीके सभी अक्षर, सारे विराम चिन्ह, अन्य चिन्ह और आँकडोंके लिये पहले जो जो स्थान नियत थे उनके लिये सोलह-बिटके स्टॅण्डर्ड तय करते हुए कोई परिश्रम नही करने पडे, कुछ यूरोपीय भाषाओंको अधिक अक्षर-चिह्नोंकी आवश्यकता थी जैसे फ्रेंच, जर्मन, स्वीडीश,या सिरीलिक वर्णमाला वाली पूर्व-यूरोपीय-रशियन भाषाएँ। उनके लिये भी युनीकोड-संकेत इसी प्रकार निश्चित किये गये।
आँकडोंका अनोखा स्टेटस
यहाँ आँकडोंकी बाबत एक महत्वपूर्ण मुद्दा उपस्थित होता है। कोई भी आँकडा लिखा जानेपर जैसा दिखेगा वह उसका भाषागत रूप है। लेकिन गणिती रूप वह है आँकडेका गणितीय मूल्य बताता है जो हिसाब करनेके लिये चाहिये। ये दोनों रूप संगणकको अलग दिखेंगे तभी संगणक जानेगा कि उसे गणित करना है या नही। वर्ड सॉफ्टवेअर नही जानता कि गणितीय मूल्य क्या है जबकि एक्सेलमें लिखे फॉर्मूलेपर संगणक गणित करता है, इसी कारण एक्सेलमें सॉर्टिंग, ग्राफ, गणितं, फार्म्युला, चार्ट इत्यादी किया जा सकता है। इसके लिये एक्सेल प्रोग्राममें भाषारूप आँकडेका गणिती मूल्य पहचाननेवाला एक सब-प्रोग्राम लिखा होता है। इसीलिये क्सेलमें लिखी सारणीको मैं बुध्दिमान सारणीका विशेषण लगाती हूँ।
2 के आँकडेके भाषागत रूपके लिये निम्न श्रृंखला नियत है --
0011 0010
लेकिन 2 का गणिती मूल्य लेकर हिसाब-किताब करना हो तो संगणक उसे
0000 0010
लिखकर गणित करेगा।
जब हम उसे 2 गुणा 4 का गणित देते हैं तो उत्तर है आठ। गणित करते हुए संगणक को उसका गणितीय रूप
0000 1000
दिखेगा। संगणक उसे पहले भाषाके रूपमें उसकी स्लेट अर्थात रॅमपर लिख लेगा जो है --
0011 1000
फिर एक अन्य सूचना का अनुसरण कर हमें पडदेपर 8 की आकृति लिख देगा।
इससे थोडा गहन उदाहरण देखते हैं। 3 x 9 = 27 -- इस गणितको करते हुए गणिती भाषामें उत्तर 0001 1011 प्राप्त होगा, लेकिन संगणकको इतनी समझ होती है कि इसके भाषाइ रूपमें दो आँकडे हैं जिनमेंसे पहलेको पडदेपर लिखनेके लिये 0011 0010 (अर्थात 2) व दूसरेको भाषारूपाने 0011 0111 ( अर्थात 7) लिखना है।
इन उदाहरणोंसे स्पष्ट होता है कि प्रत्येक अंक अथवा अक्षरके लिये संगणकमें उपलब्ध 256 प्रकारकी श्रृंखलाओंमेंसे एक निश्चित श्रृंखला बहाल करना और विश्वके सारे प्रोग्रामर्स द्वारा उस अक्षरके लिये वही श्रृंखला उपयोगमें लाना कितना आवश्यक है।
अक्षर-लेखन-विधी
एकबार फिर अक्षरलेखन विधीका पाठ दुहराते हैं। सीधा स्लेट-पेन्सिलसे लिखना हो तो हम पहले मनमें A अक्षर विचारते हैं। तत्काल मनःचक्षूके सम्मुख एक वर्णाकृति उपस्थित होती है और उसीको हम स्लेटपर उकेरते हैं।
अब याद करो कि टंकनयंत्र आनेपरक्या हुआ। अब मनःचक्षूके सम्मुख दो बातें उपस्थित होने लगीं -- अक्षरकी वर्णाकृति कैसी है औऱ टंकनयंत्रके कीलफलक पर उस अक्षरकी कील कहाँ है । सारांश यह कि यद्यपि दृश्य-वर्णाकृति नही बदली फिर भी निर्देश-तंत्र बदला तो हमारे मनने दोनोंका भिन्नतासे विचार करना भी सीख लिया।
इसीकी अगली कडी है संगणक। अतः अब हमारे मनको एक तीसरी बात भी समझनी पडेगी। दृश्य- वर्णाकृति (अर्थात संगणकके पडदेपर दिखनेवाला फॉण्ट) और निर्देश-तंत्र (अर्थात संगणकके कुंजीपटल पर उस अक्षरके लिये दबाई जानेवाली कुंजी) के अतिरिक्त मशीनी अक्षर-श्रृंखला अर्थात कॅरॅक्टर-कोड जिसे संगणकका प्रोसेसर समझ सके व अपने संग्रह-तंत्रमें संग्रहित कर सके, यह तीनों आवश्यक हो गये। संगणकके लिये जब भी कोई आज्ञावली या सॉफ्टवेअर बनाते हैं और जब उनके स्टॅण्डर्डायझेशन की बात करते हैं तब तीनों बातोंपर विचार करना पडता है।
इस प्रकार संगणकसे अक्षर-लेखनमें कॅरॅक्टर-कोडिंग अर्थात किस अक्षरकी कौनसी अक्षऱ-श्रृंखला हो, आवश्यक रहा । इसीके आधारपर संग्राहकमें डाटा-स्टोअर करते हैं। अंग्रेजी भाषाके लिये इसका स्टॅण्डर्डायझेशन किया गया औऱ युनिकोड स्टॅण्डर्ड सद्य-प्रचलित है।
एक बार फिर दुहराना उचित है कि संगणकके अंदर संग्रह के लिये कॅरॅक्टर-कोड का स्टॅण्डर्डायझेशन है --जबकि कुंदीपटलका लेआउट निर्देश-तंत्रका स्टॅण्डर्डायझेशन दर्शाता है। अंग्रेजीके लिये की-बोर्ड काquerty नामक स्टॅण्डर्ड भारतके सब संगणकोंपर चलता है।
वर्णाकृतिके स्टॅण्डर्डायझेशनमें अक्षर कैसा दिखेगा यह तय होता है। अंग्रेजीके फॉण्टसेट एरियल, ताहोमा, टाईम्स न्यू रोमन इत्यादी सबके परिचित हैं।
संगणकपर टंकन काम आरंभ करते ही पहले संगणकको बता देते हैं कि अक्षरकी अमुक भाषा, अमुक स्टॅण्डर्ड फॉण्ट, अमुक बडा-छोटा आकार और अमुक रंग चाहिये । ये सारे निर्देश औऱ उनके अनुरूप टंकन किया गया गद्य वह अपनी मशीन-भाषामें संग्रहित करके रख लेता है।
संगणकपर अरेबिक अथवा चीनी वर्णमालाके लिये भी इन तीनों प्रकारके स्टॅण्डर्डायझेशन आवश्यक थे । अरेबिक के लिये सारे अरब देशोंने तथा चीनी के लिये चीन-जपान-कोरियाने अपनी राजकीय मतभिन्नता भुलाकर एक साथ बैठकर ये तय किये। ये घटना सन २००० के आसपास घटी।
दिग्भ्रमित भारतीय
भारतीय भाषाओंके लिये भी यह तीन प्रकारके स्टॅण्डर्डायझेशन आवश्यक हैं. इतना तो सब जानते हैं। भारतियोंने आयटी के क्षेत्रमें बडी छलाँग लगानेकी बात १९८१ से ही की है। तो फिर स्टॅण्डर्डायझेशन के लिये विगत ३०-३५ वर्षोंमें क्या कोई प्रयास हुए इसका उत्तर है - हुए, लेकिन आठ-बिटकी अक्षर-श्रृंखला लेकर, डगमगाते कदमोंसे, बेमेल ढंगसे और भारतीय बाजार जीतनेकी स्पर्धामें कॅरॅक्टर-कोडका स्टॅण्डर्डायझेशन किये बगैर हुए। बेमेल शब्द भी कम है, यह कहना पडेगा कि परस्पर-संवाद को पूर्णतः टालकर अपने-अपने कॅरॅक्टर-कोड बने। अपनीही भाषाओंका कितना नुकसान हो रहा है, इसकी परवाह किये बगैर हुए। इसीसे वे सारे प्रयास न तो समुपयुक्त हुए न पूर्णता से हुए। यदि पूछो कि इस अधूरेपनके लिये कौन जिम्मेदार था तो सब कहेंगे "मैं नही, हाँ -- शायद कोई और" लेकिन "मैं दृढतापूर्वक इसे पूर्ण करवाऊँ " ऐसे संकल्पकी क्षमता किसीमें नही दिखी -- तब भी नही और आजतक भी नही।
हमारे प्रयासोंमें कहाँ कमी रही -- इसे सारांशतः समझ लेना चाहिये।
आठ-बिटके युगमें ही 1988 में भारत सरकारका इलेक्ट्रॉनिक्स विभाग, उसीके अंतर्गत सी-डॅक कंपनी तथा BIS ने (Bureau of Indian Standards --यह भी भारत सरकारका एक अंग है।) भारतीय अक्षर-श्रृखलाओंके लिये ISCII स्टॅण्डर्ड तय करने के लिये कमिटीकी स्थापना की। संस्कृत वर्णमाला ध्वनी-संकेतोंपर आधारित है और वही वर्णमाला अन्य सभी भारतीय लिपियोंका मुल आधार है। इस तथ्यका उपयोग कर सभी भारतीय लिपियोंके लिये एकही हो ऐसा उपयुक्त कॅरॅक्टर-कोड तैयार हुआ। इस कोडमें क, ख, ग.. आदि प्रत्येक वर्णाक्षरकी आठ-बिटकी अक्षर-श्रृंखला एकही रही, फिर लिपी चाहे मराठी हो कि बंगाली, उडिया हो कि मल्याळी। कुंजीपटलके लिये भी वर्णाक्षरोंके ही अनुक्रम वाला और नये सीखनेवाले अत्यंत सरलतासे सीख सकें ऐसा इन्स्क्रिप्ट की-बोर्ड-डिझाइन भी तय हुआ। प्रयोगकी खातिर लम्बी दूरीकी रेल्वेके आरक्षण चार्टकी लिस्टें सारी भारतीय लिपियोंमें बनवाकर यह सिद्ध कर दिया कि यह स्टॅण्डर्ड सरल था, परिपूर्ण था और सारी भारतीय भाषाओंकी (साथ ही सिंहली, सयामी, तिब्बती आदि की) एकात्मता को दृढ करनेवाला था। इस प्रयासपूर्वक रचे गये स्टॅण्डर्डको BIS ने 1991 में मान्यता प्रदान करते हुए उसे IS 13194:1991 यह क्रमांक दिला.
इस प्रारंभिक उत्तम कामके बाद सी-डॅककी नीति अचानक बदली। 1988-91 के दौरान संगणकपर भारतीय भाषामें टंकनके लिये सॉफ्टवेअर तैयार करनेवाली कई कंपनियाँ चल निकलीं। अब देखते हैं कि इन कंपनियोंने निर्देश-तंत्र, वर्णाकृति और कॅरॅक्टर-कोड इनमेंसे प्रत्येककी बाबत क्या किया।
प्रथम चर्चा -- निर्देश-तंत्र -- कुंजीपटलकी किस कुंजीसे कोनसा अक्षर लिखा जाय। संगणक आनेसे पहले टाइप-राइटरोंमें प्रायः गोदरेज और रेमिंगटन टाइप-राइटर चलते थे , अधिकांश कंपनियोंने संगणकके की-बोर्डपर वही अनुक्रम रखा, ताकि पूर्वकालसे टाइपिंग करनेवाले शीघ्रतासे संगणक को अपना सकें। लेकिन नया सीखनेवालोंके लिये भी यह उतना ही कष्टसाध्य था जितने पुराने टाइप-राइटर (करीब १ वर्ष की ट्रेनिंग)। केवल सी-डॅकही एक कंपनी थी जिसने गोदरेज अनुक्रम और इनस्क्रिप्ट दोनों पर्याय रखे थे। इनस्क्रिप्टके डिझाइनमें मोहन तांबे नामक संगणक तज्ज्ञका बहुत बडा योगदान था। उनकी सोचके कारण ही यह संभव था कि संगणक सीखनेवालोंकी नई पीढी सरलतासे भारतीय भाषामें टंकन सीख सके। पुराने अनुक्रमका भी पर्याय उपलब्ध होनेसे पुराने टाइपिस्टोंको संगणक अपनानेमें कोई दिक्कत नही होती।
इन्स्क्रिप्टके कारण तमाम भारतीय भाषाओंकी एकरूपताको भुनाया जा सकता था। मैं खुद कई बार संस्कृत श्लोक और उनके हिंदी अर्थ संगणकपर देवनागरीमें टाइप कर पूरे पन्नेको एक झटकेमें असमियामें बदलकर अपने असमिया मित्रोंको भेजती थी। ऐसी लिखावटमें भाषा नही बदलती थी, केवल लिपी असमिया हो जाती थी। जब मेरे मित्र वह पन्ना असमिया बच्चोंको पढने देते थे तो असमिया लिपी के कारण उसे पढना उनके लिये सरल था और उन्हें संस्कृतके साथ अनायास हिन्दी सीखनेके लिये भी यह उपयोगी था।
द्वितीय चर्चा - दृश्य-वर्णाकृति - अक्षरोंके लिये विभिन्न आकृतियोंके चित्ररूप डिझाइन बनाना। कॅलिग्राफीकी तरह यह भी कलात्मक एवं कुशलताका, बहुशः चित्रकारका काम होता है और इसका खर्च भी अधिक होता है। विभिन्न भारतीय भाषाओंके सुंदर अक्षरोंके लिये मुंबईके जे.जे. स्कूल ऑफ आर्ट्सके कई जानेमाने तज्ज्ञ काम करते थे, जिनमें रा.कृ. जोशी का बडा योगदान था।
इन सब प्रयासोंके फलस्वरूप भारतीय लिपियोंके लिये कई अच्छे वर्णाकृति- संच (फॉण्टसेट) बने। आजकी तारीखमें १०० से भी अधिक फॉण्ट-सेट उपलब्ध हैं। जैसे -- लीप, श्री, कृतिदेव, आकृति इत्यदि ब्रॅण्डवाले फॉण्टसेट. ऐसे अलग अलग फॉण्ट उपलब्ध होनेका बहुत बडा फायदा प्रकाशनके व्यवसाय में है। क्योंकि इनके लिये आवश्यक फॉण्ट विविधता मिल जाती है जो प्रकाशनकी सुंदरता बढाती है। साथ ही संगणकपर देरतक काम करनेवालेके लिये भी फॉण्ट-फटीग (एकही फॉण्ट देखते रहनेसे होनेवाली बोरियत) टालने हेतु फॉण्ट-विविधता आवश्यक है। ये सारे फॉण्ट-सेट संगणककी फॉण्टबँकमें रखे जाते हैं । टंकनका काम शुरू करनेके समय हम अपना फॉण्ट, उसका रंग, आकार इत्यादि चुनकर संगणकको निर्देश दे सकते हैं और बीच-बीतमें जब चाहें इन्हें बदल भी सकते हैं।
बिचली चर्चा – कॅरॅक्टर-कोड – यहाँ आकर हमारे संगणक-विकासकी दिशा भ्रमित हो गई। की-बोर्ड लेआउटका डिझाइन या वर्णाकृति का डिझाइन संगणक-विशेषज्ञ नही बनाते। लेकिन कॅरॅक्टर-कोड बनाना और संगणकको उससे अवगत कराना संगणक-विशेषज्ञका काम है। आठ-बिट से मिलनेवाली 256 श्रृंखलाओंमें से किस अक्षर के लिये कौनसी प्रयुक्त हो यह स्टॅण्डर्ड तो संगणक-विशेषज्ञोंने 1991 में तय कर दिया लेकिन उसे किसीने अपनाया नही। प्रत्येक कंपनीने अपना खुदका प्रोप्राएटरी व गुप्त कॅरॅक्टर-कोड बनाया। कुंजीपटलपर अक्षर-अनुक्रम भले ही सबने एकसा रखा हो, लेकिन प्रोसेसरको निर्देशित करनेवाले कॅरॅक्टर-कोड सबने अलग-अलग बनाये -- सी-डॅकने भी। कॅरॅक्टर-कोडसे ही प्रोसेसर अक्षरोंको व दिये गये काम को समझ सकता है और किये गये कामको संग्राहकमें संग्रहित करता है। यही कॅरॅक्टर-कोड जब "टॉप बिझिनेस सिक्रेट" के नामपर अनस्टॅण्डर्ड रखा जाता है, तब तीन बातें होती हैं। पहली बात कि आपका ग्राहक आपका कैदी बन जाता है, क्योंकि उसके कई सॉफ्टवेअर आपकी मदद के बिना नही चलेंगे। उसकी फाइलें दूसरे के संगणकपर तभी पढी जा सकेंगी अगर दूसरेनेभी आपकाही सिस्टम लगाया हो। दूसरी बात यह कि आपकी सिस्टम लगानेके बाद यदि उसीपर आधारित कोई दूसरा ऍप्लिकेशन विकसित होता है तो उसे आपकी अनुमति भी चाहिये और रॉयल्टी भी देनी पडेगी। ये दोनों बातें आपके बिझिनेसको समृद्ध करती हैं। तीसरी बात यह कि कॅरॅक्टर-कोडमें स्टॅण्डर्डायझेशन न होने के कारण दो लोगोंके आपसी कम्युनिकेशनमें बार-बार दिक्कतें आती रहेंगी और समाज या देशमें संगणक-आधारित भाषाई तरक्की रुक जायगी।
ऐसी परिस्थितिमें प्रायवेट कंपनियाँ और सरकारी सी-डॅक संस्था दोनोंने फैसला लिया कि उन्हें स्टॅण्डर्डायझेशन नही चाहिये। इस प्रकार कॅरॅक्टर-कोड का BIS द्वारा अनुमोदित सरल-सुंदर स्टॅण्डर्ड ठंडे बस्तें में पडा रहा और सी-डॅकने व्यापार की सोचसे एक अलग टॉपसीक्रेट कॅरॅक्टर-कोड रचकर अपने सॉफ्टवेअरों में डालना आरंभ किया ।
भारतीय भाषाओंमें व्यंजनमें स्वर जुडते हैं, और व्यंजनमें व्यंजन जुडकर संयुक्ताक्षर तैयार होते हैं । तो हमें एक और स्टॅण्डर्डकी आवश्यकता पडेगी कि इन्हें कैसे जोडा जाय । इसके लिये सी-डॅकने ISFOC नामक सॉफ्टवेअर तैयार किया है लेकिन उसे भी प्रोप्रायटरी झोनमें और टॉपसीक्रेट रखा है।
तो यह कहानी है कि किस प्रकार बाजारकी स्पर्धामें भाषाई समृद्धी गौण हो गई।
सी-डॅक सहित सभी कंपनियोंने अपने देशी भाषाई सॉफ्टवेअरकी कीमतही भी जमकर लगाई। जब अंग्रेजी भाषा लिखनेका सॉफ्टवेअर करीब-करीब मुफ्त था तब देशी भाषा लिखनेके लिये सॉफ्टवेअरका खर्च रू.15000 था।
इसके तत्काल तीन नुकसान हुए जो आज भी हो रहे हैं।
1) इतना महँगा सॉफटवेअर केवल भाषाप्रेमके कारण लेना किसी सामान्य ग्राहक के लिये संभव नही था। नतीजा -- कई लोग कई वर्षोंतक अंग्रेजीसे ही निभाते रहे -- आज भी और आगे भी वही करेंगे।
2) फिर भाषा-प्रेमके कारण इतना महँगा सॉफटवेअर लेकर भी जो लिखा उसे किसी और के संगणकपर पढ भी नही सकते, जबतक वह भी उतने पैसे खर्च ना करे। उसके संगणकपर अक्षरोंकी जगह आयत, प्रश्नचिन्ह, आदि सब कुछ junk (जंक) ही दिखेगा।
स्टॅण्डर्ड कॅरॅक्टर-कोड का उपयोग सबके लिये एक जैसा ही होता। उसे लागू करनेका विधान बनानेमें सरकार चूक गई। यदि नॉनस्टॅण्डर्ड कोड हो तो उसका सोर्स प्रकट करनेका भी विधान आवश्यक था। यहाँ सरकार और सी-डॅक दोनोंकी अदूरदर्शिता और देशी भाषाओंके प्रति उपेक्षा स्पष्ट दीख जाती है। आरंभिक दिनोंमें भाषाई सॉफ्टवेअर के लिये सबसे बडी ग्राहक सरकारी संस्थाएँ थीं। इसलिये यह विधान सफल हो जाता। यह सब न होनेसे संगणकीय लेखनमें आदान-प्रदान ठप्प होते रहे । सं गच्छध्वं सं वो मनांसि जानताम की संस्कृतिवाले देशमें आदान-प्रदान मात खा गया और पैसा ही नीतियाँ बनाता रहा।
3) वर्ष 1995 में इंटरनेट भी सामान्य ग्राहक के घर पहुँच गया। ईमेलसे पत्राचार अति सुलभतासे होने लगा। लेकिन भाषाई लेखनमें कोई स्टॅण्डर्ड कॅरॅक्टर-कोड न होनेसे वह ईमेलपर जाते ही जंक होने लगा।
इस समस्याके सम्मुख जन-सामान्य ने घुटने टेक दिये। सुलभ आदान-प्रदानका सर्वाधिक लाभ प्रकाशकोंका होता। लेकिन वे भी इस सुपरफास्ट पद्धतिसे वंचित हो गये। यह समस्या आजभी कायम है।
पहले भी लोगोंको भ्रम था कि अंग्रेजीके बिना संगणकपर गुजारा नही हो सकता। इंटरनेटपर भाषाई लेखनकी दुर्गति देख वह भ्रम और भी दृढ होता चला गया उसकी यह शोककथा है।
दूसरा पक्ष देखें तो वर्ष 1988-92 के दौरान विण्डोज जैसी प्रगत ऑपरेटिंग सिस्टम अथवा ईमेल दोनोंही नही थे। फिरभी भारतीयोंने 256 उपलब्ध अक्षर-श्रृंखलाओंमें जैसे-तैसे भारतीय भाषाओंके कॅरॅक्टर-कोड बैठा लिये। हो सकता है उनमें दस प्रतिशत कमी रही हो, फिर भी भाषाई संगणक व्यवहार चालू होना एक बडी छलाँग माना जा सकता है। ISCII standard तथा कुंजीपटलका इन्स्क्रिप्ट-अनुक्रम यह दोनों बडी उपलब्धियाँ थीं। दूसरी भाषाई कंपनियोंका काम भी उपलब्धी ही थी। क्योंकि उनके कामके कारण भारतमें संगणक-साक्षरता देशोंकी तुलनामें बढरही थी। लेकिन अपने-अपने कॅरॅक्टर-कोड गौप्य एवं महँगे रखनेका दुराग्रह बढता ही रहा जो इन सारी उपलब्धियोंपर पानी फेर रहा था। सर्वस्पर्शी काम होनेकी बजाए एकके कामका उपयोग दूसरे के लिये शून्य था। उलटा उसे मेरे कामका उपयोग क्यों करने दूँ यही प्रवृत्ती थी। सबके कॅरॅक्टर-कोड एक ही होते तो सामान्यजनको अत्यंत उपयोग होते साथ ही उस कोडको भी ऑपरेटिंग सिस्टमका हिस्सा बनानेका आग्रह मायक्रोसॉफ्टके पास संगठित रीतिसे किया जा सकता था जैसे जपानने किया था। इसके विपरीत भारतीयोंमें दूरगामी चिंतन का अभाव है, एवं वे अपनी भाषाओंके प्रति दृढ नही हैं, यही चित्र दुनियाके सामने जा रहा था। यही कारण है कि आज संगणक-विश्वमें उच्चशिक्षित भारतीय संगणक इंजिनियरोंकी गिनति संगणक कुलीके रूपमें होती है, भले ही उन्हें तनखा अच्छी मिलती हो।
कमसे कम सी-डॅक द्वारा बनाया एक वर्णाकृतीसंच (फॉण्ट-सेट) ग्राहकको अत्यल्प कीमतपर दिया जा सकता था। वह भी केंद्र सरकार नही कर पाई और न राजभाषाकी माला जपनेवाले तमाम पार्लमेंट-सदस्य कर पाये। इसी कारण जनता के करोडों रुपयोंके बजेटपर चल रही और हर प्रकारकी गौरवास्पद तांत्रिक क्षमता रखनेवाली, पचासों फॉण्ट विकसित कर पानेवाली सी-डॅक सामान्यजन को संगणक-सुविधा देने के लिये कुछ भी नही कर रही और प्रकारांतरसे भारतीय भाषाओंको पीछे ढकेल रही है ऐसा चित्र कायम रहा।
चतुर्थ चर्चा –सोलह-बिट सिस्टमपर अन्य भाषाओंका विकास, युनीकोड की दशा और दिशा --
वर्ष 1995 के बाद जागतिक स्तरपर सोलह-बिट वाला और 65536 संकेत-श्रृंखला पर आधारित युनिकोड स्टॅण्डर्ड सीढी-दर-सीढी विकसित होने लगा, उसपर अरेबिक व चीनीसहित प्रत्येक वर्णमाला के लोगोंने अपनी-अपनी अक्षर-श्रृंखलाओंका प्रमाणीकरण किया. उस उस भाषा तथा वर्णमाला के सॉफ्टवेअर बनानेवालोंको अनिवार्यतः वही स्टॅण्डर्ड बंधनकारक हो गया। उनके संगणक-गत भाषाई कामोंमें सुसूत्रता व आदान-प्रदान वेगसे बढने लगे।
इसी दौरान जागतिक युनीकोड कन्सॉर्शियमने भारतीय भाषाओंके लिये स्टॅण्डर्ड तैयार करना चाहा। यह अच्छा मौका था जब भारतीय विशेषज्ञ भी नई उपलब्घ 65536 संकेत-श्रृंखला का उपयोग कर ISCII में परिपूर्णता लाते और युनीकोड कन्सॉर्शियमके सम्मुख वही स्टॅण्डर्ड विचारार्थ रखते। लेकिन तब भी हम अपनी दिग्भ्रमित अवस्थासे नही उभर पाये और यह न हो सका। सारे सॉफ्टवेअर विक्रेता अब भी पहलेकी तरह आठ-बिट श्रृंखलापर चलनेवाले गुप्त व नॉन-स्टॅण्डर्ड कोडकी ही विक्री करते रहे। आजभी उनके बीच गद्यसंकलनमें कोई एकात्मता नही है। और आज भी ई-मेल, इंटरनेट, वेबसाईट या वेब-आधारित कामोंमें भारतीय लिपियोंका काम अटक- अटक कर ही हो रहा है। वर्ष 1988-95 के दौरमें संगणक-क्षेत्रमें जो छलाँग लगाई वह अब विगत इतिहास बन चुका है और आरंभिक कालमें संगणक-साक्षरता में अग्रगण्य होते हुए भी आज हम सतत पिछडते जा रहे हैं।
युनीकोडने स्टॅण्डर्ड तो बना डाला और मोटामोटी BIS का स्टॅण्डर्ड ही स्वीकार किया। इसके कारण अब ई-मेल इत्यादी वेब-आधारित सुविधाएँ भारतीय भाषाओंपर भी लागू होने लगीं। यह हमारे लिये बडा फायदा था। लेकिन यह करते हुए हमारी भाषाओंकी ध्वन्यात्मक एकात्मता पूरी तरह पोंछ डाली। सारी भारतीय लिपियोंके लिये एकत्रित पद्धतिसे अक्षर-श्रृंखला निश्चित करनेके स्थानपर प्रत्येक लिपी के लिये एक अलग सेट (chunk ) बनवाया। इसका परिणाम हम यूँ समझें कि क अक्षर यदि मराठीमें हो तो अक्षर-श्रृंखला अलग होगी और मल्यालीमें लिखना हो तो अलग, बंगालीमें और भी अलग। इसलिये मैं यदि संगणकसे कहूँ कि मेरे मराठीमें लिखे भारत को तुम बंगालीमें दिखाओ तो वह नही कर सकेगा। भारतीय लिपियोंकी एकात्मता बरकरार न रखनेके कारण अब मेरी मराठीमें लिखी सामग्री को इतर लिपिमें तत्काल बदलनेकी सुविधा समाप्त हुई। अब यदि कोई वाङ्मय बंगाली लिपीमें महाजालपर हो (जैसे - शबरीसे संबंधित कोई लोककथा) और शबरी शब्द खोजनेका आदेश मराठी लिपीमें दिया जाय तो कोई सर्च-इंजिन उसे नही खोज सकेगा। इस प्रकार भारतीय लोकवाङ्मयकी और साहित्यकी एकात्मता, जिनके आधारपर हमारी सांस्कृतिक वाङ्मयीन धरोहर हजारों वर्ष टिक सकी-- वही तेजीसे लुप्त होगी। अब हमारे विशेषज्ञ उसके लिये आडा-तिरछा उपाय ढूँढ रहे हैं। लेकिन वे यह नही कह सके कि ऐसा “भारत-तोडो” स्टॅण्डर्ड न लेकर हम खूद अपनी एकात्मिक टिकानेवाला स्टॅण्डर्ड बनाकर देते हैं।
सामान्य संगणक-ग्राहकतक ये सारे दिग्भ्रम नही पहुँचते। परन्तु आज तो हम अपना काम महाजालपर डाल पानेका आनन्द मना ले सकते हैं।
पंचम चर्चा – 1998 के आसपास मायक्रोसॉफ्टको टक्कर देनेवाली एक नई लिनक्स ऑपरेटिंग सिस्टम उभरकर आई। इनके कामका अंदाज बिलकुल उलटा था। संगणकमें जो जो तंत्र सरल एवं मुफ्त है, उसीको बढाओ, सबको उनका मुपत उपयोग कर अगले उपयोग विकसित करने दो, उन्हें भी मुफ्त बाँटो -- इस प्रकार लाखों लोगोंको अपनी कल्पना-शक्ति का उपयोग करनेका मौका दो, भले ही उनका योगदान स्वल्प हो - और सबको इस विकास का लाभ होने दो। सामान्य ग्राहक के लिये इससे अच्छी बात क्या हो सकती है। इसी फलसफेके कारण लिनक्स सिस्टम फ्री डाउनलोड की जा सकती है। इसके लिये शौकिया काम करनेवाले हजारों हैं। इस प्रणाली में कई सुविधाएँ हैं जिनके उपयोगसे हम और भी सुविधा निर्माण कर सकते हैं, जो तत्काल दूसरोंको उपलब्ध होती हैं।
तो लीनक्स वालोंने देखा कि इन्सक्रिप्ट की-बोर्ड-लेआउट सरल और सारी भारतीय भाषाओंके लिये एक जैसा है और BIS ने उसे स्टॅण्डर्ड भी घोषित किया है। तो यह अपनी ऑपरेटिंग सिस्टममें डाला जा सकता है। युनीकोडके कारण कॅरॅक्टर-कोड भी ओपन हो चुका था वह भी ले लिया। फिर लीनक्य पर काम करनेवाले कुछ उत्साही लोगोंने देवनागरी फॉण्ट-सेट भी बनाकर मुफ्त उपयोग के लिये लीनक्स सिस्टमपर रखवा दिये। ये इंटरनेटपर टिकनेवाले फॉण्ट थे। इस प्रकार पहली बार 1998 में इंटरनेटपर टिकनेवाले भाषाई फॉण्ट उपलब्ध हुए। फिरभी सरकारी नीति दुहराई गई कि सरकारी संगणकों के लिये मायक्रोसॉफ्ट की विण्डोज सिस्टम ही खरीदी जायगी। सामान्य उपभोक्ता तक पहुँचनेमें लीनक्सको अभी कुछ वर्ष लग जाते।
फिर भी लीनक्सकी तुलनामें भारतीय बाजार हाथसे निकल जानेकी संभावना का विचार कर मायक्रोसॉफ्टने सी-डॅककी मदद से 2007 में देवनागरी के लिये मंगल नामक एकमेव युनीकोड फॉण्ट तैयार करवाया । यह युनीकोड आधारित होनेसे जगभरमें पढा जानेवाला और इन्सक्रिप्ट की-बोर्ड-ले-आउट होनेसे सीखनेके लिये सरल है। इसी प्रकार प्रत्येक भारतीय लिपीके लिये एक -एक युनीकोड स्टॅण्डर्ड-अनुरूप फॉण्ट बनवा लिये जिनका की-बोर्ड ववही है जो देवनागरीका है। नये संगणकोंकी विण्डोज ऑपरेटिंग सिस्टममें ये फॉण्ट बिना खर्चके डाले जा सकते हैं। लेकिन ग्राहकको आग्रहपूर्वक विक्रेतासे इसे उपलब्धकरवाना पडेगा, बाय डिफॉल्ट, सुलभतासे वे उपलब्ध नही होते। इसके लिये ग्राहक-चेतना-मंच जौसी संस्थाओंको आगे आकर काम करवाना पडेगा।
लेकिन क्या मंगलमें लिखी सामग्री इतर भारतीय लिपीयोंमें लिप्यंतरित होती है (जैसी सी-डॅककी आयलीप सिस्टममें होती थी) नही होती। उदाहरण के लिये युनीकोड गुजरातीके लिये श्रुती फॉण्ट उपलब्ध है परन्तु मंगलसे श्रुतीमें लिप्यंतर नही होता। इसके समाधान के लिये युनीकोड-कन्सोर्शियम के पास भारतीयोंके आग्रह से ही बात बनेगी।
षष्ठ चर्चा -- अंततः हमारे संगणक-तंत्रज्ञ ही इस अगले काम को करनेवाले हैं, भले ही आज उन बातोंको दुर्लक्षित कर रखा हो। भाषाविदोंको उनके साथ बैठकर इसकी चर्चा करनी होगी। भारतीय वर्णमालाओंमें मूल अक्षर यद्यपि कम हैं (16 स्वर, 36 व्यंजन) लेकिन संयुक्ताक्षर एवं उन्हें जोडनेकी पध्दतींमें विविधता है। आठ-बिट प्रणालीमें सारी श्रृँखलाएँ 256 स्थानोंमें ही जैसेतैसे रचकर हमने प्रारंभ किया था। लेकिन सही अर्थमें भारतीय लिपियाँ संगणककी मशीन-भाषामें बैठाने के लिये सोलह-बिट प्रणालीकी 65536 श्रृंखलाओंसे दगहें चुनकर प्रमाणबद्ध करनी पडेंगी।
यह करते हुए सभी लिपियोंके अक्षर, संयुक्ताक्षरकी तथा स्वरोंकी मात्राएँ लगानेकी पद्धति, वेदकालीन लिपिके खास खास उच्चार-चिह्न -- जिनसे उदात्त, अनुदात्त इत्यादि उच्चार तय होते हैं, -- साथही भारतीय संगीत लिखनेके लिये लगनेवाले चिन्ह, ऐसे सभी मुद्दोंपर विचार करना होगा। इसीसे जोडकर सिंहली (श्रीलंकाकी भाषा) नेपाली, तिब्बती, थाई, इंडोनेशियन, मलेशियन आदि जो भाषा संस्क़ृतकीही वर्णमालाका प्रयोग करती हैं और जिनके लोकवाङ्मय के साथ संस्कृत का गहरा रिश्ता है उनके उपयोग के लिये अतिरिक्त संकेत-चिन्होंका भी विचार करना पडेगा।
मौजूदा युनीकोड स्टॅण्डर्डके सोलह-बिट सिस्टमकी 65536 श्रृंखलाओंसे, अर्थात 256 खाने गुणा 256 खानोंकी एक बडी सारणीमेंसे कुछ खाने भारतीय भाषाओंके लिये रिजर्व रखे गये हैं, लेकिन इस प्रकार कि एक लिपिके लिये रिजर्व खाने और दूसरीके लिये रिजर्व खानोंके बीच मानो कोई दीवार खडी कर दी हो। इसी कारण सर्च इंजिनको शबरी कहनेसे वह बंगालीमें लिखे শবরী या गुजरातीमें लिखे શબરી शब्दोंको नही समझ सकता -- इसी कारण उन उन भाषाओंके लोकवाङ्मयको एक साथ नही दिखा सकता। इस सिस्टमपर भारतीय भाषाविद भी बैठकर तय करें की अक्षरोंका संकेत उनकी ध्वनिपर निर्भर हो, और ऐसी पद्धतिसे भारतीय भाषाओंके तमाम खाने री-ऍरेंज कराये जायें, केवल दृश्य-स्वरूपके लिये प्रारंभमें सूचित लिपिके अनुरूप दिखे। उदाहरण स्वरूप
स्वीडिश भाषामें अंग्रेजीकी अपेक्षा अधिक अक्षर हैं फिर भी दोनों भाषाओंके समान अक्षरोंको एकही कॅरॅक्टर-कोड दिया गया है। ऐसा होनेके लिये उन्हें आगे आना होगा जिन्हें देश और भाषाओंकी गरिमाका ध्यान है।
कुल सारांश यह रहा कि आज सारी भारतीय भाषाओंके लिये जो भी दो-तीनसौ फॉण्टसेट्स बन चुके हैं उनके कॅरॅक्टर कोडको ओपन-सोर्समें डाल दिया जाय ताकि उन्हें ऑपरेटिंग सिस्टमका भाग बनानेमें कोई इंटेलेक्चुअल प्रॉपर्टीका मुद्दा उपस्थित ना हो, यो सारे फॉण्टसेट्स, खासकर सी-डॅक वाले युनीकोड-कम्पॅटिबल फॉण्ट्स भी लिनक्स अथवा मायक्रोसॉफ्ट कंपनीको मुफ्त देकर उनकी ऑपरेटिंग सिस्टम में डलवाये जायें, ये दो छोटे कदम उठाने होंगे। ऐसा करनेसे लेखक- प्रकाशकोंके बीच लॉजिस्टीक्स का एक गहन प्रश्न सुलभतासे समाप्त होगा।और बडा कदम यह कि युनीकोड प्रणालीमें भारतीय भाषाओंके लिये रिजर्व की गई श्रृंखलाओका पुनर्विलोकन भाषाई एकात्मता तथा ब्राह्मी-आधारित अन्य एशियन लिपियोंके साथ एकात्मता रखनेके विचारसे किया जाय। ऐसे नये प्रमाणकको लाना हमारी एकात्मता की दिशामें अच्छा प्रयास होगा।
-------------------------------------------------------------------------------------
रेकॉर्ड के लिये लिख रखना होगा कि 1995-98 के कालमें सी-डॅकके संकेतस्थलसे एक पन्नेभर सामग्री लिखनेके लिये लीपलाईट नामसे संक्षिप्त सॉफ्टवेअर प्रत्येक भारतीय लिपींके लिये फ्री-डाउनलोड उपलब्ध किया था। इन्सक्रिप्ट आधारित होने के कारण सरल और इस सुविधा के कारण सुलभ था और कई छोटे छोटे काम हो जाते थे। बादमें यह सुविधा हटा ली गई -- फिर वर्ष 2002-03 मे लिपियोंको पीछे धकेलकर अंग्रेजीको आगे लानेकी दिशा में कदम उठाया। रोमन लिपिमें फोनेटिक पद्धतिसे लिखनेपर पडदेपर आपकी लिपिमें दिखे ऐसे सॉफ्टवेअर की एक करोड सीडी बाँटी गई। अब धडल्लेसे सलाह दी जा सकती है कि रोमनसे लिखो, भारतीय लिपि लिखनेका आग्रह क्यों ? लेकिन इस नीति के कारण भारतीय लिपियाँ अगले दस-बीस वर्षोंमें भुला दी जायेंगी तो कोई आश्चर्यकी बात नही।
एक सुविधा की चर्चा भी करनी होगी। आपने यदि पिछले बीस वर्षोंमें इतर फॉण्ट में कोई गद्य लिख रखा है तो उसे मंगलमें बदला जा सकता है। इसके लिये टीबीआयएल, प्रखर आदि कुछ कनव्हर्टर्स तैयार हुए हैं। अतएव अब हमारे संगणकपर लिखे गये हजारों पुराने पन्ने युनीकोड-कम्पॅटिबल फॉण्टमें बदल लेना चाहिये ताकि उन्हें महाजालपर डाला जा सके एवं औरोंको पढनेके लिये उपलब्ध हो सके। अबतक कई लोग अपना साहित्य pdf के रूपमें महाजपवर डाल रहे थे। वह कामचलाऊ था लेकिन अधूरा था कारण सर्च इंजिन उसे खोज नही सकता।
कनव्हर्टर्स तैयार हुए - अर्थात अब कोई कोड सही अर्थमें गुप्त नही रहा। फिरभी उन्हें "खुला" जाहीर करनें में क्या आपत्ति है ? इससे सौ के करीब फॉण्ट-सेटोंको कोई भी अनिर्बंध रूपसे प्रयोग कर सकेगा। यह सुविधा अगले प्रोग्रामिंग तथा आविष्कारोंके लिये उपयोगी रहेगी। आगे भी यदि कोई नये फॉण्ट विकसित करे तो वे स्टॅण्डर्ड एवं खुले होने चाहिये। यह उपाय अपनानेसे भारतीय वाङ्मयका बोलबाला तत्काल कई गुना बढ सकेगा।
भारतीयता टिकाये रखनेकी कामना रखनेवाले सभी भाषाप्रेमी इन विविध मुद्दोंपर जागरूक रहें और इस चुनौती को निभायें यही शुभकामना।
--------------------------------------------------------------------------------
अंग्रेजी की बजाए अपनी खुदकी मातृभाषामें शिक्षा लेनेसे प्रगती होती है या रुकती है। यह आँकडे क्या दर्शाते हैं -
2004 साक्षरता अंग्रेजी-साक्षरता संगणक-साक्षरता
भारत 52 25 09
चीन 88 11 53
उनकी संगणक-साक्षरता अंग्रेजीके लिये रुकी नही।
======================================================================
Subscribe to:
Post Comments (Atom)
No comments:
Post a Comment