kalerkantho

বাংলা ভাষার উন্নয়নে তথ্য-প্রযুক্তি

৯ ফেব্রুয়ারি, ২০১৯ ০০:০০ | পড়া যাবে ৯ মিনিটে



বাংলা ভাষার উন্নয়নে তথ্য-প্রযুক্তি

ছবি : মোহাম্মদ আসাদ

বাংলায় লেখা চিঠি পড়ে আপনার মনের কথা বুঝে ফেলতে পারবে ডিভাইস। ইন্টারনেট বা ওয়েবে বাংলা কথামালার ভেতরে থাকা আবেগ-অনুভূতিগুলোও ধরে ফেলতে সক্ষম এমন সব সফটওয়্যারও তৈরি হচ্ছে এ দেশেই। কাজ হচ্ছে ‘গবেষণা ও উন্নয়নের মাধ্যমে তথ্য-প্রযুক্তিতে বাংলা ভাষা সমৃদ্ধকরণ’ প্রকল্পের আওতায়। প্রকল্পটির বিস্তারিত জানাচ্ছেন ইমরান হোসেন মিলন

 

বাংলায় লেখা চিঠি পড়ে মনের কথা তো বুঝতে পারাসহ বাকহীনদের ভাষা বুঝতে পারবে এই সফটওয়্যার। ইশারা রূপান্তর হয়ে শুনতে পাবেন শ্রুতিমধুর বাংলা। তথ্য-প্রযুক্তিতে বাংলা ভাষা নিয়ে এমন উদ্যোগ বাস্তবায়নে শুরু হয়েছে এক যজ্ঞ। ‘গবেষণা ও উন্নয়নের মাধ্যমে তথ্য-প্রযুক্তিতে বাংলা ভাষা সমৃদ্ধকরণ’ নামের এক প্রকল্প বাস্তবায়ন করছে বাংলাদেশ কম্পিউটার কাউন্সিল (বিসিসি)।

২০১৭ সালের ৩ জানুয়ারি জাতীয় অর্থনৈতিক পরিষদের নির্বাহী কমিটির সভায় (একনেক) অনুমোদন পায় এই প্রকল্প। এরই মধ্যে এগিয়েছে এর কিছু কাজ। সভা, সেমিনার ও বিশেষজ্ঞ কমিটির সুপারিশ হয়েছে। চলছে গবেষণা।

 

প্রকল্পের আদ্যোপান্ত

প্রধানমন্ত্রী শেখ হাসিনার সভাপতিত্বে ২০১৭ সালে একনেক সভায় অনুমোদনের এক মাস পর ৪ ফেব্রুয়ারি প্রকল্পটি প্রশাসনিক অনুমোদন পায়। ১৫ মে প্রকল্প বাস্তবায়ন কমিটি প্রথম সভা করে। স্টিয়ারিং কমিটি সভা করে ২৪ মে। এরপর ২০১৭ সালের জুন থেকে বাস্তবায়ন মেয়াদ দুই বছর ধরে প্রকল্পটি শেষ হওয়ার কথা রয়েছে চলতি বছরের জুনে। প্রকল্পটির ব্যয় ধরা হয়েছে ১৫৯ কোটি দুই লাখ টাকা।

 

প্রকল্পের উদ্দেশ্য কী?

কেন এমন প্রকল্প? জানতে চাইলে প্রকল্প পরিচালক মো. জিয়াউদ্দিন বলেন, এর মূল উদ্দেশ্য হচ্ছে আন্তর্জাতিক পরিসরে নেতৃস্থানীয় ভাষা হিসেবে বাংলাকে প্রতিষ্ঠা করা। বিশেষ করে কম্পিউটিং ও আইটিসিতে বাংলা ভাষাকে খাপ খাইয়ে নেওয়া। এ জন্য তথ্য-প্রযুক্তিকে বাংলা ভাষাসমৃদ্ধকরণ করে বিভিন্ন প্রযুক্তির মাধ্যমে ব্যবহারযোগ্য সফটওয়্যার, টুলসের উন্নয়ন করা, যাতে করে বাংলা ভাষায় কম্পিউটার ও ওয়েব ব্যবহারে কোনো অসুবিধা না হয়। প্রকল্পটির মাধ্যমে মোট ষোলটি টুলস বা সফটওয়্যার উন্নয়নের কাজ করা হবে।

 

যত অগ্রগতি

প্রকল্পটি অনুমোদন পাওয়ার পর একজন প্রকল্প পরিচালক ও একটি সহকারী প্রকল্প পরিচালক নিয়োগ করা হয়েছে। এ ছাড়া সাতজন পরামর্শক নিয়োগ রয়েছেন প্রকল্পটিতে। প্রকল্পের প্রথম, দ্বিতীয় ও তৃতীয় কিস্তির বরাদ্দও দেওয়া হয়েছে। সরাসরি পদ্ধতিতে দুইজন অফিস সহকারী কাম কম্পিউটার অপারেটর এবং একজন হিসাবরক্ষক নিয়োগ করা হয়েছে। এর বাইরে আউটসোর্সিংয়ে নিয়োগ পেয়েছেন চারজন। প্রকল্পটি বাস্তবায়নে কয়েকটি অভ্যন্তরীণ এবং বিশেষজ্ঞ কমিটির সভা হয়েছে। সেসব কমিটি ঢাকাসহ দেশের বিভিন্ন স্থানে মোট আটটি সেমিনার ও কর্মশালা করেছে।

গবেষণা ও উন্নয়নের মাধ্যমে বাংলা ভাষা সমৃদ্ধকরণে যে ১৬টি টুলস তৈরি করা হবে। সেগুলোর জন্য এরই মধ্যে দরপত্র আহ্বান করা হয়েছে।

প্রকল্প পরিচালক মো. জিয়াউদ্দিন আহমদ বলেন, ‘প্রতিটি সেমিনার থেকে আমরা অনেক রিসোর্স পেয়ে থাকি। যা পরে আলোচনার মাধ্যমে সুপারিশ হিসেবে গণ্য করা হয়।’

বর্তমানে প্রকল্পটি বাস্তবায়নের জন্য রাজধানীর আগারগাঁওয়ের আইসিটি টাওয়ারের নবম তলায় একটি কার্যালয় করা হয়েছে। তবে ভবনের চৌদ্দতম তলার উত্তরাংশে এর জন্য ২৫০০ বর্গফুট জায়গা বরাদ্দ দেওয়া হয়েছে। প্রকল্পটির স্থায়ী ঠিকানা সেখানেই।

 

আছে চ্যালেঞ্জ

প্রকল্পটি বাস্তবায়নে সবচেয়ে বড় চ্যালেঞ্জ হলো এর নতুনত্ব। প্রকল্পে যে ১৬টি টুলস উন্নয়ন করার কথা বলা হয়েছে, সেগুলো একেবারেই নতুন বলা যায়। কিছু আছে পুরনো। তবে সেগুলোর কাজ আবার এতটাই কম হয়েছে যে তা আবার প্রথম থেকেই করতে হচ্ছে। ফলে এটি মূল চ্যালেঞ্জ হিসেবে দেখছেন প্রকল্প পরিচালক জিয়াউদ্দিন আহমদ। তিনি বলেন, ‘এটা শুধু একটা প্রযুক্তিগত উন্নয়ন হলে হয়তো কম সময়ে খুব সহজেই করা যেত। কিন্তু এতে ভাষার বিভিন্ন দিক, এর অর্থসহ নানা বিষয় দেখতে হচ্ছে। তাই এই প্রকল্পটি সময়সাপেক্ষ এবং চ্যালেঞ্জেরও বটে।’

একই কথা এটির বিশেষজ্ঞ কমিটির সদস্যের দায়িত্ব পেয়ে বলেছিলেন টেলিযোগাযোগ মন্ত্রী মোস্তাফা জব্বারও। তিনি এত বিশাল এবং গুরুত্বপূর্ণ কাজের সক্ষমতার প্রশ্ন তুলেছিলেন। তখন তিনি বলেছিলেন, এত দিন তথ্য-প্রযুক্তিতে বাংলা ভাষার উন্নয়নে অর্থসংস্থানের শঙ্কা থাকলেও এখন সবাই ভাবছেন, এই কাজগুলো সম্পন্ন হবে কেমন করে?

বাংলার ভাষাবিজ্ঞানী ও তথ্য-প্রযুক্তি বিজ্ঞানী উভয়ের সমন্বিত প্রচেষ্টায় প্রকল্পের সফলতার দৃঢ় আশাবাদ জানিয়েছেন মোস্তাফা জব্বার।

 

প্রকল্পের বিশেষজ্ঞ কমিটিতে যাঁরা রয়েছেন

বিশেষজ্ঞ কমিটি করার সময় সেখানে সদস্য হিসেবে ছিলেন তথ্য-প্রযুক্তিবিদ মোস্তাফা জব্বার। বর্তমানে তিনি ডাক, টেলিযোগযোগ ও তথ্য-প্রযুক্তি মন্ত্রী।

এ ছাড়া বিশেষজ্ঞ কমিটিতে রয়েছেন কম্পিউটারবিজ্ঞানী, শিক্ষাবিদ ড. মুহম্মদ জাফর ইকবাল, আন্তর্জাতিক মাতৃভাষা ইনস্টিটিউটের মহাপরিচালক ড. জিনাত ইমতিয়াজ আলী, তথ্য-প্রযুক্তি বিভাগের প্রতিনিধি সুশান্ত কুমার সরকার, বুয়েটের প্রতিনিধি মো. মনিরুল ইসলাম, বাংলা একাডেমির প্রতিনিধি অপরেশ কুমার ব্যানার্জী ও প্রকল্প পরিচালক জিয়াউদ্দিন আহমদ।

 

যেসবের জন্য এত আয়োজন

বাংলা ওসিআর : কৃত্রিম বুদ্ধিমত্তার সাহায্যে মুদ্রিত বা হাতে লেখা বর্ণমালা শনাক্ত করা যায়। এই পদ্ধতিতে পিডিএফ থাকা বর্ণগুলোকে কম্পিউটারের মাধ্যমে দ্রুত শনাক্ত করা ও সেগুলোকে টেক্সটে রূপান্তর বা লিখিত রূপ দেওয়ার কাজও করা হবে।

বাংলা স্পিচ টু টেক্সট এবং টেক্সট টু স্পিচ : এর মাধ্যমে বাংলা কথাকে লেখায় এবং লেখাকে কথায় রূপান্তরের কাজ করা যাবে। রেকর্ড বা কারো কথাকে তাত্ক্ষণিক লেখায় রূপান্তর করা যাবে। এর ফলে অনেক কাজে সময় কমে আসবে।

জাতীয় কি-বোর্ডের আধুনিকায়ন : কম্পিউটারে কম্পোজ আরো সহজ করতে জাতীয় কি-বোর্ডকে আরো সহজ করা হবে এই প্রকল্পের মাধ্যমে। এর ফলে বিভিন্ন অপারেটিং সিস্টেম যেমন—উইন্ডোজ, ম্যাক, অ্যানড্রয়েড, আইওএসে একই ধরনের কি-বোর্ড ব্যবহার করা যাবে।

বাংলা স্টাইল গাইড : প্রযুক্তির সঙ্গে ভাষার সম্মিলনের প্রথম শর্ত হলো, ভাষার রীতি এবং ভাষা ব্যবহারের মান ও নীতি ঠিক করা। ভাষার এই মান ও নীতির সংগ্রহ হলো বাংলা স্টাইল গাইড। এটিও তৈরি করার কাজ করা হবে।

বাংলা বানান ও ব্যাকরণ সংশোধন : এতে যে সফটওয়্যার তৈরি হবে তার মাধ্যমে বাংলা ভাষার শব্দ, বানান, বাক্য স্বয়ংক্রিয়ভাবে সম্পাদনা করা যাবে। এটি যে শুধু ভুল বানান ধরবে তা নয়, বরং তা স্বয়ংক্রিয়ভাবে সংশোধন করার পরামর্শ দেবে। এটি দিয়ে মোবাইল, কম্পিউটার ও অন্যান্য মাধ্যমে বাংলা বানান সংশোধন করা সম্ভব হবে।

বাংলা ভাষাংশ : বিশ্বের অন্যতম ভাষা হলেও বাংলা এখনো তথ্য-প্রযুক্তির বিবেচনায় সমৃদ্ধ ভাষা হয়ে ওঠেনি। আর এ জন্য দরকার ভাষাংশ বা করপাস তৈরি করা। যেটি হবে প্রতিনিধিত্বমূলক ও ভারসাম্যপূর্ণ। এটি তৈরিতে নানা প্রক্রিয়া জড়িত। সেগুলোর কাজ চলছে।

বাংলা থেকে আইপিএ কনভার্টার : বাংলা ইউনিকোড টেক্সটকে স্বয়ংক্রিয়ভাবে ‘ইন্টারন্যাশনাল ফোনেটিক অ্যালফাবেট’ বা ‘আইপিএ’তে প্রকাশ করবে এই সফটওয়্যার। আইপিএ আন্তর্জাতিক ধ্বনিমূলক বর্ণমালা মানুষের দ্বারা উচ্চারিত প্রায় সব ধ্বনি লিখিত রূপে প্রকাশ করা যায়। সাধারণত অভিধান রচয়িতা, বিদেশি ভাষার শিক্ষার্থী-শিক্ষক, ভাষাবিদ, গায়ক, অনুবাদক এই বর্ণমালা ব্যবহার করে থাকে। এটি তৈরি হলে বাংলা ভাষার উচ্চারিত রূপকে আন্তর্জাতিক মান অনুসারে লেখা যাবে।

বাংলা মেশিন ট্রান্সলেটর ডেভেলপমেন্ট : যান্ত্রিক অনুবাদের মাধ্যমে বাংলা ভাষাকে বিভিন্ন ভাষায় স্বয়ংক্রিয়ভাবে অনুবাদ করা। এর অনুবাদকের মাধ্যমে তথ্যমূলক বাংলা, দৈনিন্দন বাংলা, প্রাতিষ্ঠানিক রচনা, সংবাদ বিজ্ঞপ্তি, আবহাওয়া সংবাদসহ আরো অনেক কিছু দ্রুত নির্ভুলভাবে অনুবাদ করা সম্ভব হবে।

দৃষ্টিপ্রতিবন্ধীদের জন্য স্ক্রিন রিডার সফটওয়্যার : এর উন্নয়নের মাধ্যমে দৃষ্টিপ্রতিবন্ধী বা স্বল্পদৃষ্টির ব্যক্তিরা কম্পিউটার বা মোবাইল ফোন ব্যবহার করতে পারবে। স্ক্রিনে ভেসে ওঠা লেখা পড়ে শোনাবে এই সফটওয়্যার।

বাক ও শ্রবণ প্রতিবন্ধীদের জন্য সফটওয়্যার বা ডিজিটাল ইশারা ভাষা : এটি মূলত সাইট টু স্পিচ সফটওয়্যার। এর মাধ্যমে কোনো কম্পিউটার বা মোবাইলের ক্যামেরার সামনে সাইন ল্যাঙ্গুয়েজ বা ইশারার ভাষায় কথা বললে সেটি স্পিচ বা কথা হিসেবে অনুবাদ হয়ে বলে দেবে। এটি এমনকি ইউনিকোডে টেক্সটেও রূপান্তর হবে।

সেন্টিমেন্ট অ্যানালিসিস টুলস উন্নয়ন : এর মাধ্যমে কোনো কাগজপত্রে লেখা বিশ্লেষণ করে বলে দিতে পারবে সেটি ইতিবাচক, নেতিবাচক নাকি নিরপেক্ষ। এর মাধ্যমে ওয়েবসাইটের মন্তব্য বিশ্লেষণ করা যাবে। যা যেকোনো ধরনের জরিপের কাজে ব্যবহার করা যাবে।

বাংলা ফন্ট কনভার্টার : অনেক সময় বাংলা ফন্ট বিভিন্ন অপারেটিং সিস্টেমে স্থানান্তরের সময় ভেঙে যায়। এমনকি কখনো একটি অ্যাপ্লিকেশন থেকে অন্য অ্যাপ্লিকেশনে নিলেও ফন্ট ভেঙে যায়। সেটা থেকে মুক্তি দেবে এই সফটওয়্যার।

ক্ষুদ্র-নৃগোষ্ঠী ভাষার কি-বোর্ড ও শব্দভাণ্ডার : দেশে ক্ষুদ্র-নৃগোষ্ঠীর ভাষাগুলো তথ্য-প্রযুক্তিক্ষেত্রে খুব একটা ব্যবহার হয় না। বেশির ভাগ ক্ষেত্রে ভাষার মানসম্মত দালিলিক ও প্রামাণ্য উপাদান নেই। আবার এদের মধ্যে কিছু ভাষা বিপন্ন অবস্থায় রয়েছে। অনেক ভাষার পর্যাপ্ত তথ্য, নেই ফন্টের এনকোডিংও। সেগুলোকে লিপিতে রূপ দেওয়া থেকে নানা ধরনের কাজ করা হবে।

বাংলা ইউনিকোড : ইউনিকোড-লিপি কম্পিউটারে লিখনপদ্ধতির একটি আন্তর্জাতিকভাবে স্বীকৃত মান। বিশ্বের প্রায় সব প্রধান ভাষায় কম্পিউটার-লিপির জন্য বিভিন্ন দেশের প্রতিনিধি ও বিজ্ঞানীদের সমন্বয়ে গঠিত সংস্থা এই মান নির্ধারণ করে। এই সংস্থার মাধ্যমে বাংলাদেশের পক্ষে বাংলা ও অন্যান্য ভাষার ইউনিকোড মান নির্ধারণে সব ধরনের সমর্থন প্রদান করা হবে।

ভাষা-প্রযুক্তির সমন্বিত প্ল্যাটফর্ম : এই প্রকল্পের সবগুলো সার্ভিসের মিলনবিন্দু হিসেবে কাজ করবে এই প্ল্যাটফর্মটি। এখানে ওসিআর, হাতের লেখা শনাক্তকরণ, যান্ত্রিক অনুবাদসহ অন্য সব সার্ভিস একসঙ্গে থাকবে। একজন ব্যবহারকারী ব্রাউজারের মধ্যমে এই প্ল্যাটফর্মে প্রবেশ করে উল্লিখিত সার্ভিস ব্যবহার করতে পারবেন। এ ছাড়া এখানে থাকবে প্রোডাক্ট শোকেস, যা থেকে সার্ভিস ছাড়া ডকুমেন্টও ডাউনলোড করা যাবে।

 

মেয়াদ বাড়ানোর আবেদন

গুরুত্বপূর্ণ এই প্রকল্পটি বাস্তবায়নের মেয়াদ নিয়ে প্রথম থেকেই সন্দেহ করে আসছিলেন সংশ্লিষ্টরা। তখনই তাঁরা ধারণা করেছিলেন, এই প্রকল্পের কাজের গভীরতা অনুযায়ী এই নির্দিষ্ট সময়ের মধ্যে হয়তো প্রকল্পের কাজ শেষ করা যাবে না। আর বাস্তবে হয়েছেও তাই। প্রকল্পের মেয়াদ আর মাস চারেক রয়েছে। এখন পর্যন্ত শতকরা হিসেবে মাত্র পাঁচ শতাংশের মতো কাজ হয়েছে। ফলে এর মেয়াদ আরো দুই বছর বাড়ানোর আবেদন করেছেন প্রকল্প পরিচালক জিয়াউদ্দিন আহমেদ।

এটি বাড়ানো হতে পারে বলে তিনি ইঙ্গিতও দিয়েছেন। এর আগে অবশ্য বর্তমান ডাক, টেলিযোগাযোগ ও তথ্য-প্রযুক্তি মন্ত্রী বিশেষজ্ঞ কমিটির সদস্য হিসেবে বলেছিলেন, ‘কাজটি বিশাল ও ব্যাপক। সময়টা খুবই কম। তবে কাজটি শুরু করে সফলতা অর্জন করা গেলে সময় বাড়ানো হয়তো তেমন কঠিন কাজ হবে না।’

প্রকল্প পরিচালক মো. জিয়াউদ্দীন বলেন, ‘কাজটি এত ব্যাপক যে, এর জন্য পর্যাপ্ত গবেষণা না হলে তা করা সম্ভব নয়। কারণ যে টুলসগুলো তৈরি করা হবে, সেসবই নতুন। ফলে সময়ের প্রয়োজন হবেই।’

 

মন্তব্য