kalerkantho

রবিবার। ২ জ্যৈষ্ঠ ১৪২৮। ১৬ মে ২০২১। ০৩ শাওয়াল ১৪৪২

আসছে কৃত্রিম বুদ্ধিমত্তার থ্রিডি হলোগ্রাম

১৮ এপ্রিল, ২০২১ ০০:০০ | পড়া যাবে ৪ মিনিটে



আসছে কৃত্রিম বুদ্ধিমত্তার থ্রিডি হলোগ্রাম

কৃত্রিম বুদ্ধিমত্তা ব্যবহার করে রিয়ালটাইমে থ্রিডি হলোগ্রাম তৈরি করছেন এমআইটি বিশ্ববিদ্যালয়ের একদল গবেষক। টেন্সর হলোগ্রাফি নামের নতুন এই পদ্ধতি ভার্চুয়াল রিয়ালিটি, থ্রিডি প্রিন্টিং, মেডিক্যাল ইমেজিংয়ের জন্য হলোগ্রাম তৈরি করতে সমক্ষ। বিস্তারিত জানাচ্ছেন এস এম তাহমিদ

বিশ্বের সেরা ক্যামেরায় ধারণকৃত ছবি বা ভিডিওরও একটি বড় ঘাটতি থেকেই যায়। দৃশ্য রং, আলোর উজ্জ্বলতা এবং খুঁটিনাটি সব পরিষ্কার দেখা গেলেও ত্রিমাত্রিক গভীরতা বোঝানোর উপায় নেই। ত্রিমাত্রিক গভীরতা বা থ্রিডি ডেপথ বোঝানোর জন্য স্টেরিওস্কোপি নামের একটি পদ্ধতি অনেক দিন ধরেই ব্যবহার হয়ে আসছে, যদিও সেটি সত্যিকারের ত্রিমাত্রিক ছবি বা ভিডিও দেয় না; বরং সেটির একটি অনুমিত অনুকরণ দেয় মাত্র। সত্যিকার বাস্তবসম্মত থ্রিডি ছবি বা ভিডিও দিতে পারে শুধু হলোগ্রাফি। মজার বিষয়, হলোগ্রাফির আবিষ্কার প্রায় অর্ধশতাব্দীরও আগে হলেও পূর্ণাঙ্গরূপে তার ব্যবহার এখনো শুরু করা যায়নি। তবে এমআইটির একটি গবেষকদল হলোগ্রাফি প্রযুক্তির এক নতুন দিগন্ত আবিষ্কার করেছেন, যার মাধ্যমে আগামী দিনে এই প্রযুক্তি মূলধারায় অবশেষে ব্যবহার শুরু হতে পারে।

বর্তমানের ফটো বা ভিডিওগ্রাফিই হোক বা পিসিতে তৈরি থ্রিডি গ্রাফিকসই হোক, সেগুলো ডিসপ্লের প্রতিটি পিক্সেলে শুধু আলোর পরিমাণ বা ব্রাইটনেস কতটুকু এবং কী রঙের আলো সেটি—এতটুকু তথ্যই সংরক্ষণ ও প্রদর্শন করে থাকে। দৃষ্টিকোণ বা পারসপেক্টিভের ফলে আমাদের মস্তিষ্ক সে দৃশ্যগুলোতে একটি ‘গভীরতা’ বসিয়ে নেয়। সাধারণ গেমিং, ভিডিও বা ছবি দেখার জন্য এটি যথেষ্ট হলেও ভার্চুয়াল রিয়ালিটি গেমিং বা হেডসেটের মাধ্যমে ড্রোনের ক্যামেরার ছবি দেখে সেটি চালনা করার মতো সূক্ষ্ম কাজের ক্ষেত্রে একেবারেই কার্যকর নয়; এমনকি এই গভীরতার অভাব থাকায়ই ভিআর হেডসেট টানা ব্যবহার করলে বমি বমিভাব, মাথা ঘোরানো আর চোখ ব্যথা করার মতো সমস্যাগুলো দেখা দেয়। থ্রিডি সিনেমা এবং টেলিভিশনও ঠিক এ কারণেই জনপ্রিয়তার তুঙ্গে ওঠেনি। স্টেরিওস্কোপিক থ্রিডি টানা ব্যবহার করার জন্য মানব মস্তিষ্ক প্রস্তুত নয়।

হলোগ্রাফিকস চিত্র বা ভিডিও ধারণ করার প্রযুক্তি আবিষ্কার হয়েছে প্রায় ৬০ বছর আগে। গতানুগতিক ক্যামেরা ছবি বা ভিডিও ধারণের সময় যেসব তথ্য সংরক্ষণ করে তার সঙ্গে ক্যামেরার সেন্সরে আসা আলোর ফেইজের তথ্য সংরক্ষণ করলেই সেটি পরে হলোগ্রাফির মাধ্যমে বাস্তবিক থ্রিডি ছবি বা ভিডিওতে রূপান্তর করা যায়। হলোগ্রাফিক দৃশ্য তুলে ধরার মতো ডিসপ্লেও তৈরি করেছে বেশ কিছু প্রতিষ্ঠান। কিন্তু প্রযুক্তিটি মার খেয়ে যাচ্ছে হলোগ্রাফিক কনটেন্টকে ডিসপ্লে পর্যন্ত নিয়ে যাওয়ার প্রসেসিংয়ের ক্ষেত্রে। দেখা যাচ্ছে অত্যন্ত শক্তিশালী সুপার কম্পিউটারও প্রতি সেকেন্ডে এক ফ্রেমের বেশি ছবি হলোগ্রাফিক ডিসপ্লেতে পৌঁছাতে পারছে না, যেখানে সেকেন্ডে অন্তত ২৪ ফ্রেম না দেখালে সেটি মসৃণ ভিডিও মনে হবে না।

এমআইটির দলটি এ সমস্যা নিয়ে বিস্তর গবেষণা করেছে। বর্তমানে হলোগ্রাফিক কনটেন্টের গভীরতা বোঝানোর জন্য প্রতিটি পিক্সেলের আলো কি ফেইজে দেওয়া হবে সেটি পদার্থবিজ্ঞানের সূত্র অনুযায়ী পরীক্ষা-নিরীক্ষা করে বের করতে হয়। প্রতিবার একই সূত্রের সমাধান একেবারে গোড়া থেকে গণনা করতে হয়। এটি এড়াতে তাদের সমাধান, কৃত্রিম বুদ্ধিমত্তার টেন্সর কোরগুলোকে এই হিসাব-নিকাশ ‘পড়িয়ে’ নিলে তারা প্রতিটি পিক্সেলের জন্য গোড়া থেকে আর সমাধান শুরু করবে না; বরং কাছাকাছি ধরনের পিক্সেলের জন্য অতীতে যে ফেইজ ব্যবহার করা হয়েছে সেটি ব্যবহার করতে থাকবে। ভিডিওতে সাধারণত এক সারির ফ্রেমগুলোতে প্রতিটি পিক্সেল পরিবর্তন হয় না, তাই লাইট ফেইজের ভ্যালু প্রতিটি পিক্সেলের জন্য বারবার গণনা করার দরকারও নেই। এভাবে লাইট ফেইজের ক্যালকুলেশনের পরিমাণ কমিয়ে আনার ফলে সুপার কম্পিউটার ব্যবহার করে সেকেন্ডে এক ফ্রেম নয়, বরং স্মুথ ভিডিও চালানো যাবে সাধারণ পিসি ব্যবহার করেই, সঙ্গে থাকতে হবে টেন্সর কোর। আজকাল প্রায় সব স্মার্টফোনেও টেন্সর কোর ব্যবহার করা হচ্ছে। অতএব খরচও সমস্যা নয় এ ক্ষেত্রে।

গবেষণাটির নেতৃত্ব দিয়েছেন লিয়াং শি, সঙ্গে ছিলেন উজেইক মাটুসিক, বেইচেন লি এবং চাঙ্গিল কিম ও পিটর কেলনোফার। তাদের আশা, মেশিন লার্নিং ও কৃত্রিম বুদ্ধিমত্তার মাধ্যমে হলোগ্রাফিক কনটেন্ট মূলধারায় প্রবেশ করবে আর এক দশকের মধ্যেই। এখন দেখার বিষয় তাদের ধারণা সত্যি হয় কি না।