বাংলা ওসিআর, ইমেজ টু টেক্সট কনভার্টার বাজারে আসছে

বছর শুরুর প্রাক্কালে দিতে চাই সু-সংবাদ। আর তা তথ্য প্রযুক্তির সঙ্গে যুক্ত। এ বছরের মধ্যেই হাতে হাতে পৌঁছে যাবে সবার ব্যবহারের উপযোগী বাংলা ওসিআর। অপটিক্যাল ক্যারেক্টার রিডার/রিকগনিশনকে সংক্ষেপে ওসিআর বলা হয়। এ প্রযুক্তি তথ্য সংরক্ষণের প্রক্রিয়াকে সহজ করে। তথ্যকে ডিজিটালাইজড করতে এর বিকল্প নেই।


বছর শুরুর প্রাক্কালে দিতে চাই সু-সংবাদ। আর তা তথ্য প্রযুক্তির সঙ্গে যুক্ত। এ বছরের মধ্যেই হাতে হাতে পৌঁছে যাবে সবার ব্যবহারের উপযোগী বাংলা ওসিআর। অপটিক্যাল ক্যারেক্টার রিডার/রিকগনিশনকে সংক্ষেপে ওসিআর বলা হয়। এ প্রযুক্তি তথ্য সংরক্ষণের প্রক্রিয়াকে সহজ করে। তথ্যকে ডিজিটালাইজড করতে এর বিকল্প নেই।

যেমন পুরনো আমলের একটি বই। এতদিন পর্যন্ত আবিষ্কৃত প্রযুক্তি দ্বারা আমাদের পক্ষে সম্ভব ছিল এটিকে পিডিএফ করে বা ছবি করে ডিজিটাল ফর্মেটে সংরক্ষণ করা। কিন্তু ওসিআর হচ্ছে এর চেয়েও উচ্চপ্রযুক্তি। এ প্রযুক্তির মাধ্যমে বইটির সমস্ত তথ্যকে সম্পাদনযোগ্য লেখায় রূপান্তরিত করা যায়।

ইমেজ থেকে টেক্সটে কনভার্ট করার এ প্রযুক্তি এতদিন ইংরেজিসহ কিছু ভাষার ক্ষেত্রে প্রযোজ্য ছিল। উদ্যোক্তারা জানিয়েছেন ভারতের মতো দেশেরও নিজস্ব কোনো ভাষার ওসিআর নেই। এমনকি এখন পর্যন্ত সার্ক অঞ্চলের কোনো ভাষারই ওসিআর প্রযুক্তি তৈরি হয়নি। কিন্তু বাংলাদেশের তরুণরা এই অসাধ্য সাধন করেছে। বাংলা ভাষার ওসিআর বিনির্মাণে শুধু যে সফলতা এসেছে তা নয়, ইতোমধ্যে এর বহুমাত্রিক ব্যবহারও শুরু হয়েছে। তারুণ্য-নির্ভর প্রযুক্তি প্রতিষ্ঠান ‘টিম ইঞ্জিন’ এর প্রকৌশলী ও প্রযুক্তিকর্মীদের নিরলস প্রচেষ্টা এই জটিল বিষয়টিকে হাতের মুঠোয় নিয়ে এসেছে। তরুণ এই কারিগররা আশাবাদ ব্যক্ত করেছেন সর্বসাধারণের ব্যবহারযোগ্য করে অল্প কিছুদিনের মধ্যে এ প্রযুক্তি বাজারে আসবে।

কেন ওসিআর প্রয়োজন
ওসিআর সারা বিশ্বে জনপ্রিয় একটি সফ্টওয়ার। এর মাধ্যমে স্ক্যানকৃত টেক্সট ডকুমেন্ট, হাতের লেখা, টাইপরাইটারের লেখা, ছাপার হরফের লেখাকে মেশিন রিডেবল লেখায় রূপান্তর করা হয়। যেখানে পরবর্তী সময়ে যে কোনো বর্ণ, শব্দ অথবা বাক্য যোগ বিয়োগ ইত্যাদি সম্পাদন করা সম্ভব হয়। এমনকি স্ক্যানকৃত ডকুমেন্টে ছবি থাকলে তাও বাতিল হয় না। যেমন, বাংলা ভাষার প্রথম যুগের একটি পত্রিকা হচ্ছে ‘সমাচার দর্পণ’। এ পত্রিকার কিছু কপি সংরক্ষিত আছে। ভালো স্ক্যানারের মাধ্যমে এটি স্ক্যান করে নিয়ে ওসিআর সফ্টওয়ারে নিলে এর সমস্ত লেখাকে তা সম্পাদনযোগ্য টাইপকৃত লেখায় রূপান্তরিত করবে এবং ওই পত্রিকায় থাকা নকশা ও ছবিগুলোকেও আলাদা করে দেবে। ফলে সহজেই ওসিআরের মাধ্যমে সম্পাদনযোগ্য ও ব্যবহারযোগ্য ডিজিটাল সমাচার দর্পণ আর্কাইভ চালু করা সম্ভব। যা কিনা এতদিন দুর্লভ হয়ে থাকা এই পত্রিকাটির সমস্ত কিছুকেই সাধারণের নাগালের মধ্যে নিয়ে আসবে।

ওসিআর দিয়ে এভাবে পুরনো তথ্য সংরক্ষণ করা যায়, পুরনো প্রকাশনার নতুন প্রকাশকে সহজতর ও সাশ্রয়ী করা যায়, কার্যকর ও ব্যবহারযোগ্য ই-লাইব্রেরি গড়ে তোলা যায়। তবে সবচেয়ে বড় বিষয়টি হলো ‘কাগজবিহীন দপ্তর’ তথা পূর্ণ ডিজিটালাইজেশনের ক্ষেত্রে এর ব্যবহার। কাগুজে তথ্যগুলোকে ডিজিটালাইজড করার জন্য ওসিআর বহির্ভূত পদ্ধতি হচ্ছে সরাসরি টাইপ করা, যা বিরাট ব্যয়বহুল। এ কারণে কাগজবিহীন একটি দপ্তরে প্রতি মুহূর্তে বিভিন্ন মাধ্যম থেকে আসা দলিলগুলোকে সাশ্রয়ী পদ্ধতিতে যদি কোনোভাবে ডিজিটালাইজড করতে হয়, সেক্ষেত্রে ওসিআরের কোনো বিকল্প নেই। এই বহুমুখী উপযোগিতার জন্যই ওসিআর এত জনপ্রিয়।

অনলাইনে বাংলা ভাষায় তথ্য আদান প্রদান ও জ্ঞানচর্চার সুযোগ বর্তমানে খুবই সীমিত। কারণ বাংলা ইউনিকোড ফর্মেটে তথা সম্পাদনযোগ্য টাইপকৃত ফর্মেটে বাংলা ভাষার খুব কম তথ্যই পাওয়া যায়। সাম্প্রতিক বাংলা পত্রিকাগুলোর অনলাইন বিভাগ, কিছু অনলাইন পত্রিকা, ব্লগ, সাময়িক, সামাজিক যোগাযোগ মাধ্যম এবং বিভিন্ন প্রতিষ্ঠানের নিজস্ব ওয়েবসাইটে বাংলা ইউনিকোড ব্যবহার হচ্ছে। যা কিনা ২০০৭ সাল থেকে বিস্তৃত পরিসরে শুরু হলেও পূর্ণোদ্যমে শুরু হয়েছে বলা যায় ২০০৯ থেকে। এতে সাম্প্রতিক তথ্যগুলোর ইউনিকোড ভার্সন পাওয়া সম্ভব হচ্ছে। কিন্তু বাংলা ভাষায় রচিত পুরনো যত দলিল ও তথ্য রয়েছে সেগুলোকে ইউনিকোড না করা গেলে তা দুর্লভই থেকে যাবে। যদিও অনলাইনে এসব তথ্যের কিছু কিছু স্ক্যান করে সংরক্ষণ করা হচ্ছে, যেমন বিভিন্ন বই ও দলিলপত্র। কিন্তু ইউনিকোডে না নিতে পারায় এগুলোর ভেতরের তথ্য অনুযায়ী সার্চ করে কিছু পাওয়া যায় না। কেবল শিরোনামের ভিত্তিতে সার্চ করা গেলেই তার খোঁজ মেলে।

উদাহরণস্বরূপ বলা যায়, রোমিলা থাপার রচিত ‘ভারতবর্ষের ইতিহাস’ বইটি অনলাইনে স্ক্যান করে রাখা আছে। নাম দিয়ে না খুঁজলে এটি পাওয়া যায় না। একজন পাঠক যদি মুঘল ভারতের ইতিহাস লিখে সার্চ দেন বা মৌর্যযুগের সম্রাট অশোক লিখে সার্চ দেন কিংবা ভারতে মুসলিম শাসন লিখে সার্চ দেন তাহলে এ বইটির খোঁজ মিলবে না। কেবল নাম মোতাবেক সার্চ দিলে এটি পাওয়া যাবে। পাওয়া গেলেও এটি পুরো পিডিএফ আকারে সংরক্ষণ করতে হবে। এর কোনো একটা অধ্যায় থেকে কোনো তথ্য নিতে গেলে তা আবার দেখে দেখে কম্পোজ করে নিতে হবে। পিডিএফ থেকেই টেক্সটে কনভার্ট করার কোনো উপায় নেই। ওসিআর এই অসুবিধাগুলো দূর করে। ওসিআর দ্বারা কনভার্ট করে যদি ওই বইটি অনলাইনে আপলোড করা হয়, তাহলে এর ভেতরে আছে এমন যে কোনো শব্দাংশ দিয়ে সার্চ করে এটি পাওয়া সম্ভব এবং বইয়ের যেকোনো অংশ কপি করে নেয়া ও তা যেকোনো কাজে ব্যবহার করা সম্ভব।

ওসিআর নতুন বা পুরনো প্রকাশনাকে তথ্য ও যোগাযোগপ্রযুক্তির সঙ্গে যুক্ত করতে সক্ষম। অনেকেই আছেন কম্পোজ করতে পারেন না। ওসিআর তাদের নিবীড় বন্ধু হয়ে যাবে। হাতে যে কোনো কিছু লিখে নিজের মোবাইলে একটি ছবি তুলে তা ওসিআরের মাধ্যমে কনভার্ট করে নিলে নিমিষেই ওই হাতের লেখা টাইপকৃত লেখায় রূপান্তরিত হবে।


টিম ইঞ্জিনের চালক : হিমিকা

বাংলা ভাষার ওসিআর- ‘পুঁথি’
মুক্ত জ্ঞানকোষ উইকিপিডিয়ার তথ্যানুযায়ী, ওসিআরের সূচনা ১৯১৪ সালের গোড়ার দিকে। পদার্থবিজ্ঞানী ও উদ্ভাবক ইমানুয়েল গোল্ডবার্গ এটি আবিষ্কারের কৃতিত্ব পেয়েছেন। শুরুর দিকে টেলিগ্রাফিক যোগাযোগের প্রসার ও অন্ধদের পড়ার কাজে সুবিধার জন্য ওসিআর তৈরি করা হয়। এক দশকের মধ্যেই তা ডাটা এন্ট্রি এবং ফটোগ্রাফিক ডাটা রিকগনিশন ও এন্ট্রির কাজে ব্যবহারের উপযোগী করে তোলা হয়। এই সীমিত পরিসরেই ১৯২৯ সালে জার্মানিতে এবং ১৯৩৩ সালে আমেরিকায় ওসিআরের ব্যবহার শুরু হয়। ১৯৪৯ সালে রেডিও কর্পোরেশন অব আমেরিকা টেক্সট থেকে শব্দ তৈরির কাজে ওসিআরের ব্যবহার করে। ১৯৫০ সালে ইউনাইটেড স্টেট অব আমেরিকার আর্মড ফোর্সেস সিকিউরিটি এজেন্সিতে কর্মরত লিপিবিশেষজ্ঞ ডেভিড এইচ শেফার্ড পুরনো ওসিআরকে আমূল বদলে দেন। টেক্সট ডকুমেন্ট, হাতের লেখা, টাইপরাইটারের লেখা, ফটোগ্রাফিক লেখাকে পড়া, প্রয়োজনমতো সম্পাদন এবং শোনা প্রভৃতি বহুমাত্রিক কাজে ব্যবহার উপযোগী করে তিনি ওসিআর তৈরি করেন। পরবর্তীতে তিনি ইন্টেলিজেন্ট মেশিন রিসোর্স কর্পোরেশন নামক প্রতিষ্ঠান তৈরি করে তার মাধ্যমে বাণিজ্যিকভাবে ওসিআরের ব্যবহার প্রচলন করেন।

প্রযুক্তিবিদদের সঙ্গে কথা বলে জানা গেছে, বাংলা ভাষায় ওসিআর তৈরির চেষ্টা অনেকদিন ধরেই চলছে। ভিন্ন ভিন্ন উদ্যোগ কয়েক দফা নেয়া হলেও প্রথম পূর্ণাঙ্গ সফলতা পেয়েছে ‘টিম ইঞ্জিন’। এর আগে ব্র্যাক বিশ্ববিদ্যালয়ের সেন্টার ফর রিসার্স অন বাংলা ল্যাংগুয়েজ প্রসেসিং (সিআরবিএলপি) একটি প্রাথমিক সফ্টওয়ার দাঁড় করালেও তার ফলাফল তেমন ভালো ছিল না যে, এর বাণিজ্যিক ব্যবহার করা যায়। অর্থাৎ সফ্টওয়ারটি বাংলা ভাষাকে কার্যকর ওসিআর সুবিধা দিতে পারেনি। কাছাকাছি সময়ে একটি জাতীয় দৈনিক অনলাইন পড়ার পাশাপাশি শোনার কাজে ওসিআর ব্যবহারের উদ্যোগ নেয় বলে জানা যায়, তার ফলাফলও ছিল একই রকম। এছাড়া সরকারি অনুদান পেয়েও সফল হতে পারেনি ইউনাইটেড বিশ্ববিদ্যালয়ের একটি গবেষক দল। ব্যক্তি পর্যায়ে দেশে ও দেশের বাইরে এমনকি ভারতেও বাংলা ওসিআর নিয়ে কিছু কাজ হয়েছে। অর্থাৎ ওসিআর তৈরির অবাহত চেষ্টা থাকলেও অনেক দিন ধরেই সফলতা আসছিল না।

বিশেষজ্ঞদের সঙ্গে কথা বলে আমরা জেনেছি, কার্যকর ওসিআর তৈরির জন্য যেসব উপাদান দরকার, বাংলাদেশে এখনও সেগুলোর অভাব রয়েছে। প্রমিত কিবোর্ড, প্রমিত বাংলা লিখন পদ্ধতি, প্রমিত বাংলা ফন্ট, প্রমিত ইউনিকোড, লিপি/স্বর গবেষণা একেবারেই না থাকায় পূর্ণাঙ্গ ওসিআর করা খুবই কঠিন। প্রমিত পদ্ধতি না থাকার সমস্যাটা হচ্ছে, একেকজনের চাহিদা হয় একেকরকম। সফ্টওয়ারের ডিজাইনেও ভিন্ন ভিন্ন অনেক অপসন যুক্ত করতে হয়, যা কিনা সিস্টেমকে জটিল, ব্যয়বহুল এবং সীমিত পরিসরে আটকে ফেলে। এর সর্বজনীন চেহারা দাঁড়াতে পারে না। লিপি গবেষণা না থাকায় হাতের লেখা ও ফন্টের নকশার মধ্যকার সম্পর্ক বিষয়ক সমস্যা সমাধান করা কঠিন হয়ে পড়ে।

স্বরযন্ত্র বিষয়ক গবেষণা না থাকায় টেক্সট টু স্পিচ বা ইমেজ টু ভয়েস অর্থাৎ লেখা থেকে কথা হবে ওসিআরের এমন রূপ দাঁড় করানোটা প্রায় অসম্ভব হয়ে আছে। এর সঙ্গে যুক্ত আছে গবেষণায় বিনিয়োগের অপ্রতুলতা। যেসব প্রাযুক্তিক গবেষণায় ফলাফল ইতি বা নেতি যেকোনো কিছু হতে পারে, এসব ক্ষেত্রে বাংলাদেশে এখনও প্রাতিষ্ঠানিক বিনিয়োগের কোনো লক্ষণ নেই। লাভ নিশ্চিত করে দেখানো গেলেই কেবল তাতে বিনিয়োগ পাওয়া যেতে পারে, তাও নিশ্চিত নয়। কিন্তু প্রযুক্তিগত অনেক গবেষণা লাভের আশা ছাড়াই করতে হয়। কাজটা আদৌ করা সম্ভব কিনা তা বুঝতে গিয়েই ব্যয় করে ফেলতে হয় অনেক অর্থ। বাংলাদেশে এখনও এরকম খাতে বিনিয়োগের পরিবেশ গড়ে ওঠেনি।

এ ধরনের সীমাবদ্ধতার মধ্যেই ব্যক্তি উদ্যোগে যে এখানে দফায় দফায় ওসিআর তৈরির চেষ্টা হয়েছে তা রীতিমতো আগ্রহোদ্দীপক। অনেকের চেষ্টার পর শেষ পর্যন্ত এক্ষেত্রে সফলতা পেয়েছে তরুণ উদ্যোক্তা সামিরা জুবেরি হিমিকার গড়ে তোলা ‘টিম ইঞ্জিন’। প্রথমদিকে নিজস্ব উদ্যোগে গাঁটের পয়সা ব্যয় করে দীর্ঘদিন তারা গবেষণায় কাটিয়েছেন। এরপর ২০১২ সালের দিকে তারা সফ্টওয়ারটি নির্মাণ সম্ভব বলে নিশ্চিত হন। পরবর্তীতে একাজে তাদের প্রতি সহযোগিতার হাত বাড়ায় বাংলাদেশ সরকার। সরাসরি তাদের এ কাজে উৎসাহ ও পরামর্শ দিয়ে সহযোগিতা করেছেন অর্থমন্ত্রী আবুল মাল আবদুল মুহিত, তখনকার আইসিটি সচিব নজরুল ইসলাম খান, অধ্যাপক ড. জাফর ইকবাল ও প্রযুক্তিবিদ মোস্তফা জব্বার।

গত ৭ আগস্ট, ২০১৪ টিম ইঞ্জিন প্রথম পূর্ণাঙ্গ বাংলা ওসিআর ‘পুঁথি’ সবার সামনে নিয়ে আসে। সেই উদ্বোধনের পর সরকারি খাতে সফ্টওয়ারটির বহুমাত্রিক ব্যবহার শুরু হলেও এখনও এটি সর্বসাধারণের হাতে পৌঁছায়নি। প্রথমদিকে টিম ইঞ্জিন অনলাইনে বিনামূল্যে সীমিত পরিসরে সফ্টওয়ারটি ব্যবহারের সুযোগ দিয়ে একটি সাইট চালু করে। তারপর সফ্টওয়ারটির আরও উন্নতিকল্পে এই সীমিত পরিষেবা বন্ধ রাখা হয়।

তবে টিম ইঞ্জিন কর্তৃপক্ষ আশা করছেন ২০১৬ সালে এ সফ্টওয়ারটি তারা বাণিজ্যিকভাবেই সবার দোরগোড়ায় পৌঁছে দিতে পারবেন। এমনকি সফ্টওয়ারের নির্মাণ ব্যয় উঠে গেলে এটি বিনামূল্যে দেয়ার কথাও তারা ভেবে রেখেছেন। তার আগ পর্যন্ত একক ব্যবহার, দলবদ্ধ ব্যবহার ও প্রাতিষ্ঠানিক ব্যবহারের জন্য সফ্টওয়ারটির আলাদা আলাদা প্যাকেজ বাজারে ছাড়া হবে। পূর্ণাঙ্গ বাণিজ্যিক ব্যবহারের উপযোগী বিদেশি ভাষার এক বছর মেয়াদি ওসিআরের দাম পড়ে ৩০০ থেকে ৫০০ ডলারের মধ্যে। এরকম একটি বাংলা প্যাকেজের দাম ২০ থেকে ৩০ হাজার টাকার মধ্যে থাকবে বলে জানা গেছে। এর চেয়ে স্বল্প পরিসরের ব্যবহারের জন্য কম দামের প্যাকেজগুলো বাজারে থাকবে। তবে যারা বছরে এক হাজার পাতার মতো ক্ষুদ্র পরিসরের ওসিআর করবেন, তাদের বিনামূল্যে অনলাইনে এই সেবা দেয়া হবে। পাশাপাশি মোবাইলে ব্যবহারের উপযোগী করে অ্যাপস ছাড়া হবে।

কথা বলে জানা যায়, বাংলা ভাষার প্রথম যুগের তথ্য সংরক্ষণ উপায়কে ‘পুঁথি’ বলা হয়। উদ্যোক্তারা তাদের নিজেদের উদ্ভাবিত এই বাংলা ওসিআরের নাম ‘পুঁথি’ রেখে ইতিহাস ও ঐতিহ্যের সঙ্গে আধুনিক এই প্রযুক্তিকে সম্পর্কিত করেছেন। এর মাধ্যমে এমনকি প্রাচীন বিষয়াদিকেও প্রাসঙ্গিক করে তোলা হয়েছে। উদ্যোক্তারা জানান, পুঁথি একটি উন্নত প্রযুক্তিসম্পন্ন ওসিআর।

হিমিকাসহ ওই প্রতিষ্ঠানটিতে কর্মরত নাজিয়া বিনতে হারুন, ফয়সালসহ আরও অনেকের সঙ্গে কথা বলেছি আমরা। তারা বলেন, আমরা প্রমাণ করেছি যে, বাংলাদেশের ছেলেরা পারে। বাংলা ওসিআরের প্রকল্পটা হাসনাত শাহরিয়ার প্রান্ত’র মস্তিষ্কপ্রসূত। তিনিই প্রথমে এটির ভিত্তি গড়ে তোলার কাজ করেন। এরপর এর সঙ্গে কাজ করেছেন, সম্রাট আমিন, ফয়সাল, মাসুদ, সারোয়ার, জুলফিকার, রায়হান, শোভন, বর্ষা, নাজিয়াসহ আরও অনেকে। এদের অধীনেই আবার আরও অনেকে কাজ করেছেন।

টিম ইঞ্জিনের সদস্যদের স্বপ্ন অনেক দূর এগিয়ে যাওয়ার। তারা জানান, আগামীতে চলমান প্রকল্পগুলোকে আরও উন্নত করা, এবং আশপাশের যেসব ভাষা আছে, যেগুলো কিনা সংস্কৃত ভাষার কাছাকাছি, যেমন হিন্দি, মালয়, গুজরাটি, এরকম ভাষাগুলোতে ওসিআর করার বড় স্বপ্ন সামনে রেখে তারা কাজ করে চলেছেন।

নিঃসন্দেহে বলা যায়, ৬৯ সালে মুনীর কীবোর্ড আবিস্কার, ৭৩ সালে বাংলা টাইপরাইটার প্রবর্তন, ১৯৮৬ সালে শহীদলিপির আত্মপ্রকাশ, ১৯৮৮ সালে বিজয় কীবোর্ড প্রকাশ এবং ২০০৩ সালে ইউনিকোডভিত্তিক অভ্র কীবোর্ড প্রকাশের পর বাংলা ভাষার তথ্যপ্রযুক্তিতে নতুন মাইলফলক এটি। উদ্যোক্তাদের গণমুখিতা ও উদারতা এবং সরকার ও প্রযুক্তি সংশ্লিষ্টদের তৎপরতার ওপর এর ভবিষ্যৎ অনেকখানি নির্ভর করছে। বাংলাদেশে প্রযুক্তিসংশ্লিষ্টরা নতুন প্রযুক্তি উদ্ভাবনের প্রশ্নে একটি জায়গায় এখনও বিভক্ত। সফ্টওয়ার উন্মুক্ত বা ব্যবসাপণ্য করা, না করা নিয়ে দীর্ঘদিন ধরেই বিতর্ক চলছে। অভ্র-বিজয় বিতর্কের প্রাক্কালে বিষয়টি সামনে আসে। এরকম প্রেক্ষিতে ‘পুঁথি’ কতটা গণমুখী হবে তা নিয়ে অনেকের যদিও প্রশ্ন আছে, তবু টিম ইঞ্জিনের কর্মীরা আমাদের বলেছেন, মুনাফা তাদের লক্ষ্য নয়। ব্যয় নির্বাহ হলে তারা সফ্টওয়ারটি সর্বসাধারণের সহজপ্রাপ্যতার ব্যবস্থা অবশ্যই করবেন।

বাংলা ওসিআর পুঁথি দিয়ে যা করা যাবে
* বাংলা ওসিআরের মাধ্যমে সরকারি-বেসরকারি প্রতিষ্ঠান থেকে শুরু করে নতুন-পুরনো বই, নথি ডিজিটালাইজেড করা যাবে

* বই, নথি একেবারে হারিয়ে যাওয়ার হাত থেকে রক্ষা পাবে

* বই, নথি, কাগজের স্তূপ থেকে ঘণ্টার পর ঘণ্টা ব্যয় করে কোনো তথ্য খুঁজে বের করতে হবে না। কম্পিউটারে বা ওয়েবে থাকলে সার্চ দিলেই তথ্য খুঁজে পাওয়া যাবে

* অনলাইন লাইব্রেরি প্রতিষ্ঠায় বাংলা ওসিআর ভূমিকা রাখতে পারবে

* ই-গভর্নেন্স ও কাগজ-নথিবিহীন যে অফিসের পরিকল্পনা বাস্তবায়নের চেষ্টা করা হচ্ছে সেখানেও ভূমিকা রাখতে পারবে বাংলা ওসিআর

* এই সফটওয়্যারের মাধ্যমে আগের সব ফাইল ডিজিটাল ফর্মেটে ওয়েব/ সার্ভার কিংবা কম্পিউটারের হার্ডডিস্কে সংরক্ষণ করা যাবে।

পুঁথির ফিচারসমূহ
* এটি বাংলা বই বা লিখিত তথ্যের স্ক্যান কপিকে ওয়ার্ড ডকুমেন্টসে রূপান্তরিত করতে পারে।

* এটি ছবিতে সংরক্ষিত লোগো, টেক্সট, ইমেজ শনাক্ত করতে পারে।

* এটি ছবিতে বাংলা বাদে অন্য ভাষাকে ইমেজ আকারে সংরক্ষিত রাখে।

* ইমেজকে ওয়ার্ড ডকুমেন্টসে সংরক্ষিত করার সময় কোনো পৃষ্ঠার আকারকে আগের মতোই সংরক্ষিত রাখে।

* ২৫০ ডিপিআই থেকে ১২০০ ডিপিআই পর্যন্ত ক্ষমতাসম্বলিত স্ক্যান যন্ত্রের ইমেজ এটিতে সম্পাদনা করে যাবে। ডিপিআই বেশি হলে রূপান্তর বেশি নিখুঁত হবে।

* পুঁথিতে অনেকগুলো ব্যাচে কাজ করার ক্ষমতা আছে। সম্পূর্ণ ফোল্ডার নিয়ে কাজ করতে পারে এবং বড় ফাইল নিয়ে কাজ করতে পারে।

* ত্রুটিপূর্ণ এবং আঁকাবাঁকা স্ক্যান হলেও তা সোজা করেই রূপান্তরিত করতে পারে। নির্দিষ্ট জায়গার অংশ বিশেষ সম্পাদনযোগ্য ওয়ার্ড ডকুমেন্টসে রূপান্তরিত করতে পারে।

* এটি ছবিতে সংরক্ষিত অক্ষরও চিনতে পারে। ফলে ছবির অক্ষরকে স্ক্যান করে অথবা ছবি তুলে টেক্সট ফাইলে রূপান্তর করা যায়।

* পুঁথি সফ্টওয়ারটি মাত্র ২৫ সেকেন্ডেই বইয়ের একটি পাতাকে ডিজিটালাইজ তথা সম্পাদনযোগ্য লেখায় পরিণত করতে সক্ষম। আপডেটেড ভার্সনে তা আরও দ্রুত কনভার্ট করতে সক্ষম হবে।

* পুঁথি, মূল টেক্সটের শতকরা ৯০ ভাগেরও বেশি শব্দ নির্ভুলভাবে প্রদর্শন করতে সক্ষম। এটি এখন পর্যন্ত ১২০টিরও বেশি বাংলা ফন্ট সাপোর্ট করে। তবে এই সংখ্যা ধারাবাহিকভাবে বাড়তে থাকবে।

* এই মুহূর্তে ‘পুঁথি’ উইন্ডোজ ভার্সনে সাপোর্ট করে। পরবর্তীতে সফ্টওয়্যারটি আপগ্রেডের মাধ্যমে সব অপারেটিং সিস্টেমে সাপোর্টের ব্যবহার করা হবে।

সংবাদসূত্র : এই লিঙ্কে যান

৪ thoughts on “বাংলা ওসিআর, ইমেজ টু টেক্সট কনভার্টার বাজারে আসছে

Leave a Reply

Your email address will not be published. Required fields are marked *