ভুল বাংলা ঠিক করবে ‘সঠিক’

বাংলা লেখার ভুল শোধরাতে এলো অনলাইন টুল ‘সঠিক’
ছবি: সংগৃহীত

অনলাইন যোগাযোগের দুনিয়ায় স্পষ্ট ও সঠিকভাবে লেখাটা খুব জরুরি, তা সে মেইল, ব্লগ পোস্ট বা সামাজিক যোগাযোগমাধ্যমের আপডেট– যাই হোক না কেন। লিখিত বার্তাটা হতে হবে সংক্ষিপ্ত, মিথস্ক্রিয়ামূলক এবং নির্ভুল। বাংলার মতো ভাষার ক্ষেত্রে এটি আরও বেশি প্রযোজ্য, যা কি না বিশ্বব্যাপী লাখো মানুষের মুখের ভাষা হওয়া সত্ত্বেও এর সাহায্যকারী ডিজিটাল টুলের সংখ্যা পর্যাপ্ত নয়।  

আর এই অপর্যাপ্ততা ঘোচাতেই আবির্ভাব হলো 'সঠিক'-এর। এটি বাংলাভাষী লেখকদের জন্য ক্লাউডভিত্তিক এমন একটি সহায়ক মাধ্যম, যা বর্তমান সময়ে বাংলা লেখার গল্পটাই পাল্টে দেবে। বৈশ্বিক পরিসরে জনপ্রিয় রাইটিং টুল গ্রামারলির মতো সঠিক বানান, ব্যাকরণ, যতিচিহ্ন, লেখার স্পষ্টতা ইত্যাদি বিষয় দেখে ভুল খুঁজে বের করে এবং শোধরানোর বিভিন্ন পরামর্শ দেবে।

বাংলা ভাষার ব্যাকরণে নিজস্ব যে সব নিয়ম-নীতি আছে, যা নিজস্ব ভাষাভাষী বক্তা ও পেশাদার লেখকদের জন্যেও অনেক ক্ষেত্রে বেশ কঠিন। ইংরেজি লেখকদের জন্য এত এত ডিজিটাল টুল থাকলেও বাজারে এর আগ পর্যন্ত বাংলার জন্য এমন কিছুই আসেনি। এই শূন্যস্থান পূরণ করতেই এসেছে সঠিক। এই সফটওয়্যারটি বাংলা লেখা স্ক্যানের পাশাপাশি সম্ভাব্য ত্রুটি শনাক্ত করতে মেশিন লার্নিং অ্যালগরিদম ব্যবহার করে থাকে। তাই ঝামেলাটা বানান নিয়ে হোক বা ক্রিয়ার কাল, যতিচিহ্ন– সঠিক সব সময়ই সঠিক পরামর্শ দিয়ে লেখালেখির মান আরও উন্নত করতে সক্ষম।

সঠিক মূলত আইসিটি বিভাগের আওতাধীন বাংলাদেশ কম্পিউটারের 'এনহ্যান্সমেন্ট অব বাংলা ল্যাঙ্গুয়েজ ইন আইসিটি' বা 'আইসিটিতে বাংলা ভাষার সমৃদ্ধি' শীর্ষক প্রকল্পের একটি উপজাত। এই সরকারি প্রকল্পটি ২০১৭ সাল থেকে চালু রয়েছে। বিশেষত 'স্পেল চেকার' বা বানান সংশোধনকারী ফিচারটির উন্নয়নকাজ শুরু হয় ২০১৯ সালে। এই প্রকল্পের উদ্দেশ্য হচ্ছে বাংলা ভাষার সমৃদ্ধি ঘটিয়ে বিশ্বমাধ্যমে এর বিশেষ স্থান তৈরি করা। 

বাংলা ভাষায় লেখালেখি ও তা প্রকাশের সব রকম বাধাবিপত্তি দূর করাও এ প্রকল্পের আরেকটি লক্ষ্য। তাই সঠিক-এর পরিকল্পনা করা হয়ে একটি বাংলা কম্পিউটিং মডিউল হিসেবে। এবং এটি যাতে জনপরিসরে চাহিদা পূরণে সক্ষম হয়, সেটিও মাথায় রাখা হয়েছিল।

'সঠিক'-এর বিকাশ

এটি একটি তথ্যভিত্তিক অ্যাপ এবং মেশিং লার্নিং ব্যবস্থা। এর সাহায্যকারী হিসেবে রয়েছে কৃত্রিম বুদ্ধিমত্তা। অ্যাপ্লিকেশনটি ভালোভাবে তৈরির পর আরও উন্নয়নের কাজে বিশাল তথ্যভাণ্ডার ও মডেল ব্যবহৃত হয়।

মডেলটি প্রস্তুতের আগে নির্মাণকারী দল বাংলা একটি নির্দিষ্ট পরিমাণ টেক্সচুয়াল বা পাঠ্য ডেটাকে এনএলপি, অর্থাৎ ন্যাচারাল লার্নিং প্রবলেম হিসেবে চিহ্নিত করে। অবশ্য সেই তথ্যভাণ্ডারে এমন বহু সমস্যা ছিল, যার সমাধান করতে করতে সঠিক এ কাজে দক্ষ হয়ে ওঠে। 

মডেলিং প্রক্রিয়া ছাড়াও অ্যালগরিদম, সফটওয়্যার, ম্যানুয়াল ডেটা প্রসেসিং ছিল এই অ্যাপ্লিকেশনের মূল কাজ। এসব অত্যন্ত একঘেয়ে এবং সময়সাপেক্ষ কাজগুলো করেন এ বিষয়ে দায়িত্বপ্রাপ্ত কনসাল্টিং ফার্মের এক দল নিবেদিতপ্রাণ ভাষাবিদ। একটি গণমুখী মেশিন লার্নিং-ভিত্তিক অ্যাপ্লিকেশন পরিচালনার পথে বহু চ্যালেঞ্জ রয়েছে। সেসব চ্যালেঞ্জের সম্মুখীন হয়েও সফটওয়্যার দলটি এর অবকাঠামো তৈরির জন্য কঠোর পরিশ্রম করেছে। এ ছাড়া 'সঠিক'কে সুষ্ঠুভাবে চালিয়ে যাওয়ার জন্য তারা মূল প্রকল্পটিকেও আরও শক্তিশালী করে।

যেহেতু 'সঠিক' একটি সরকারি প্রকল্পের ফসল, এর পরিকল্পনা ও প্রাথমিক নকশা ইবিএলআইসিটি দ্বারা নির্ধারণ করে দেওয়া হয়। ইবিএলআইসিটি ১৬টি বিষয়ের অন্তর্ভুক্ত ৪০টিরও বেশি ডিজিটাল টুল ও রিসোর্স তৈরি করছে। সঠিকও সেগুলোর মধ্যে একটি।

সঠিক-এর সফটওয়্যার উন্নয়নের জন্য অংশীদার হচ্ছে 'রিভ'। বুয়েটের সিএসই বিভাগেও মনোনীত কনসাল্টেন্ট হিসেবে সফটওয়্যারের বিভিন্ন পরীক্ষা-নিরীক্ষায় কাজ করছে। এ ছাড়া প্রকল্পটির সব ধরনের কাজই একটি বিশেষজ্ঞ কমিটি দ্বারা যাচাই করা হয়। 

আরও কিছু দুর্দান্ত প্রকল্প

এই দলটি কৃত্রিম বুদ্ধিমত্তা-নির্ভর এনএলপি ও কম্পিউটার ভিশন সংক্রান্ত বেশ কিছু অ্যাপ্লিকেশন, যেমন– বাংলা ওসিআর এবং হাতের লেখা শনাক্তকরণ ব্যবস্থা গড়ে তুলছে। এটি মূলত বিভিন্ন রূপে, অর্থাৎ 'টেক্সট', 'স্পিচ টু টেক্সট' ও 'টেক্সট টু স্পিচ' অ্যাপ্লিকেশনে বাংলা ভাষার বিভিন্ন বার্তার আবেগীয় মূল্যায়ন, শ্রবণ ও বাক প্রতিবন্ধীদের জন্য বাংলা সাংকেতিক ভাষা শনাক্তকারী ব্যবস্থা, দৃষ্টি প্রতিবন্ধীদের জন্য স্ক্রিন রিডার এবং ব্রেইল পদ্ধতি তৈরি এবং বাংলাদেশের মোট ৪০টি ভাষাকে ডিজিটাইজ করার জন্য বাংলা ন্যাশনাল কর্পাস ডেভেলপমেন্টের একটি প্রকল্প, যার মধ্যে ১৪টি বিলুপ্তপ্রায় আদিবাসী ভাষা রয়েছে।

এ ছাড়া দলটি সবগুলো ভাষা ও লেআউটের জন্য একটি বৈশ্বিক কি-বোর্ডও ডেভেলপ করেছে। বর্তমানে গবেষক ও প্রকৌশলীদের জন্য সহায়ক টুল হিসেবে বাংলা ট্রিব্যাংক ও বিভিন্ন ল্যাঙ্গুয়েজ মডেল ডেভেলপমেন্ট, লেবেলিং, মাঠ পর্যায়ে তথ্য সংগ্রহের ব্যবস্থা ও ট্যাগিং প্ল্যাটফর্ম তৈরি করছে। একটি সংক্ষিপ্ত ই-মেইল সাক্ষাৎকারে দলটি জানায়, শিগগিরই এমন কিছু শক্তিশালী প্রকল্প শুরু হবে, যার মধ্যে রয়েছে মেশিন ট্রান্সলেটর এবং বাংলা ভার্চুয়াল প্রাইভেট অ্যাসিস্টেন্ট। এই প্রকল্পগুলোর অধিকাংশই ইতোমধ্যে ডেভেলপ করা হয়ে গেছে এবং বেটা-রিলিজের জন্য অপেক্ষায় রয়েছে। আশা করা যায়, এসব টুল সম্পূর্ণ প্রস্তুত হয়ে গেলে তথ্য-প্রযুক্তির জগতে বাংলা ভাষা আরও ছড়িয়ে পড়বে।

তারা আরও জানান, বিশ্বের যেকোনো প্রান্তের বাংলাভাষীদের জন্যই সঠিক পুরোপুরি বিনামূল্যে ব্যবহার করা যাবে। দলটি আশাবাদী যে, মুদ্রণ, প্রকাশ ও শিক্ষাক্ষেত্রে সরকারি প্রতিষ্ঠানগুলো সঠিক ব্যবহারের মাধ্যমে উপকৃত হবে। এ বিষয়ে তাদের চূড়ান্ত লক্ষ্য হচ্ছে জনপরিসরে বিনামূল্যে ব্যবহারের জন্য একটি উঁচু মানের বানান ও ব্যাকরণ সংশোধনকারী সফটওয়্যার ডেভেলপ করা। 

 

অনুবাদ করেছেন অনিন্দিতা চৌধুরী
 

Comments

The Daily Star  | English

BB tightens loan classification rules to meet IMF conditions

Payment failure for three months or 90 days after the due date will now lead to classification of loans regardless of type, according to new rules announced by the central bank yesterday, aligning with international best practices prescribed by the International Monetary Fund (IMF).

8h ago