২০২৬-এ এসেও কৃত্রিম বুদ্ধিমত্তার বুদ্ধির গোড়ায় ধোঁয়া দিতে যারপরনাই চেষ্টা চালিয়ে যাচ্ছে গুগল (Google)। এআই (AI) দুনিয়ায় একের পর এক চমক দিয়ে চলেছে টেক জায়েন্টটি। বছরের শুরুতেই অ্যাপলের সঙ্গে কৌশলগত অংশীদারিত্ব, নতুন শপিং টুলস এবং জেমিনি এআই-এর আধুনিকীকরণের মাধ্যমে এগিয়ে চলার মনোভাব স্পষ্ট করেছে তারা। এবার গুগল তার নজর ঘুরিয়েছে ওপেন-সোর্স কমিউনিটির দিকে। সম্প্রতি সংস্থাটি ‘ট্রান্সলেট জেমা’ (TranslateGemma) নামে একগুচ্ছ শক্তিশালী মাল্টিলিঙ্গুয়াল (বহুভাষি) এআই মডেল প্রকাশ করেছে, যা বিশ্বজুড়ে অনুবাদ প্রক্রিয়ায় এক নতুন দিগন্ত খুলে দেবে বলে মনে করা হচ্ছে।
Google আনল TranslateGemma
গুগল তাদের অফিসিয়াল ব্লগে জানিয়েছে যে, এই নতুন মডেলগুলি মূলত বিভিন্ন ভাষার মধ্যে দ্রুত ও নির্ভুল অনুবাদের জন্য তৈরি করা হয়েছে। এগুলির বিশেষত্ব এটি যে কেবল লেখাকে অনুবাদ করে তাই না, পাশাপাশি এটি ইমেজ বা ছবিকেও ইনপুট হিসেবে গ্রহণ করতে পারে। সেই ছবিতে থাকা লেখা শনাক্ত করে অনুবাদ করতে সক্ষম। ট্রান্সলেট জেমা তিনটি ভিন্ন আকারে বা মডেলে বাজারে আনা হয়েছে। যথা – ৪বি (4B), ১২বি (12B) এবং ২৭বি (27B)। এখানে ৪বি বা ২৭বি বলতে মডেলটির প্যারামিটারের সংখ্যা বোঝানো হয়েছে। ছোট ৪বি মডেলটি মূলত মোবাইল ফোন বা এজ ডিভাইসে ব্যবহারের জন্য অপ্টিমাইজ করা হয়েছে। অন্যদিকে, ১২বি ভ্যারিয়েন্টটি সাধারণ ল্যাপটপে চালানোর উপযোগী। সবথেকে বড় ২৭বি মডেলটি সর্বোচ্চ মানের অনুবাদের জন্য বিশেষভাবে ডিজাইন করা হয়েছে, যা উচ্চক্ষমতাসম্পন্ন জিপিইউ বা টিপিইউ-তে অনায়াসেই কাজ করবে।
প্রযুক্তিগত দিক থেকে এই নতুন মডেলগুলি গুগলের (Google) নিজস্ব ‘জেমা ৩’ আর্কিটেকচারের ওপর ভিত্তি করে তৈরি। গবেষকরা এতে সুপারভাইজড ফাইন-টিউনিং এবং রিইনফোর্সমেন্ট লার্নিং প্রযুক্তি ব্যবহার করেছেন। এর ফলে এটি এমন সব ভাষার অনুবাদও করতে সক্ষম, যেগুলির তথ্য বা ডেটা ইন্টারনেটে খুব কম পাওয়া যায়। গুগলের দাবি অনুযায়ী, ট্রান্সলেট জেমার ১২বি মডেলটি পারফরম্যান্সের দিক থেকে বড় ২৭বি জেমা ৩ মডেলকেও ছাপিয়ে গিয়েছে। অর্থাৎ, আগের তুলনায় অর্ধেক প্যারামিটার ব্যবহার করেই ডেভেলপাররা এখন আরও উন্নত মানের অনুবাদ পরিষেবা পাবেন। যা ওয়ার্ল্ড মেশিন ট্রান্সলেশন ২০২৪ (WMT24++) বেঞ্চমার্কেও প্রমাণিত হয়েছে।
আরও পড়ুন: REDMI Note 15 Pro series: সস্তায় দারুণ স্মার্টফোন আনল শাওমি, দেখুন ফিচার ও দাম
বর্তমানে এই মডেলটি হিন্দি, চিনা, স্প্যানিশ এবং ফ্রেঞ্চ সহ ৫৫টি প্রধান ভাষায় বিশেষভাবে প্রশিক্ষণপ্রাপ্ত। তবে এর পাশাপাশি আরও প্রায় ৫০০টি অতিরিক্ত ভাষা নিয়ে এটি কাজ করতে সক্ষম। ডেভেলপার এবং সাধারণ ব্যবহারকারীরা এই মডেলগুলি গুগল (Google) বা কাগল (Kaggle) এবং হাগিং ফেস (Hugging Face) থেকে সরাসরি ডাউনলোড করতে পারবেন। এছাড়াও ক্লাউড ব্যবহারের জন্য এটি ভার্টেক্স এআই-তেও (Vertex AI) উপলব্ধ করা হয়েছে। বড় বিষয়, গুগল এতে একটি সহজ লাইসেন্স প্রদান করেছে, যার ফলে বাণিজ্যিক এবং শিক্ষামূলক – উভয় ক্ষেত্রেই এটি বিনা বাধায় ব্যবহার করা যাবে। গুগলের এই পদক্ষেপ কেবল অনুবাদ পরিষেবাকেই সহজ করবে না, বরং বিশ্বের ভাষাগত দূরত্ব কমিয়ে আনতে এক বৈপ্লবিক ভূমিকা পালন করবে।
