২০২৬-এ এসেও কৃত্রিম বুদ্ধিমত্তার বুদ্ধির গোড়ায় ধোঁয়া দিতে যারপরনাই চেষ্টা চালিয়ে যাচ্ছে গুগল (Google)। এআই (AI) দুনিয়ায় একের পর এক চমক দিয়ে চলেছে টেক জায়েন্টটি। বছরের শুরুতেই অ্যাপলের সঙ্গে কৌশলগত অংশীদারিত্ব, নতুন শপিং টুলস এবং জেমিনি এআই-এর আধুনিকীকরণের মাধ্যমে এগিয়ে চলার মনোভাব স্পষ্ট করেছে তারা। এবার গুগল তার নজর ঘুরিয়েছে ওপেন-সোর্স কমিউনিটির দিকে। সম্প্রতি সংস্থাটি ‘ট্রান্সলেট জেমা’ (TranslateGemma) নামে একগুচ্ছ শক্তিশালী মাল্টিলিঙ্গুয়াল (বহুভাষি) এআই মডেল প্রকাশ করেছে, যা বিশ্বজুড়ে অনুবাদ প্রক্রিয়ায় এক নতুন দিগন্ত খুলে দেবে বলে মনে করা হচ্ছে।
গুগল তাদের অফিসিয়াল ব্লগে জানিয়েছে যে, এই নতুন মডেলগুলি মূলত বিভিন্ন ভাষার মধ্যে দ্রুত ও নির্ভুল অনুবাদের জন্য তৈরি করা হয়েছে। এগুলির বিশেষত্ব এটি যে কেবল লেখাকে অনুবাদ করে তাই না, পাশাপাশি এটি ইমেজ বা ছবিকেও ইনপুট হিসেবে গ্রহণ করতে পারে। সেই ছবিতে থাকা লেখা শনাক্ত করে অনুবাদ করতে সক্ষম। ট্রান্সলেট জেমা তিনটি ভিন্ন আকারে বা মডেলে বাজারে আনা হয়েছে। যথা – ৪বি (4B), ১২বি (12B) এবং ২৭বি (27B)। এখানে ৪বি বা ২৭বি বলতে মডেলটির প্যারামিটারের সংখ্যা বোঝানো হয়েছে। ছোট ৪বি মডেলটি মূলত মোবাইল ফোন বা এজ ডিভাইসে ব্যবহারের জন্য অপ্টিমাইজ করা হয়েছে। অন্যদিকে, ১২বি ভ্যারিয়েন্টটি সাধারণ ল্যাপটপে চালানোর উপযোগী। সবথেকে বড় ২৭বি মডেলটি সর্বোচ্চ মানের অনুবাদের জন্য বিশেষভাবে ডিজাইন করা হয়েছে, যা উচ্চক্ষমতাসম্পন্ন জিপিইউ বা টিপিইউ-তে অনায়াসেই কাজ করবে।
প্রযুক্তিগত দিক থেকে এই নতুন মডেলগুলি গুগলের (Google) নিজস্ব ‘জেমা ৩’ আর্কিটেকচারের ওপর ভিত্তি করে তৈরি। গবেষকরা এতে সুপারভাইজড ফাইন-টিউনিং এবং রিইনফোর্সমেন্ট লার্নিং প্রযুক্তি ব্যবহার করেছেন। এর ফলে এটি এমন সব ভাষার অনুবাদও করতে সক্ষম, যেগুলির তথ্য বা ডেটা ইন্টারনেটে খুব কম পাওয়া যায়। গুগলের দাবি অনুযায়ী, ট্রান্সলেট জেমার ১২বি মডেলটি পারফরম্যান্সের দিক থেকে বড় ২৭বি জেমা ৩ মডেলকেও ছাপিয়ে গিয়েছে। অর্থাৎ, আগের তুলনায় অর্ধেক প্যারামিটার ব্যবহার করেই ডেভেলপাররা এখন আরও উন্নত মানের অনুবাদ পরিষেবা পাবেন। যা ওয়ার্ল্ড মেশিন ট্রান্সলেশন ২০২৪ (WMT24++) বেঞ্চমার্কেও প্রমাণিত হয়েছে।
আরও পড়ুন: REDMI Note 15 Pro series: সস্তায় দারুণ স্মার্টফোন আনল শাওমি, দেখুন ফিচার ও দাম
বর্তমানে এই মডেলটি হিন্দি, চিনা, স্প্যানিশ এবং ফ্রেঞ্চ সহ ৫৫টি প্রধান ভাষায় বিশেষভাবে প্রশিক্ষণপ্রাপ্ত। তবে এর পাশাপাশি আরও প্রায় ৫০০টি অতিরিক্ত ভাষা নিয়ে এটি কাজ করতে সক্ষম। ডেভেলপার এবং সাধারণ ব্যবহারকারীরা এই মডেলগুলি গুগল (Google) বা কাগল (Kaggle) এবং হাগিং ফেস (Hugging Face) থেকে সরাসরি ডাউনলোড করতে পারবেন। এছাড়াও ক্লাউড ব্যবহারের জন্য এটি ভার্টেক্স এআই-তেও (Vertex AI) উপলব্ধ করা হয়েছে। বড় বিষয়, গুগল এতে একটি সহজ লাইসেন্স প্রদান করেছে, যার ফলে বাণিজ্যিক এবং শিক্ষামূলক – উভয় ক্ষেত্রেই এটি বিনা বাধায় ব্যবহার করা যাবে। গুগলের এই পদক্ষেপ কেবল অনুবাদ পরিষেবাকেই সহজ করবে না, বরং বিশ্বের ভাষাগত দূরত্ব কমিয়ে আনতে এক বৈপ্লবিক ভূমিকা পালন করবে।
Royal Enfield Bullet 650 অবশেষে ভারতের বাজারে আনুষ্ঠানিকভাবে লঞ্চ হল। মোটরসাইকেলপ্রেমীদের দীর্ঘদিনের অপেক্ষার অবসান ঘটিয়ে…
New-gen Tata Tiago: ভারতের গাড়ি বাজারে মধ্যবিত্তের অন্যতম পছন্দের এবং অন্যতম সেরা বিক্রিত হ্যাচব্যাক টাটা…
তীব্র গরম আর অস্বস্তিকর আবহাওয়ার (West Bengal Weather Update) পর অবশেষে দক্ষিণবঙ্গের বাসিন্দাদের জন্য স্বস্তির…
গ্রহমণ্ডলীর অবস্থান পরিবর্তন (Rashifal Bangla) এবং মহাজাগতিক শক্তির প্রবাহ আমাদের দৈনন্দিন জীবনে প্রতিনিয়ত নতুন তরঙ্গ…
পশ্চিমবঙ্গের মহিলাদের সামাজিক ও আর্থিক সুরক্ষার লক্ষ্যে বড় পদক্ষেপ গ্রহণ করল রাজ্য সরকার। নবান্ন থেকে…
মহাবিশ্বের অন্তহীন দূর নীলিমায় গ্রহ-নক্ষত্রের (Bangla Rashifal) নিরন্তর আবর্তন আমাদের দৈনন্দিন জীবনের সুখ-দুঃখ, সাফল্য ও…