ফেব্রুয়ারী ১৫ – “ওয়ার অ্যান্ড পিস” পড়া লিও টলস্টয়ের স্মারক উপন্যাস যা অর্ধ মিলিয়ন শব্দ দীর্ঘ এবং ১,০০০ পৃষ্ঠার বেশি, গুগলের একটি নতুন কৃত্রিম বুদ্ধিমত্তা মডেলের জন্য একটি মিনিট-দীর্ঘ ব্যাপার হতে পারে।
অ্যালফাবেটের মালিকানাধীন কোম্পানি বৃহস্পতিবার জেমিনি ১.৫ প্রদর্শন করেছে, এটি দুই মাস আগে ঘোষণা করা AI মডেলগুলির একটি আপগ্রেড। একটি একক প্রম্পটে, একজন ব্যবহারকারী Google এর AI-কে আগের চেয়ে অনেক বেশি সামগ্রী বিশ্লেষণ করতে বলতে পারেন — ৩০,০০০ লাইন কোড, ১১ ঘন্টা অডিও, পুরো এক ঘন্টা ভিডিও, Google বলেছে।
এটি প্রো, পরিবারের মাঝারি আকারের মডেলের জন্য। কংক্রিট পরিভাষায়, প্রো টোকেন হিসাবে পরিচিত ১ মিলিয়ন টুকরো ডেটা প্রক্রিয়া করতে পারে — যে পরিমাণ অ্যানথ্রোপিক, সম্ভবত এই বিষয়ে ক্লোসেট প্রতিযোগী, তার ক্লাউড ২.১ প্রযুক্তির একটি প্রশ্নে পরিচালনা করে তার পাঁচগুণ।
ChatGPT-এর স্রষ্টা ওপেনএআই এবং অন্যদের দ্বারা প্রকাশিত ক্রমবর্ধমান উদাসীন AI, এখনও পর্যন্ত সবচেয়ে সক্ষম – এবং বাজারযোগ্য – প্রযুক্তি তৈরি করতে সিলিকন ভ্যালিতে চলমান দ্রুত অস্ত্র প্রতিযোগিতাকে প্রতিফলিত করে৷
রয়টার্সের সাথে একটি সাক্ষাত্কারে, অ্যালফাবেটের সিইও সুন্দর পিচাই এই অগ্রগতিকে একাধিক “ব্রেকথ্রু” হিসাবে ঘোষণা করেছিলেন যা তার কোম্পানির অগণিত ব্যবসায়কে ইন্ধন জোগাবে৷ মূলে, তিনি বলেন, অনুসন্ধান-শিল্পের মূল ভিত্তি অনুসন্ধানের একটি নতুন পদ্ধতিকে সম্ভব করে তুলেছে।
“আপনি নাটকীয়ভাবে মানুষকে বিশ্ব সম্পর্কে প্রশ্ন জিজ্ঞাসা করার জন্য একটি বিস্তৃত দৃষ্টিভঙ্গি দিচ্ছেন।”
একটি উদাহরণ যা গুগল অভ্যন্তরীণভাবে আলোচনা করেছে তা হল কীভাবে একজন চলচ্চিত্র নির্মাতা এআইকে একজন সমালোচকের মতো রুক্ষ-কাট চলচ্চিত্রের বিচার করতে বলতে পারে, পিচাই বলেছিলেন। “এটি শুধুমাত্র একটি ব্যবহারের ক্ষেত্রে আমরা একটি দল হিসাবে কথা বলছি, কিন্তু আকাশ এখানে সীমাহীন,” তিনি বলেন.
ক্যাপশনিং চলছে…
আরেকটি: একযোগে বেশ কয়েকটি কোম্পানির আর্থিক প্রতিবেদন জিজ্ঞাসা করা, পিচাই বলেছেন। প্রেস ডেমোগুলি দেখিয়েছিল কীভাবে এআই প্রায় ৫৯ সেকেন্ডে একটি ৪৪-মিনিটের ভিডিও থেকে তথ্য বের করতে পারে, সেইসাথে মাল্টিমোডাল প্রম্পট, যেখানে একজন ব্যবহারকারী এআইকে পাঠ্য এবং চিত্রের সংমিশ্রণে প্রতিক্রিয়া জানাতে বলেছিলেন।
গুগল সার্চ এবং ইউটিউবে হালনাগাদ প্রযুক্তি প্রদানের বাইরে, অ্যালফাবেট তার ক্লাউড ইউনিটে গ্রাহকদের আকৃষ্ট করতে জেমিনি ১.৫ এর দিকে তাকিয়ে আছে। বৃহত্তর প্রতিদ্বন্দ্বী এবং OpenAI এর সমর্থক মাইক্রোসফ্টের সাথে প্রতিযোগিতায় আবদ্ধ, Alphabet সম্প্রতি বিভাগের জন্য বিক্রয় বৃদ্ধিতে একটি প্রত্যাবর্তন দেখেছে।
বৃহস্পতিবার থেকে, গুগল বলেছে এটি তার মিলিয়ন-টোকেন এআই সীমিত সংখ্যক ব্যবসায়িক গ্রাহকদের জন্য খুলবে, যখন যেকোন বিকাশকারী সংস্করণ ১.০ দিয়ে তৈরি করতে পারে এবং একবার উপলব্ধ হলে সর্বশেষ প্রজন্মে অদলবদল করতে পারে।
যখন এই ধরনের শক্তিশালী AI মডেলগুলি, সাধারণত খরচ-নিবিড়, Alphabet-এর জন্য লাভজনক হবে জানতে চাইলে, পিচাই বলেন: “এগুলি আমাদের জন্য লাভজনক জিনিস। এছাড়াও, সময়ের সাথে সাথে, আমরা এই মডেলগুলি চালানোর ক্ষেত্রে খুব, খুব দক্ষ হব।”
মিথুন ১.৫-এর জন্য Google হাইলাইট করা আরেকটি উন্নতি ছিল দক্ষতা। গুগল বলেছে এটি AI এর পূর্বের গবেষণা এবং একটি প্রতিযোগীর সাম্প্রতিক ঘোষণার সাথে সামঞ্জস্য রেখে “বিশেষজ্ঞদের মিশ্রণ” হিসাবে পরিচিত তথ্য সংগ্রহের জন্য একটি কম কঠিন উপায় প্রয়োগ করেছে।
একজন কোম্পানির আধিকারিক পরিচিত প্রত্যেক ব্যক্তিকে ডায়াল করার পরিবর্তে একটি প্রশ্নের উত্তর দেওয়ার জন্য একজন সাভেন্টকে কল করার পদ্ধতির তুলনা করেছেন।