Hangzhou-ভিত্তিক স্টার্টআপ DeepSeek দ্বারা তৈরি একটি নতুন চাইনিজ AI মডেল, OpenAI-এর কিছু নেতৃস্থানীয় মডেলকে ছাড়িয়ে গেছে, iOS অ্যাপ স্টোরের শীর্ষে ChatGPT-কে স্থানচ্যুত করে এবং Meta-কে এর নেতৃস্থানীয় শোধক হিসাবে দখল করে আমেরিকান AI শিল্পকে হতবাক করেছে। ওপেন সোর্স এআই টুলস বলা হয়। এগুলির সমস্তই একটি সমালোচনামূলক প্রশ্ন উত্থাপন করেছে: বেইজিংয়ের উন্নত সেমিকন্ডাক্টর অ্যাক্সেস করার ক্ষমতার উপর আমেরিকান নিষেধাজ্ঞা থাকা সত্ত্বেও, চীন কি বিশ্বব্যাপী এআই রেসে মার্কিন যুক্তরাষ্ট্রের সাথে এগিয়ে যাচ্ছে?
প্রশিক্ষণের জন্য মাত্র $6 মিলিয়নের অনুমিত খরচে, ডিপসিকের নতুন R1 মডেল, যা গত সপ্তাহে প্রকাশিত হয়েছে, ওপেনএআই-এর o1 মডেলের বিভিন্ন গণিত এবং যুক্তির মেট্রিক্সে পারফরম্যান্সের সাথে মিল রাখতে সক্ষম হয়েছে – ওপেনএআই এবং এর পৃষ্ঠপোষক মাইক্রোসফট এর দ্বারা কয়েক বিলিয়ন ডলার বিনিয়োগের ফলাফলের থেকে উন্নত।
চীনা মডেল ব্যবহারকারীদের জন্য সস্তা. এর সবচেয়ে শক্তিশালী সংস্করণগুলিতে অ্যাক্সেসের দাম OpenAI এবং এর প্রতিযোগীদের থেকে প্রায় 95% কম। ফলাফল: মার্কিন প্রযুক্তি শিল্প হঠাৎ করে একটি সম্ভাব্য সস্তা এবং আরও শক্তিশালী চ্যালেঞ্জের মুখোমুখি হয়েছে, বিনিয়োগকারীদের উদ্বিগ্ন, যারা সোমবার সকালে আমেরিকান প্রযুক্তির স্টক বিক্রি করে দিয়েছে।
তবুও সবাই আশ্বস্ত হয় না। কিছু আমেরিকান এআই গবেষক ডিপসিকের দাবি নিয়ে সন্দেহ প্রকাশ করেছেন যে এটি কতটা ব্যয় করেছে এবং এর মডেল তৈরি করতে কতগুলি উন্নত চিপ স্থাপন করেছে।
তবে খুব কমই ডিপসিকের অত্যাশ্চর্য ক্ষমতা নিয়ে বিতর্ক করে। “Deepseek R1 হল AI এর স্পুটনিক মুহূর্ত,” X-এ বিশিষ্ট আমেরিকান উদ্যোগ পুঁজিবাদী মার্ক অ্যান্ড্রিসেন লিখেছেন, স্নায়ুযুদ্ধের সেই মুহূর্তটিকে উল্লেখ করে যখন সোভিয়েত ইউনিয়ন মার্কিন যুক্তরাষ্ট্রের আগে কক্ষপথে একটি উপগ্রহ স্থাপন করতে সক্ষম হয়েছিল।
সুতরাং, ডিপসিক কী এবং মার্কিন প্রযুক্তির আধিপত্যের জন্য এর অর্থ কী হতে পারে?
DeepSeek কি?
কৃত্রিম জেনারেল ইন্টেলিজেন্স, বা AGI অনুসরণ করার জন্য নিবেদিত একটি গবেষণা ল্যাব হিসাবে চীনা হেজ ফান্ড হাই ফ্লায়ার দ্বারা DeepSeek দুই বছরেরও কম সময় আগে প্রতিষ্ঠিত হয়েছিল। 2024 সালের শেষের দিকে ওপেন সোর্স রিলিজের একটি স্পেট স্টার্টআপটিকে মানচিত্রে তুলে ধরে, যার মধ্যে বড় ভাষা মডেল “v3” রয়েছে, যা মেটা-এর সমস্ত ওপেন-সোর্স LLM-কে ছাড়িয়ে গেছে এবং OpenAI-এর ক্লোজড-সোর্স GPT4-o-কে টক্কর দিয়েছে।
সেই সময়ে, লিয়াং ওয়েনফেং, সিইও, কথিতভাবে বলেছিলেন তিনি “বিশ্বের সবচেয়ে কঠিন প্রশ্নগুলি সমাধান করার জন্য” পিচ সহ তরুণ কম্পিউটার বিজ্ঞান গবেষকদের নিয়োগ করেছিলেন—সমালোচনামূলকভাবে, লাভের লক্ষ্য ছাড়াই৷ প্রাথমিক লক্ষণগুলি আশাব্যঞ্জক ছিল: তার পণ্যগুলি এতটাই ছিল দক্ষ যে DeepSeek এর 2024 প্রকাশগুলি চীনা AI শিল্পের মধ্যে একটি মূল্য যুদ্ধের জন্ম দিয়েছে, প্রতিযোগীদের দাম কমাতে বাধ্য করেছে।
এই বছর, সেই মূল্য যুদ্ধ প্রশান্ত মহাসাগর জুড়ে পৌঁছানোর জন্য প্রস্তুত বলে মনে হচ্ছে।
তবুও DeepSeek এর AI একটি গুরুত্বপূর্ণ উপায়ে তার মার্কিন প্রতিযোগীদের থেকে আলাদা দেখাচ্ছে। যুক্তি পরীক্ষায় তাদের উচ্চ পারফরম্যান্স সত্ত্বেও, ডিপসিকের মডেলগুলি ক্ষমতাসীন চীনা কমিউনিস্ট পার্টি (সিসিপি) এর সমালোচনা সম্পর্কিত চীনের সীমাবদ্ধ নীতি দ্বারা সীমাবদ্ধ। ডিপসিক R1 1989 সালে বেইজিংয়ের তিয়ানানমেন স্কোয়ারে গণহত্যা সম্পর্কে প্রশ্নের উত্তর দিতে অস্বীকার করে। উদাহরণস্বরূপ; “দুঃখিত, এটা আমার বর্তমান সুযোগের বাইরে। আসুন অন্য কিছু সম্পর্কে কথা বলি,” টাইম দ্বারা জিজ্ঞাসা করা হলে মডেলটি বলেছিলেন।
ডিপসিকের সাফল্য আমেরিকান প্রযুক্তি জায়ান্টদের জন্য কী বোঝাতে পারে
এমন এক মুহুর্তে যখন গুগল, মেটা, মাইক্রোসফ্ট, অ্যামাজন এবং তাদের কয়েক ডজন প্রতিযোগী নতুন এআই অবকাঠামোতে আরও কয়েক বিলিয়ন ডলার ব্যয় করার প্রস্তুতি নিচ্ছে, ডিপসিকের সাফল্য একটি উদ্বেগজনক প্রশ্ন উত্থাপন করেছে: চীনা প্রযুক্তি সংস্থাগুলি কি সম্ভাব্যভাবে মিলতে পারে, বা এমনকি ছাড়িয়ে যেতে পারে, তাদের প্রযুক্তিগত দক্ষতা উল্লেখযোগ্যভাবে কম খরচ করার সময়?
মেটা, যেটি এই বছর AI পরিকাঠামোতে $65 বিলিয়ন ব্যয় করার পরিকল্পনা করেছে, ইতিমধ্যেই ডিপসিকের মডেলগুলি বিশ্লেষণ করার জন্য চারটি “যুদ্ধ কক্ষ” স্থাপন করেছে, এটি খুঁজে বের করার জন্য যে চীনা সংস্থাটি কীভাবে একটি মডেলকে এত সস্তায় প্রশিক্ষণ দিতে পেরেছিল এবং উন্নতির জন্য অন্তর্দৃষ্টিগুলি ব্যবহার করেছিল। নিজস্ব ওপেন সোর্স লামা মডেল, টেক নিউজ সাইট দ্য ইনফরমেশন সপ্তাহান্তে রিপোর্ট করেছে।
আর্থিক বাজারে, এনভিডিয়ার স্টক মূল্য সোমবার সকালে 15% এরও বেশি কমে গেছে এই আশঙ্কায় যে আগের চিন্তার চেয়ে শক্তিশালী AI প্রশিক্ষণের জন্য কম AI চিপ প্রয়োজন হতে পারে। অন্যান্য আমেরিকান টেক স্টকগুলিও কম ছিল।
“যদিও [DeepSeek R1] ব্যবহারকারী এবং বিশ্ব অর্থনীতির জন্য ভাল খবর, এটি মার্কিন প্রযুক্তির স্টকগুলির জন্য খারাপ খবর,” বলেছেন পিকটেট অ্যাসেট ম্যানেজমেন্টের প্রধান কৌশলবিদ লুকা পাওলিনি৷ “এটি AI-তে মূলধন বিনিয়োগের নামমাত্র হ্রাস এবং মার্জিনের উপর চাপ সৃষ্টি করতে পারে, যখন মূল্যায়ন এবং বৃদ্ধির প্রত্যাশা খুব প্রসারিত হয়।”
কিন্তু আমেরিকান প্রযুক্তি হারিয়ে যায়নি-অন্তত এখনও নয়।
আপাতত, OpenAI এর “o1 Pro” মডেলটিকে এখনও বিশ্বের সবচেয়ে উন্নত বলে মনে করা হয়। DeepSeek R1-এর পারফরম্যান্স অবশ্য পরামর্শ দেয় চীন পূর্বের ধারণার চেয়ে AI-এর সীমান্তের অনেক কাছাকাছি, এবং ওপেন-সোর্স মডেলগুলি তাদের ক্লোজড-সোর্স প্রতিপক্ষের কাছে ধরা পড়েছে।
ওপেনএআই এবং গুগলের মতো কোম্পানিগুলির জন্য সম্ভবত আরও উদ্বেগজনক, যাদের মডেলগুলি বন্ধ উত্স, তা হল ডিপসিক তার সবচেয়ে উন্নত মডেলগুলি অ্যাক্সেস করার জন্য ভোক্তাদের কাছ থেকে কতটা-বা বরং কতটা কম চার্জ করছে। OpenAI এর সবচেয়ে উন্নত মডেল, o1 দ্বারা আউটপুট করা প্রতি মিলিয়ন “টোকেন” বা শব্দের অংশগুলির জন্য $60 চার্জ করে। এর বিপরীতে DeepSeek R1 থেকে একই সংখ্যক টোকেনের জন্য $2.19 চার্জ করে—প্রায় 30 গুণ কম।
“এটি শিল্প ভিত্তিকে ক্ষয় করে, এটি মার্জিনকে ক্ষয় করে, এটি ব্যক্তিগত উত্স থেকে পশ্চিমা [এআই] স্কেলিংয়ে আরও পুঁজি বিনিয়োগের প্রণোদনাকে হ্রাস করে,” বলেছেন এডুয়ার্ড হ্যারিস, গ্ল্যাডস্টোন এআই, একটি এআই ফার্মের প্রধান প্রযুক্তি কর্মকর্তা যা মার্কিন সরকারের সাথে ঘনিষ্ঠভাবে কাজ করে।
… কিন্তু ডিপসিক কি স্বচ্ছ হচ্ছে?
ডিপসিকের সাফল্য আরও বিস্ফোরক ছিল কারণ এটি বেইজিং-এ শক্তিশালী চিপস, বা জিপিইউ রপ্তানি সীমাবদ্ধ করে চীনের এআই ইকোসিস্টেমকে সীমাবদ্ধ করার জন্য মার্কিন সরকারের কৌশলের কার্যকারিতাকে প্রশ্নবিদ্ধ করেছে বলে মনে হচ্ছে। ডিপসিকের দাবি সঠিক হলে, এর অর্থ হল চীনের সেই বিধিনিষেধ সত্ত্বেও শক্তিশালী এআই মডেল তৈরি করার ক্ষমতা রয়েছে, যা মার্কিন কৌশলের সীমাবদ্ধতাকে আন্ডারলাইন করে।
ডিপসিক দাবি করেছে এটি চিপগুলিতে অ্যাক্সেসের দ্বারা সীমাবদ্ধ, নগদ বা প্রতিভা নয়, বলেছে যে এটি মাত্র 2,000 দ্বিতীয়-স্তরের এনভিডিয়া চিপ ব্যবহার করে তার মডেল v3 এবং R1 প্রশিক্ষণ দিয়েছে। 2024 সালে ডিপসিকের সিইও লিয়াং ওয়েনফেং বলেন, “অর্থ আমাদের জন্য কখনোই সমস্যা ছিল না।” (বর্তমান মার্কিন নীতি চীনে রপ্তানি করাকে বেআইনি করে দেয় সবচেয়ে উন্নত ধরনের এআই চিপ, যেগুলির মত ওপেনএআই এবং মাইক্রোসফ্ট দ্বারা ব্যবহৃত ইউএস ডেটাসেন্টারগুলি জনবহুল।)
কিন্তু সেসব দাবি কি সত্য? “আমার বোধগম্য হল DeepSeek এর 50,000 H100s আছে,” স্কেল এআই সিইও আলেকজান্ডার ওয়াং সম্প্রতি দাভোসে সিএনবিসিকে বলেছেন, বর্তমানে বাজারে থাকা সর্বোচ্চ ক্ষমতাসম্পন্ন এনভিডিয়া জিপিইউ চিপগুলির উল্লেখ করে৷ “তারা [তাদের] সম্পর্কে কথা বলতে পারে না, কারণ এটি মার্কিন যুক্তরাষ্ট্র যে রপ্তানি নিয়ন্ত্রণ করেছে তার বিরুদ্ধে।” (এই আকারের একটি H100 ক্লাস্টার বিলিয়ন ডলারের অঞ্চলে খরচ হবে।)
সিসিপি প্রযুক্তিকে কতটা গুরুত্ব সহকারে নিচ্ছে তার লক্ষণে, ডিপসিকের সিইও লিয়াং গত সোমবার বেইজিংয়ে চীনের প্রধানমন্ত্রী লি কিয়াং-এর সাথে দেখা করেছেন। সেই বৈঠকে, লিয়াং লিকে বলেছিলেন যে ডিপসিকের আরও চিপস দরকার। গ্ল্যাডস্টোন এআই-এর সিইও জেরেমি হ্যারিস বলেছেন, “ডিপসিকের মাত্র কয়েক হাজার জিপিইউ-তে অ্যাক্সেস রয়েছে এবং তবুও তারা এটি বন্ধ করে দিচ্ছে।” “সুতরাং এটি সুস্পষ্ট প্রশ্ন উত্থাপন করে: যখন তারা চীনা কমিউনিস্ট পার্টি থেকে পুরো গতিতে এগিয়ে যাওয়ার জন্য বরাদ্দ পায় তখন কী হবে?”
যদিও চীন হয়তো কম চিপ দিয়ে AI ক্ষমতার একটি চমকপ্রদ স্তর অর্জন করেছে, বিশেষজ্ঞরা বলছেন আরও কম্পিউটিং শক্তি সবসময় একটি কৌশলগত সুবিধা থাকবে। সেই ফ্রন্টে, মার্কিন যুক্তরাষ্ট্র অনেক এগিয়ে রয়েছে। জর্জ মেসন ইউনিভার্সিটির একজন রিসার্চ ফেলো ডিন বল বলেন, “এটা বেশি থাকাটা খারাপ কিছু নয়।” “আপনার কাছে এটি যতই থাকুক না কেন, আপনি সর্বদা এটি ব্যবহার করবেন।”
এটি চীনের সাথে আমেরিকার প্রযুক্তিগত প্রতিদ্বন্দ্বিতাকে কোথায় রেখে যায়?
সংক্ষিপ্ত উত্তর: ওয়াশিংটনের দৃষ্টিকোণ থেকে, অনিশ্চিত জলে।
বাইডেন প্রশাসনের শেষ দিনগুলিতে, বিদায়ী জাতীয় নিরাপত্তা উপদেষ্টা জ্যাক সুলিভান সতর্ক করেছিলেন যে এআই অগ্রগতির গতি “এই মুহূর্তে বিশ্বের সবচেয়ে পরিণতিমূলক জিনিস”। এবং তার নতুন চাকরির মাত্র কয়েকদিন আগে, প্রেসিডেন্ট ট্রাম্প “কৃত্রিম সাধারণ বুদ্ধিমত্তা” তৈরির জন্য অত্যাবশ্যক পরিকাঠামো নির্মাণের জন্য OpenAI এবং অন্যদের দ্বারা সমর্থিত একটি নতুন $500 বিলিয়ন উদ্যোগের ঘোষণা করেছেন – AI-তে পরবর্তী লাফ, সিস্টেমগুলি যথেষ্ট উন্নত। নতুন বৈজ্ঞানিক অগ্রগতি তৈরি করুন এবং এমন উপায়ে যুক্তি দেখান যা এখনও পর্যন্ত কল্পবিজ্ঞানের জগতে রয়ে গেছে।
এবং যদিও চীনের উপর মার্কিন চিপ বিধিনিষেধের ভবিষ্যত নিয়ে প্রশ্ন রয়ে গেছে, ওয়াশিংটনের অগ্রাধিকারগুলি রাষ্ট্রপতি ট্রাম্পের এআই নির্বাহী আদেশে স্পষ্ট ছিল, যা তার অফিসে প্রথম সপ্তাহে স্বাক্ষরিত হয়েছিল, যা ঘোষণা করেছিল যে “এটি মার্কিন যুক্তরাষ্ট্রের নীতি বজায় রাখা এবং উন্নত করা। মানুষের উন্নতি, অর্থনৈতিক প্রতিযোগিতা এবং জাতীয় নিরাপত্তার জন্য আমেরিকার বিশ্বব্যাপী এআই প্রাধান্য।”
এই আধিপত্য বজায় রাখার অর্থ হবে, অন্তত আংশিকভাবে, চীনা প্রযুক্তি সংস্থাগুলি ঠিক কী করছে তা বোঝা – সেইসাথে মার্কিন মেধা সম্পত্তি রক্ষা করা, বিশেষজ্ঞরা বলছেন।
গ্ল্যাডস্টোন এআই-এর এডুয়ার্ড হ্যারিস বলেছেন, “ডিপসিক এবং অন্যান্য অনেক বড় চীনা কোম্পানিকে [চীনা] সরকার সমর্থন করছে এমন একটি ভাল সুযোগ রয়েছে, যা শুধুমাত্র আর্থিক উপায়ে নয়,” বলেছেন, যিনি ইউএস এআই কোম্পানিগুলিকে তাদের কঠোর করার সুপারিশ করেছিলেন নিরাপত্তা ব্যবস্থা।
এআই এখান থেকে কোথায় যায়?
ডিসেম্বর থেকে, ওপেনএআই-এর নতুন o1 এবং o3 মডেলগুলি এআই মডেলগুলির পক্ষে পাস করা কঠিন হওয়ার জন্য ডিজাইন করা উন্নত যুক্তি পরীক্ষার রেকর্ড ভেঙে দিয়েছে।
DeepSeek R1 অনুরূপ কিছু করে, এবং এই প্রক্রিয়ায় উদাহরণ দেয় যে অনেক গবেষকরা যা বলেছেন তা হল একটি দৃষ্টান্ত পরিবর্তন: মডেলটি প্রশিক্ষণের জন্য ব্যবহৃত কম্পিউটিং শক্তির পরিমাণ স্কেল করার পরিবর্তে, গবেষকরা সময়ের পরিমাণ (এবং এইভাবে, কম্পিউটিং শক্তি এবং বিদ্যুৎ) স্কেল করেন। মডেল উত্তর দেওয়ার আগে একটি প্রশ্নের উত্তর সম্পর্কে চিন্তা করতে ব্যবহার করে। গবেষকরা যাকে “টেস্ট-টাইম কম্পিউট” বলে থাকেন তার এই স্কেলিং যা ডিপসিক R1 এবং OpenAI’s o1-এর মতো “রিজনিং মডেল” এর নতুন ক্লাসকে তাদের কম পরিশীলিত পূর্বসূরীদের থেকে আলাদা করে। অনেক এআই গবেষকরা বিশ্বাস করেন যে এই দৃষ্টান্তটি তার সীমা অতিক্রম করার আগে প্রচুর হেডরুম বাকি আছে।
কিছু AI গবেষক DeepSeek-এর R1-কে DeepMind-এর AlphaZero-এর মতো একই স্তরে একটি অগ্রগতি হিসাবে স্বাগত জানিয়েছেন, একটি 2017 মডেল যেটি বোর্ড গেম চেস অ্যান্ড গো-তে অতিমানব হয়ে ওঠে এবং কোনো মানুষের খেলা পর্যবেক্ষণ না করে শুধুমাত্র নিজের বিরুদ্ধে খেলে এবং উন্নতি করে।
কারণ R1 মানব-লেবেলযুক্ত ডেটাতে অন্যান্য নেতৃস্থানীয় LLM-এর মতো একইভাবে “প্রশিক্ষিত” ছিল না।
পরিবর্তে, ডিপসিকের গবেষকরা মডেলটিকে মূলত স্ক্র্যাচ থেকে তার নিজস্ব যুক্তি ক্ষমতা বুটস্ট্র্যাপ করার অনুমতি দেওয়ার একটি উপায় খুঁজে পেয়েছেন।
“কীভাবে একটি সমস্যার সমাধান করতে হয় সে সম্পর্কে মডেলটিকে স্পষ্টভাবে শেখানোর পরিবর্তে, আমরা এটিকে সঠিক প্রণোদনা প্রদান করি এবং এটি স্বায়ত্তশাসিতভাবে উন্নত সমস্যা সমাধানের কৌশলগুলি বিকাশ করে,” তারা দাবি করে।
অনুসন্ধানটি তাৎপর্যপূর্ণ কারণ এটি পরামর্শ দেয় যে শক্তিশালী AI ক্ষমতাগুলি আরও দ্রুত এবং কম মানুষের প্রচেষ্টার সাথে পূর্বে যা ভাবা হয়েছিল তার চেয়ে বেশি কম্পিউটিং শক্তি প্রয়োগের মাধ্যমে আবির্ভূত হতে পারে। “DeepSeek R1 এই স্কেলিং দৃষ্টান্তের GPT-1 এর মতো,” বল বলেছেন৷
শেষ পর্যন্ত, চীনের সাম্প্রতিক AI অগ্রগতি, মার্কিন শক্তি হস্তগত করার পরিবর্তে, প্রকৃতপক্ষে একটি পুনর্বিন্যাসের সূচনা হতে পারে—একটি পদক্ষেপ, অন্য কথায়, ভবিষ্যতের দিকে যেখানে, একটি আধিপত্যবাদী শক্তির পরিবর্তে, AI শক্তির অনেক প্রতিযোগী কেন্দ্র রয়েছে।
“চীনের এখনও তাদের নিজস্ব সুপার ইন্টেলিজেন্স (গুলি) থাকবে মার্কিন যুক্তরাষ্ট্রের চেয়ে এক বছরের বেশি সময় পরে, [উদাহরণস্বরূপ] যুদ্ধ অনুপস্থিত থাকবে,” মাইলস ব্রুনডেজ, একজন প্রাক্তন OpenAI নীতি কর্মী, X-এ লিখেছেন। “তাই যদি না আপনি চান (আক্ষরিক অর্থে) ) যুদ্ধ, মাল্টিপোলার এআই ফলাফল নেভিগেট করার জন্য আপনার একটি দৃষ্টি থাকতে হবে।”