হুয়াওয়ে টেকনোলজিস-সহ একটি গবেষণা দল জানিয়েছে, তারা সফলভাবে প্রতিষ্ঠানটির অ্যাসেন্ড ৯১০সি (Ascend 910C) চিপ ব্যবহার করে ডিপসিক-ভি৪-প্রো (DeepSeek-V4-Pro) মডেলের পোস্ট-ট্রেনিং সম্পন্ন করেছে। মার্কিন নিষেধাজ্ঞা কঠোর হওয়ার প্রেক্ষাপটে চীনের সেমিকন্ডাক্টর শিল্প যখন সাধারণ এআই ইনফারেন্স সমর্থন থেকে আরও জটিল মডেল প্রশিক্ষণের দিকে এগিয়ে যাওয়ার চেষ্টা করছে, তখন এই সাফল্য একটি বড় পদক্ষেপ হিসেবে চিহ্নিত হয়েছে।
যদিও চীনা চিপ নির্মাতারা এআই ইনফারেন্স সমর্থনে সাফল্য পেয়েছে—যা হলো ব্যবহারকারীর নির্দেশের উত্তর দেওয়ার জন্য আগে থেকে তৈরি একটি মডেল চালানোর তুলনামূলকভাবে সহজ প্রক্রিয়া—তারা প্রশিক্ষণের ক্ষেত্রে হিমশিম খেয়েছে, যা একটি মডেলের মস্তিষ্ক তৈরি বা পরিমার্জন করার অনেক বেশি জটিল প্রক্রিয়া।
প্রাথমিক “প্রি-ট্রেনিং” যদি একটি মডেলকে বিপুল পরিমাণ ডেটা শোষণ করে কথা বলতে শেখায়, তবে পোস্ট-ট্রেনিং তাকে মানুষের নির্দেশ, সুরক্ষা বিধি এবং নির্দিষ্ট কাজ অনুসরণ করে কীভাবে কাজ করতে হয় তা শেখায়।
শুক্রবার শেনজেন সরকারের একটি সোশ্যাল মিডিয়া পোস্ট অনুসারে, এটি অর্জন করতে গবেষকরা ডিপসিক-এর এখন পর্যন্ত সবচেয়ে বড় মডেলটি—যার প্যারামিটার সংখ্যা ১.৬ ট্রিলিয়ন—অন্তত ১,০০০ হুয়াওয়ে চিপ দ্বারা চালিত একটি কম্পিউটিং ক্লাস্টারে চালিয়েছেন।
পোস্টটিতে বলা হয়েছে, দলটি সফলভাবে “পূর্ণ-প্যারামিটার” পোস্ট-ট্রেনিং সম্পন্ন করেছে, যার অর্থ হলো মডেলটির সম্পূর্ণ আর্কিটেকচার কোনো রকম ছাড় না দিয়েই আপডেট ও পরিমার্জন করা হয়েছে।
পোস্টটিতে ব্যাখ্যা করা হয়েছে, আগে দেশীয় কম্পিউটিং শক্তি প্রধানত ইনফারেন্সের জন্য ব্যবহৃত হতো, “যা অনেকটা মডেলের জন্য একটি একমুখী রাস্তা তৈরির মতো ছিল: একটি প্রশ্ন ইনপুট করলে, একটি উত্তর আউটপুট হবে”। তবে, এই প্রকল্পটি একটি মডেলকে আত্ম-প্রতিফলন এবং সমন্বয় করার সুযোগ করে দিয়েছে।
এতে আরও বলা হয়েছে, “এটি সেই একমুখী রাস্তায় জটিল ফ্লাইওভার এবং লুপ যুক্ত করেছে, যা তাৎক্ষণিকভাবে কম্পিউটেশনাল এবং কমিউনিকেশনের চাহিদা কয়েকগুণ বাড়িয়ে দিয়েছে”।
পোস্টটিতে বলা হয়েছে, হুয়াওয়ে, শেনজেন লুপ এরিয়া ইনস্টিটিউট, হারবিন ইনস্টিটিউট অফ টেকনোলজির শেনজেন ক্যাম্পাস এবং শেনজেন রিসার্চ ইনস্টিটিউট অফ বিগ ডেটার যৌথ উদ্যোগে পরিচালিত এই গবেষণাটি “চীনের এআই শিল্প শৃঙ্খলের আত্মনির্ভরশীলতা বাড়াতে সাহায্য করবে”।
যেহেতু একেবারে গোড়া থেকে সম্পূর্ণ প্রি-ট্রেনিংয়ের জন্য বিশাল পরিকাঠামো এবং কয়েক মাসের কম্পিউটিং সময়ের প্রয়োজন হয়, তাই অনেক এআই দল এর পরিবর্তে ওপেন-সোর্স মডেল নিয়ে সেগুলোকে পোস্ট-ট্রেনিংয়ের মাধ্যমে কাস্টমাইজ করার পথ বেছে নেয়।
তবে, ঐতিহাসিকভাবে আরও জটিল প্রশিক্ষণ প্রক্রিয়াগুলো প্রায় সম্পূর্ণরূপে এনভিডিয়া এবং অ্যাডভান্সড মাইক্রো ডিভাইসেসের মতো মার্কিন চিপ জায়ান্টদের সীমাবদ্ধ হার্ডওয়্যারের উপর নির্ভরশীল ছিল, যদিও এনভিডিয়ার H200 চিপগুলো ওয়াশিংটন থেকে রপ্তানির জন্য ছাড়পত্র পেলেও চীনে বিক্রির জন্য এখনও অনুমোদন পায়নি।
এপ্রিলে যখন ওপেন-সোর্স DeepSeek-V4 চালু করা হয়, তখন হুয়াওয়ে, মুর থ্রেডস এবং ক্যামব্রিকন টেকনোলজিসের মতো স্থানীয় চিপ সংস্থাগুলো ইনফারেন্সের জন্য “ডে-জিরো” সামঞ্জস্যতা ঘোষণা করতে দ্রুত পদক্ষেপ নেয়।
তবে, V4-কে একেবারে গোড়া থেকে প্রশিক্ষণ দিতে ব্যবহৃত হার্ডওয়্যার স্ট্যাক সম্পর্কে DeepSeek নীরব থেকেছে। এর পূর্বসূরি, DeepSeek-V3, ২,০৪৮টি এনভিডিয়া H800 প্রসেসরের একটি ক্লাস্টারে প্রশিক্ষিত হয়েছিল – যে চিপগুলো এখন মার্কিন রপ্তানি নিয়ন্ত্রণের অধীনে সীমাবদ্ধ।
দলটির মতে, হুয়াওয়ে হার্ডওয়্যারে সর্বশেষ পরীক্ষাটি স্থিতিশীল এবং কার্যকর উভয়ই প্রমাণিত হয়েছে। মে মাসে শেনজেন লুপ এরিয়া ইনস্টিটিউটের এক ঘোষণা অনুযায়ী, মডেলটি কোনো বাধা বা ত্রুটি ছাড়াই ১,৫০০-এর বেশি প্রশিক্ষণ পর্ব সম্পন্ন করেছে এবং এই প্রক্রিয়াটি মডেলটির গাণিতিক সক্ষমতাও উন্নত করেছে।
যদিও আমেরিকান সেমিকন্ডাক্টর জায়ান্টদের উন্নত চিপ ব্যবহারের উপর মার্কিন নিষেধাজ্ঞা চীনা এআই মডেলের উন্নয়নকে মন্থর করে দিয়েছে, তবে এটি দেশীয় প্রতিদ্বন্দ্বীদের এই শূন্যস্থান পূরণের চেষ্টা করতে বাধ্য করেছে। কিছু চীনা সংস্থা মডেল প্রশিক্ষণের জন্য দেশীয় চিপ ব্যবহার নিয়ে পরীক্ষা-নিরীক্ষা করছে।
গত মাসে, বাইদুর এক্সিকিউটিভ ভাইস-প্রেসিডেন্ট শেন দৌ বলেন, তাদের কুনলুনশিন চিপ ইউনিট দ্বারা চালিত একটি ক্লাস্টারে সংস্থাটির আর্নি ৫.১ মডেলের একটি প্রধান সংস্করণের প্রশিক্ষণ সফলভাবে সম্পন্ন হয়েছে। কিন্তু তাদের চিপগুলো কোন প্রশিক্ষণ প্রক্রিয়ায় ব্যবহৃত হয়েছিল, তা তিনি নির্দিষ্ট করে বলেননি।
এপ্রিলে, চীনা অন-ডিমান্ড পরিষেবা প্রদানকারী সংস্থা মেইতুয়ান ব্যবহারকারীদের একটি নতুন ট্রিলিয়ন-প্যারামিটার এআই মডেল পরীক্ষা করার জন্য আমন্ত্রণ জানায়, যা স্থানীয় প্রতিবেদন অনুসারে সম্পূর্ণরূপে দেশীয়ভাবে উৎপাদিত চিপে প্রশিক্ষিত হয়েছিল।
এদিকে, হুয়াওয়ে এআই-এর এজেন্টিক সক্ষমতা নিয়ে এগিয়ে গেছে, যা চ্যাটবটের প্রশ্নের উত্তর দেওয়া ছাড়াও অন্যান্য কাজ করতে পারে। শুক্রবার, কোম্পানিটির ক্লাউড ইউনিট একটি নতুন “এজেন্টিক ইনফ্রা” প্যারাডাইম উন্মোচন করেছে, যার মধ্যে ইনফারেন্স এবং ট্রেনিংয়ের জন্য কম্পিউট পাওয়ার বরাদ্দ করার একটি প্ল্যাটফর্মের মতো নতুন অবকাঠামো অন্তর্ভুক্ত রয়েছে, যা রিসোর্স ব্যবহার ৩০ শতাংশের বেশি বাড়াতে পারে।


























































