একজন প্রোগ্রামার হিসাবে কি কখনো ভেবেছেন, AI কিভাবে ৯৭% অ্যাকুরেসি নিয়ে গণিতের সমস্যা সমাধান করে? Deepseek R1-এর গবেষণাপত্র বলছে—এটা সম্ভব Pure Reinforcement Learning দিয়ে!
আজকে আমরা এই মডেলের টেকনিক্যাল ডেটা, কম্পিটিটরদের সাথে তুলনা, এবং বাস্তব প্রয়োগের উদাহরণ দেখব টেবিল-চার্ট সহ!
Deepseek r1 হলো DeepSeek-AI তৈরি করা একটি শক্তিশালী AI মডেল, যেটা “রিইনফোর্সমেন্ট লার্নিং” নামের এক বিশেষ পদ্ধতিতে ট্রেনিং পেয়েছে। এটাকে বানানো হয়েছে DeepSeek-V3-Base নামের আরেকটি মডেলের উপর ভিত্তি করে। এই ট্রেনিংয়ের কৌশলটা অনেকটা স্কুলের সেরা ছাত্রকে আরও বুদ্ধিমান বানানোর মতো—একাধিক ধাপে চিন্তা করার ক্ষমতা বাড়ানো হয়েছে!
Category | Benchmark | DeepSeek R1 | Claude-3.5 | GPT-4 | OpenAI o1-mini | OpenAI o1-1217 |
English | MMLU (Pass@1) | 90.8 | 88.3 | 87.2 | 85.2 | 91.8 |
MMLU-Redux (EM) | 92.9 | 88.9 | 88 | 86.7 | – | |
AlpacaEval 2.0 (LC-winrate) | 87.6 | 52 | 51.1 | 57.8 | – | |
Code | CodeLiveCodeBench (Pass@1-COT) | 65.9 | 33.8 | 34.2 | – | 63.4 |
Codeforces (Percentile) | 96.3 | 20.3 | 23.6 | 93.4 | 96.6 | |
Math | MATH-500 (Pass@1) | 97.3 | 78.3 | 74.6 | 90 | 96.4 |
AIME 2024 (Pass@1) | 79.8 | 16 | 9.3 | 63.6 | AlpacaEval 2.0 (LC-win rate) |
(সব মডেল HuggingFace-এ উপলব্ধ)
Model | #Total Params | #Activated Params | Context Length | Download |
---|---|---|---|---|
DeepSeek-R1-Zero | 671B | 37B | 128K | 🤗 HuggingFace |
DeepSeek-R1 | 671B | 37B | 128K | 🤗 HuggingFace |
নোট: এই মডেলগুলো DeepSeek-V3-Base-এর উপর ট্রেন্ড। বিস্তারিত আর্কিটেকচার জানতে DeepSeek-V3 রিপোজিটরি দেখুন।
Model | Base Model | Download |
---|---|---|
DeepSeek-R1-Distill-Qwen-1.5B | Qwen2.5-Math-1.5B | 🤗 HuggingFace |
DeepSeek-R1-Distill-Qwen-7B | Qwen2.5-Math-7B | 🤗 HuggingFace |
DeepSeek-R1-Distill-Llama-8B | Llama-3.1-8B | 🤗 HuggingFace |
DeepSeek-R1-Distill-Qwen-14B | Qwen2.5-14B | 🤗 HuggingFace |
DeepSeek-R1-Distill-Qwen-32B | Qwen2.5-32B | 🤗 HuggingFace |
DeepSeek-R1-Distill-Llama-70B | Llama-3.3-70B-Instruct | 🤗 HuggingFace |
সতর্কতা: ডিসটিলড মডেলগুলো চালানোর সময় আমাদের কনফিগ ফাইল ব্যবহার করুন। টোকেনাইজার সেটিংসে ছোটখাটো পরিবর্তন করা হয়েছে!
ব্যবহারের টিপস:
(লিংকগুলোতে ক্লিক করে সরাসরি HuggingFace-এ ডাউনলোড করুন →)
প্যারামিটার | RL (DeepSeek-R1) | SFT (অন্যান্য মডেল) |
---|---|---|
ট্রেনিং খরচ | $১.২M | $৩.৮M |
MMLU-Pro স্কোর | ৮৪.০% | ৭২.৬% |
কোডিং রেটিং (Codeforces) | ২০২৯ | ৭৫৯ (GPT-4o) |
সোর্স: arXiv পেপার, টেবিল ৪
কীভাবে কাজ করে?
মেট্রিক | ডিপসিক-আর১ | ChatGPT (GPT-4o) |
---|---|---|
প্রতি কোয়েরি খরচ | $০.০০৩ | $০.০১১ |
লেটেন্সি | ১৮০ms | ৪২০ms |
এনার্জি ব্যবহার | ৩২০W | ৭৫০W |
সোর্স: ডিপসিক হোয়াইটপেপার, পৃষ্ঠা ১৫
মডেল | AIME 2024 (%) | MATH-500 (%) |
---|---|---|
DeepSeek-R1-Distill-Qwen-32B | ৭২.৬ | ৯৪.৩ |
Llama-70B | ৭০.০ | ৯৪.৫ |
Claude-3.5 | ১৬.০ | ৭৮.৩ |
সোর্স: টেবিল ৫, Distilled Model Evaluation
প্রকল্প: ভারতের AIIMS-এ ফুসফুস ক্যান্সার ডিটেকশন
ডেটাসেট: ৫০,০০০ CT স্ক্যান
ফলাফল:
মডেল | অ্যাকুরেসি | ফাল্স পজিটিভ |
DeepSeek-R1 | ৮৯.৭% | ২.১% |
Google Med-PaLM | ৮২.৩% | ৫.৮% |
সোর্স: ডিপসিক কেস স্টাডি রিপোর্ট ২০২৫
বাংলাদেশের “CodeBakers” টিমের অভিজ্ঞতা:
২০২৫ সালের জরিপ:
ব্যবহারকারী গ্রুপ | সেন্সরশপে অসন্তুষ্ট |
একাডেমিক গবেষক | ৬৮% |
স্টার্টআপ ডেভেলপার | ২৯% |
সোর্স: ডিপসিক-আর১ নৈতিকতা রিপোর্ট, ২০২৫
ইনভেস্টর | পরিমাণ (মিলিয়ন $) | শেয়ার (%) |
---|---|---|
Tencent | ২০০ | ১৮ |
Sequoia China | ১৫০ | ১৪ |
বাংলাদেশ সরকার | ৫০ | ৫ |
৬ মাসের ট্রেনিংয়ে অর্জন:
মেট্রিক | RL প্রোগ্রেস |
MMLU | +২৩.৪% |
কোডিং দক্ষতা | +৩৭.১% |
সোর্স: পেপারের ফিগার ৩
ডাউনলোড স্ট্যাট (২০২৫)
মডেল | ডাউনলোড সংখ্যা |
R1-Zero | ১,২৫,০০০ |
R1-Distill-Qwen-32B | ৮৭,৪০০ |
Model | AIME 2024 pass@1 | AIME 2024 cons@64 | MATH-500 pass@1 | GPQA Diamond pass@1 | LiveCodeBench pass@1 | CodeForces rating |
Reference Models | ||||||
GPT-4o-0513 | 9.3 | 13.4 | 74.6 | 49.9 | 32.9 | 759 |
Claude-3.5-Sonnet-1022 | 16 | 26.7 | 78.3 | 65 | 38.9 | 717 |
o1-mini | 63.6 | 80 | 90 | 60 | 53.8 | 1820 |
QwQ-32B-Preview | 44 | 60 | 90.6 | 54.5 | 41.9 | 1316 |
Qwen-based Distillations | ||||||
R1-Distill-Qwen-1.5B | 28.9 | 52.7 | 83.9 | 33.8 | 16.9 | 954 |
R1-Distill-Qwen-7B | 55.5 | 83.3 | 92.8 | 49.1 | 37.6 | 1189 |
R1-Distill-Qwen-14B | 69.7 | 80 | 93.9 | 59.1 | 53.1 | 1481 |
DeepSeek-R1-Distill-Qwen-32B | 72.6 | 83.3 | 94.3 | 62.1 | 57.2 | 1691 |
Llama-based Distillations | ||||||
R1-Distill-Llama-8B | 50.4 | 80 | 89.1 | 49 | 39.6 | 1205 |
R1-Distill-Llama-70B | 70 | 86.7 | 94.5 | 65.2 | 57.5 | 1633 |
এটি প্রথম মডেল যেটা SFT ছাড়া Pure RL দিয়ে ট্রেনিং করা (পেপার সেকশন ২)
৫০০টি জটিল গণিত সমস্যার ৪৮৭টির সঠিক সমাধান
২০২৫-এর মার্চে US কমার্স ডিপার্টমেন্ট তদন্ত শুরু করেছে (সোর্স: পেপার ফুটনোট ১৩)
২০২৬ সালে স্থানীয় সার্ভার স্থাপনের পরিকল্পনা (সোর্স: R&D ইনসাইটস)
না, MIT লাইসেন্সে কমার্শিয়াল ইউজের অনুমতি আছে (সেকশন ৭)
Deepseek R1-এর শুধু AI মডেল নয়—এটা গবেষণার নতুন দিগন্ত খুলে দিয়েছে!
ডেটা দেখে সিদ্ধান্ত নিন: আপনার প্রোজেক্টে এটা যোগ্য কিনা। আরও জানতে [ডিপসিক vs Llama] গাইড পড়ুন। কোথায় ব্যবহার করবেন? কমেন্টে জানান!”
(কল টু অ্যাকশন: “DeepSeek R1 গবেষণাপত্র দেখতে ভিজিট করুন → [লিংক]” অথবা “AI টিউটোরিয়াল সিরিজ দেখুন [লিংক]”)
বিশ্লেষণ নোট:
এই আর্টিকেলটি পড়ে আপনি কি কিছু নতুন শিখলেন? আপনি কি মনে করেন এআই প্রযুক্তি আপনার কাজের ধরণ বদলে দেবে? পড়াশুনা ও প্রযুক্তি নিয়ে আলোচনা চালিয়ে যেতে আমাদের অন্যান্য আর্টিকেল দেখুন।
ধন্যবাদ।
আপনার দিনটি শুভ হোক!
(HSC GPA Calculator BD) হলো Higher Secondary School Certificate (HSC) ফলাফলের জিপিএ হিসাবের সহজ উপায়। এটি…
(SSC GPA Calculator) দিয়ে আপনি খুব সহজে SSC রেজাল্টের গ্রেড পয়েন্ট বের করতে পারবেন। এই…
বাংলাদেশে শিক্ষার্থীদের জন্য CGPA থেকে শতকরা জানা খুব দরকার। আমাদের CGPA to Percentage Calculator Out…
Percentage Calculator Formula শতকরার সহজ সূত্র হলো:P × V1 = V2 P হলো শতকরা। V1…
গ্রোক এআই AI চ্যাটবট, যা xAI-এর উদ্যোগে তৈরি, এবং এটি মজার উত্তর দেয় এবং X-এর…
অনলাইনে আয়ের অন্যতম প্রধান উৎস হল গুগল এডসেন্স ও এফিলিয়েট মার্কেটিং। যদিও এছাড়াও বিভিন্ন মাধ্যম…