DEPSIC R1: لماذا يعتقد خبراء الذكاء الاصطناعى أنه مميز للغاية

فجأة ، ديبيك موجود في كل مكان.
نموذج R1 الخاص به هو مصدر مفتوح ، يزعم أنه تم تدريبه على جزء صغير من تكلفة نماذج الذكاء الاصطناعى الأخرى ، وهو أفضل من Chatagpt إن لم يكن أفضل.
هذا المزيج القاتل يضرب وول ستريت ، مما تسبب في إزعاج أسهم التكنولوجيا ، والمستثمرين لديهم الذكاء الاصطناعي. سؤال عن مقدار المال اللازم لتطوير النماذج. مطالبة المهندسين ديببيك تم تدريب R1 على 2788 وحدات معالجة الرسومات التي تكلف 6 ملايين دولار ، مقارنة بـ Openai’s GPT -4 حسب التقرير مليون تكلف 100 مليون للتدريب.
تتحدى وظائف التكلفة للديبيك أيضًا فكرة أن النماذج الأكبر والمزيد من البيانات تؤدي إلى أداء أفضل. في خضم المحادثات المكثفة حول قدرات ديبيك ، قد يكون من الصعب على شركات الذكاء الاصطناعى مثل Openai وبين خطر المستثمرين المتسابقين ، ما يحدث. لكن خبراء الذكاء الاصطناعي يتمتعون بتجربة P TE يزنون من وجهة نظر قيمة.
يثبت Dippecic ما يقوله خبراء الذكاء الاصطناعى على مر السنين: أكبر ليس أفضل
تعطيل قيود التجارة و NVIDIA GPU CESS ، كان على DPCK R1 القائم على الصين أن يصبح مبدعًا للتطوير والتدريب. لقد كانوا بمثابة الوحي للمستثمرين الذين تمكنوا من أداء هذا الإنجاز بمبلغ 6 ملايين دولار فقط (وهو ما لم يكن الكثير من المال بكلمات الذكاء الاصطناعي).
لكن خبراء الذكاء الاصطناعى لم يفاجأوا. “على Google ، سألت لماذا تم إصلاحها لصنع أكبر طراز Dell. لماذا أنت ذاهب إلى الحجم؟ ما هو العمل الذي تحاول تحقيقه؟ أنت مستاء أو ليس نموذجًا كبيرًا؟ انسداد Timnit GABR ، الذي تم إبرامه من Google ، على X ، لاستدعاء تحيز الذكاء الاصطناعي.
سخيف
قد يتم حذف تغريدة
حضنأشارت ساشا لوسيو ، الرائدة في المناخ والوصول إلى كيفية استثمار الذكاء الاصطناعى في التسويق والضجيج بالتأكيد. “إنه من البرية أن تكون LLM واحدة (عالية الأداء) قادرة على تحقيق عمليات دون التحول من آلاف وحدات معالجة الرسومات ، مما يسبب ذلك ،” غير مهذب لوتو.
قد يتم حذف تغريدة
Deepsk R1 لماذا هذه الصفقة الكبيرة
أداء Deepsik R1 مماثلة مع نموذج Openai O1 على المعيار الرئيسي. لقد تفوقت بشكل هامشي على اختبارات الرياضيات والترميز واختبارات junowledge العادية ، بالضبط أو أقل من O1. للقول ، هناك نماذج أخرى ، مثل Cloud Anthropic و Google Gemini و Meta Open Source Model Lalama ، والتي هي قادرة على المستخدم العادي.
لكن R1 يسبب مثل هذا الغضب لأنه يكلف أقل. “إنها ليست أكثر ذكاءً من النماذج السابقة ، فقط أكثر رخصة تدريباً ،” غير مهذب أبحاث الذكاء الاصطناعي.
قد يتم حذف تغريدة
كان Dippecic قادرًا على إنشاء نموذج يتنافس مع نماذج Openai ملحوظة للغاية. Andrage Carp الذي شارك في تأسيسه علانية ، انسداد على X ، “هل هذا يعني أنك لا تحتاج إلى مجموعات كبيرة من GPU لـ Frontier LLMS؟ لا ، ولكن عليك التأكد البيانات والخوارزميات تمر مع.
قد يتم حذف تغريدة
حيث البروفيسور إيثان موليك من الذكاء الاصطناعي غير مهذب لا يتعلق الأمر بقدراتها ، ولكن النماذج التي يتمتع بها الأشخاص حاليًا. “Deepsik هو نموذج جيد حقًا ، لكنه عادة ما يكون نموذجًا أفضل من O1 أو Cloud.” “لكنها مجانية وتجذب الكثير من الاهتمام ، لذلك أعتقد أن العديد من الأشخاص الذين كانوا يستخدمون نماذج” مصغرة “مجانية على اتصال مع المنطق الأولي لعام 2025 يمكن أن يفعلوا ومفاجأة.”
قد يتم حذف تغريدة
درجة لنماذج AI مفتوحة المصدر
يعد Deepsk R1 Breakout فوزًا كبيرًا لمؤيدي المصادر المفتوحة الذين يجادلون بأن الوصول إلى نماذج الذكاء الاصطناعى القوية يضمن الديمقراطية والشفافية والابتكار والمنافسة الصحية. “يعتقد الناس أن” الصين تعبر الولايات المتحدة في منظمة العفو الدولية ، “الفكر الحقيقي” تعبر نماذج المصادر المفتوحة من الناس ، “” “” غير مهذب Meta Chief AI Vijay. Nik Yan Laken ، الذي دعم المصدر المفتوح من نماذج Lalama الخاصة به.
قد يتم حذف تغريدة
لم يذكر أندرو NGA R1 المتخصص في Computer Vijay و AI المهم فقط عن كونه نموذجًا مفتوحًا ، ولكنه نشرت نعمة للمطورين ، لأنها تتيح الحالات الكبرى بالتكنولوجيا الكبيرة.
“” Dippic Celloff “اليوم في سوق الأوراق المالية – بفضل DeepSK V3/R1 تقاطع النظام الإيكولوجي للتكنولوجيا – علامة أخرى هي أن طبقة التطبيق هي مكان رائع ،” غير مهذب ن. “طبقة نموذج الأساس هي الأفضل للأشخاص الذين يقومون بإنشاء تطبيقات لأولئك الذين يعانون من التنافسية المفرطة.”
قد يتم حذف تغريدة
موضوعات
الذكاء الاصطناعي