يقول Openai إن Deepseek قام بنسخ Chatpt ، لكنه يواجه أيضًا مزاعم حقوق الطبع والنشر

حتى قبل بضعة أسابيع ، سمع عدد قليل من الناس في العالم الغربي عن شركة ذكية صينية صغيرة (AI) المعروفة باسم Deepseek. لكن في 20 يناير ، ذلك استحوذت على الاهتمام العالمي عندما نشر نموذج AI جديد يسمى R1.

R1 هو نموذج لـ “التفكير” ، مما يعني أنه يعمل في خطوة -مهام الخطوة وتفاصيل عملية عملها للمستخدم. إنها نسخة أكثر تقدماً من Deepseek نموذج V3الذي تم نشره في ديسمبر. يعد عرض Deepseek الجديد قويًا مثل نموذج الذكاء الاصطناعي الأكثر تقدماً لشركة Openai المنافسة ، ولكن مع جزء صغير من التكلفة.

في غضون أيام قليلة ، تجاوز تطبيق Deepseek ChatGPT في التنزيلات الجديدة ووضع حصة شركات التكنولوجيا في الولايات المتحدة الدقة. كما قاد Openai إلى مطالبة أن منافسه الصيني قد قام بالفعل بتجريب بعض جواهر تاج نماذج Openai لبناء له.

في إعلان لصحيفة نيويورك تايمزقالت الشركة:

نحن نعرف وندرس المؤشرات التي تشير إلى أن Deepseek قد يكون قد قام بتقطير نماذجنا بشكل غير لائق ومشاركة المعلومات كما نعرف المزيد. نأخذ تدابير مضادة عدوانية واستباقية لحماية تقنيتنا وتواصل العمل عن كثب مع حكومة الولايات المتحدة لحماية النماذج الأكثر قدرة قيد الإنشاء هنا.

اقتربت المحادثة من ديبسيك للتعليق ، لكنها لم ترد.

ولكن حتى لو تم نسخ Deepseek – أو ، باللغة العلمية ، “Distilled” – على الأقل جزء من ChatGPT لبناء R1 ، فيجب أن نتذكر أن Optaai متهم أيضًا بعدم احترام الملكية الفكرية أثناء تطوير نماذجها.

ما هو التقطير؟

إن تقطير النموذج هو تقنية تعليمية تلقائية حالية يتم فيها تدريب “نموذج الطالب” الأصغر على تنبؤات “نموذج المعلم” الأكبر والأكثر تعقيدًا.

بمجرد الانتهاء ، يمكن أن يكون الطالب جيدًا مثل المعلم ، لكنه سيمثل معرفة المعلم بشكل أكثر فعالية وضغوطًا.

للقيام بذلك ، ليس من الضروري الوصول إلى الأداء الداخلي للمعلم. كل ما تحتاجه للنجاح في هذه الخدعة هو طرح أسئلة كافية للمعلم لتدريب الطالب.

هذا ما يدعي Openai أن Deepseek فعل: استجوب O1 من Openai على نطاق ضخم واستخدم النتائج التي لوحظت لتشكيل النماذج الأكثر فعالية لـ Deepseek.

جزء من الموارد

بعمق شكاوى حقيقة أن تدريب R1 واستخدامه يتطلب فقط جزءًا صغيرًا من الموارد اللازمة لتطوير أفضل النماذج لمنافسيها.

هناك أسباب لتكون متشككين في جزء من تجسس الشركة للشركة – على سبيل المثال ، أ تقرير مستقل جديد يشير إلى أن الإنفاق المادي لـ R1 كان ارتفاعًا يصل إلى 500 مليون دولار أمريكي. ولكن حتى ، تم بناء Deepseek دائمًا بسرعة كبيرة وفعالية مقارنة بالنماذج المتنافسة.

قد يكون هذا بسبب حقيقة أن Deepseek Distilled Openai هو الإنتاج. ومع ذلك ، لا يوجد حاليًا أي طريقة لإثبات ذلك بطريقة قاطعة. طريقة موجودة في المراحل المبكرة من التطوير ملصق AI sormes. هذا يضيف نماذج غير مرئية إلى المخرجات ، على غرار تلك المطبقة على الصور المحمية بواسطة حقوق الطبع والنشر. هناك طرق مختلفة للقيام بذلك من الناحية النظرية ، لكن لا شيء فعال بما يكفي لوضعه موضع التنفيذ.

هناك أسباب أخرى تساعد في شرح نجاح Deepseek ، مثل العمل الفني العميق والصعب للشركة.

تضمن التقدم التقني الذي أحرزته DeepSeek رقائقًا أقل قوة ولكن أرخص (تسمى أيضًا وحدات معالجة الرسوم ، أو GPU).

لم يكن لدى Deepseek أي خيار سوى التكيف بعد حظرت الولايات المتحدة الشركات من تصدير أقوى رقائق الذكاء الاصطناعي إلى الصين.

في حين أن شركات AI الغربية يمكنها شراء هذه الوحدات القوية ، فإن حظر التصدير أجبر الشركات الصينية على الابتكار لتحقيق أقصى استفادة من البدائل أرخص.

حظرت الولايات المتحدة تصدير أقوى براغيث على الكمبيوتر إلى الصين. ني جال / شوكيستوك

سلسلة من الادعاء

Openai شروط الاستخدام ذكر صراحة أنه لا يمكن لأحد استخدام نماذج الذكاء الاصطناعى لتطوير المنتجات المتنافسة. ومع ذلك ، يتم تشكيل نماذجها الخاصة على مجموعات بيانات على شبكة الإنترنت الضخمة. تحتوي مجموعات البيانات هذه كمية كبيرة من المواد المحمية بواسطة حقوق الطبع والنشرمن يفتح أن لديه الحق في الاستخدام بناءً على “الاستخدام العادل”::

يعد تدريب نماذج الذكاء الاصطناعى باستخدام مواد الإنترنت التي يمكن الوصول إليها للجمهور عادلًا ، كما هو مدعوم من قبل الطويلات والمقبولة على نطاق واسع. نحن نعتبر هذا المبدأ عادلًا للمبدعين ، وهو ضروري للمبتكرين والنقد للقدرة التنافسية الأمريكية.

سيتم اختبار هذه الحجة في المحكمة. الصحف، الموسيقيين، المؤلفون ورفعت التصميمات الأخرى سلسلة من الإجراءات ضد Openai لانتهاك حقوق الطبع والنشر.

بالطبع ، هذا مختلف تمامًا عما يتهم Optai Deepseek. ومع ذلك Openai لا تجذب الكثير من التعاطف لتأكيده على أن ديبسيك جمع بشكل غير قانوني إنتاجه النموذجي.

حرب الكلمات والادعاء هي قطعة أثرية للطريقة التي تجاوز بها التقدم السريع لمنظمة العفو الدولية تطوير قواعد قانونية واضحة للصناعة. وعلى الرغم من أن هذه الأحداث الأخيرة يمكن أن تقلل من قوة مشغلي تشغيلي الذكاء الاصطناعي ، فإن العديد منهم يعتمد على نتائج النزاعات القانونية المختلفة قيد التقدم.

هز المحادثة العالمية

لقد أظهر Deepseek أنه من الممكن تطوير نماذج متقدمة بتكلفة أقل وفعالية. يبقى أن نرى ما إذا كان بإمكانهم التنافس مع Openai في ملعب.

خلال عطلة نهاية الأسبوع ، حاول Openai إظهار تفوقه الإصدار العام نموذج الاستهلاك الأكثر تقدما ، O3-MINI.

يقول Openai إن هذا النموذج يتجاوز إلى حد كبير نسخته السابقة من طرف السوق ، O1 ، وهو “النموذج الأكثر ربحية لسلسلة أسبابنا”.

تعلن هذه التطورات عن زيادة عصر المستهلكين ، مع تنوع نماذج الذكاء الاصطناعى في السوق. هذه أخبار جيدة للمستخدمين: ستجعل الضغوط التنافسية نماذج أرخص للاستخدام.

والمزايا تمتد أكثر.

تدريب واستخدام هذه النماذج يضع أ التوتر الهائل على استهلاك الطاقة العالمي. نظرًا لأن هذه النماذج تصبح أكثر ظهورًا في كل مكان ، فإننا نستفيد جميعًا من التحسينات على فعاليتها.

إن صعود Deepseek بالتأكيد يمثل منطقة جديدة لبناء نماذج في أرخص وفعالية. ربما سيؤدي هذا أيضًا إلى هز المحادثة العالمية حول كيفية جمع شركات الذكاء الاصطناعى واستخدام بياناتها التدريبية.

(مؤلف: ليا فريمانمحاضر في علاج اللغة الطبيعية ، جامعة ملبورن ، جامعة ملبورن و شانان كونيمحاضر في الأمن السيبراني ، جامعة ملبورن)))

تم إعادة نشر هذه المقالة من المحادثة تحت رخصة Communs Communs الإبداعية. اقرأها المقالة الأصلية.

(باستثناء العنوان ، لم يتم نشر هذه القصة من قبل موظفي NDTV ويتم نشرها من تدفق نقابي.)

رابط المصدر