"إذا أراد العامل أن يؤدي عمله بشكل جيد، فعليه أولاً أن يشحذ أدواته." - كونفوشيوس، "مختارات كونفوشيوس. لو لينجونج"
الصفحة الأمامية > برمجة > إنتروبيكس: تقنيات أخذ العينات لتعظيم أداء الاستدلال

إنتروبيكس: تقنيات أخذ العينات لتعظيم أداء الاستدلال

تم النشر بتاريخ 2024-11-07
تصفح:835

إنتروبيكس: تقنيات أخذ العينات لتعظيم أداء الاستدلال

وفقًا لـ Entropix README، يستخدم Entropix طريقة أخذ العينات القائمة على الإنتروبيا. تشرح هذه المقالة تقنيات أخذ العينات المحددة بناءً على الإنتروبيا والتنوع.

الانتروبيا و Varentropy

لنبدأ بشرح الإنتروبيا والتنوع، حيث أن هذه عوامل أساسية في تحديد استراتيجية أخذ العينات.

إنتروبيا

في نظرية المعلومات، الإنتروبيا هي مقياس لعدم اليقين في متغير عشوائي. يتم تعريف إنتروبيا المتغير العشوائي X بالمعادلة التالية:

Entropix: Sampling Techniques for Maximizing Inference Performance

  • X: متغير عشوائي منفصل.
  • x_i: الحالة الأولى المحتملة لـ X.
  • p(x_i): احتمال الحالة x_i.

يتم تعظيم الإنتروبيا عندما يكون التوزيع الاحتمالي موحدًا. على العكس من ذلك، عندما تكون حالة معينة أكثر احتمالا من غيرها، تنخفض الإنتروبيا.

فارينتروبيا

يمثل الفارينتروبي، الذي يرتبط ارتباطًا وثيقًا بالإنتروبيا، التباين في محتوى المعلومات. بالنظر إلى محتوى المعلومات I(X)، والإنتروبيا H(X)، والتباين للمتغير العشوائي X، يتم تعريف المتغير V E(X) على النحو التالي:

Entropix: Sampling Techniques for Maximizing Inference Performance

يصبح التباين كبيرًا عندما تختلف الاحتمالات p(x_i) بشكل كبير. تصبح صغيرة عندما تكون الاحتمالات موحدة - إما عندما يكون للتوزيع أقصى قدر من الإنتروبيا أو عندما يكون احتمال إحدى القيم هو 1 وجميع القيم الأخرى لديها احتمال 0.

طرق أخذ العينات

بعد ذلك، دعونا نستكشف كيف تتغير إستراتيجيات أخذ العينات بناءً على قيم الإنتروبيا والمتغيرات.

Entropix: Sampling Techniques for Maximizing Inference Performance

1. الإنتروبيا المنخفضة، التباين المنخفض → Argmax

في هذا السيناريو، يتمتع رمز مميز معين باحتمالية تنبؤ أعلى بكثير من الرموز الأخرى. نظرًا لأن الرمز المميز التالي شبه مؤكد، يتم استخدام Argmax.

if ent 



رابط الكود

2. إنتروبيا منخفضة، فارينتروبيا عالية → فرع

يحدث هذا عندما تكون هناك بعض الثقة، ولكن توجد خيارات متعددة قابلة للتطبيق. في هذه الحالة، يتم استخدام استراتيجية الفرع لأخذ عينات من خيارات متعددة واختيار أفضل النتائج.

elif ent  5.0:
    temp_adj = 1.2   0.3 * interaction_strength
    top_k_adj = max(5, int(top_k * (1   0.5 * (1 - agreement))))
    return _sample(logits, temperature=min(1.5, temperature * temp_adj), top_p=top_p, top_k=top_k_adj, min_p=min_p, generator=generator)

رابط الكود

على الرغم من أن هذه الإستراتيجية تسمى "فرع"، إلا أن الكود الحالي يبدو أنه يضبط نطاق أخذ العينات ويحدد مسارًا واحدًا. (إذا كان لدى أي شخص المزيد من المعرفة، فسيكون موضع تقدير المزيد من التوضيح.)

3. إنتروبيا عالية، تنوع منخفض → CoT أو أدخل رمز الإيقاف المؤقت

عندما تكون احتمالات التنبؤ بالرمز التالي موحدة إلى حد ما، مما يشير إلى أن السياق التالي غير مؤكد، يتم إدراج رمز توضيحي لحل الغموض.

elif ent > 3.0 and vent 



رابط الكود

4. الإنتروبيا العالية، التباين العالي → إعادة التشكيل

في هذه الحالة، هناك سياقات متعددة، واحتمالات التنبؤ بالرمز التالي منخفضة. يتم استخدام إستراتيجية إعادة التشكيل مع إعداد درجة حرارة أعلى وأعلى درجة حرارة منخفضة.

elif ent > 5.0 and vent > 5.0:
    temp_adj = 2.0   0.5 * attn_vent
    top_p_adj = max(0.5, top_p - 0.2 * attn_ent)
    return _sample(logits, temperature=max(2.0, temperature * temp_adj), top_p=top_p_adj, top_k=top_k, min_p=min_p, generator=generator)

رابط الكود

الحالات المتوسطة

إذا لم يتم استيفاء أي من الشروط المذكورة أعلاه، يتم إجراء أخذ العينات التكيفية. يتم أخذ عينات متعددة، ويتم حساب أفضل نتيجة لأخذ العينات بناءً على معلومات الإنتروبيا والتنوع والانتباه.

else:
    return adaptive_sample(
        logits,
        metrics,
        gen_tokens,
        n_samples=5,
        base_temp=temperature,
        base_top_p=top_p,
        base_top_k=top_k,
        generator=generator
    )

رابط الكود


مراجع

  • مستودع إنتروبيكس
  • ما الذي يفعله إنتروبيكس؟
بيان الافراج يتم استنساخ هذه المقالة على: https://dev.to/m_sea_bass/entropix-sampling-techniques-for-maximizing---derformance-2hgc؟1 إذا كان هناك أي انتهاك ، يرجى الاتصال بـ [email protected] لحذفه.
أحدث البرنامج التعليمي أكثر>

تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.

Copyright© 2022 湘ICP备2022001581号-3