ضبط نموذج اللغة الكبير الخاص بك (LLM) باستخدام ميسترال: دليل خطوة بخطوة

الصفحة الأمامية > برمجة > ضبط نموذج اللغة الكبير الخاص بك (LLM) باستخدام ميسترال: دليل خطوة بخطوة

ضبط نموذج اللغة الكبير الخاص بك (LLM) باستخدام ميسترال: دليل خطوة بخطوة

تم النشر بتاريخ 2024-08-29

تصفح:859

Fine-Tuning Your Large Language Model (LLM) with Mistral: A Step-by-Step Guide

مرحبًا، أيها الزملاء المتحمسون للذكاء الاصطناعي! ؟ هل أنت مستعد لإطلاق الإمكانات الكاملة لنماذج اللغات الكبيرة (LLMs) الخاصة بك؟ اليوم، نحن نغوص في عالم الضبط الدقيق باستخدام ميسترال كنموذج أساسي لدينا. إذا كنت تعمل على مهام البرمجة اللغوية العصبية المخصصة وترغب في الارتقاء بنموذجك إلى المستوى التالي، فهذا الدليل مناسب لك! ?

؟ لماذا صقل LLM؟

يتيح لك الضبط الدقيق تكييف نموذج تم تدريبه مسبقًا مع مجموعة البيانات المحددة الخاصة بك، مما يجعله أكثر فعالية لحالة الاستخدام الخاصة بك. سواء كنت تعمل على برامج الدردشة الآلية، أو إنشاء المحتوى، أو أي مهمة أخرى في البرمجة اللغوية العصبية، فإن الضبط الدقيق يمكن أن يؤدي إلى تحسين الأداء بشكل كبير.

؟ لنبدأ مع ميسترال

أول الأشياء أولاً، فلنقم بإعداد بيئتنا. تأكد من تثبيت Python مع المكتبات الضرورية:

pip install torch transformers datasets

️ تحميل ميسترال

ميسترال هو نموذج قوي، وسوف نستخدمه كقاعدة لنا للضبط الدقيق. إليك كيفية تحميله:

from transformers import AutoModelForCausalLM, AutoTokenizer

# Load the Mistral model and tokenizer
model_name = "mistralai/mistral-7b"
model = AutoModelForCausalLM.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)

؟ إعداد مجموعة البيانات الخاصة بك

يتطلب الضبط الدقيق مجموعة بيانات مصممة خصيصًا لمهمتك المحددة. لنفترض أنك تقوم بضبط مهمة إنشاء النص. إليك كيفية تحميل مجموعة البيانات الخاصة بك وإعدادها:

from datasets import load_dataset

# Load your custom dataset
dataset = load_dataset("your_dataset")

# Tokenize the data
def tokenize_function(examples):
    return tokenizer(examples["text"], padding="max_length", truncation=True)

tokenized_dataset = dataset.map(tokenize_function, batched=True)

؟ ضبط النموذج

الآن يأتي الجزء المثير! سنقوم بضبط نموذج ميسترال على مجموعة البيانات الخاصة بك. لهذا، سنستخدم Trainer API من Hugging Face:

from transformers import Trainer, TrainingArguments

# Set up training arguments
training_args = TrainingArguments(
    output_dir="./results",
    num_train_epochs=3,
    per_device_train_batch_size=8,
    per_device_eval_batch_size=8,
    warmup_steps=500,
    weight_decay=0.01,
    logging_dir="./logs",
    logging_steps=10,
)

# Initialize the Trainer
trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=tokenized_dataset["train"],
    eval_dataset=tokenized_dataset["test"],
)

# Start fine-tuning
trainer.train()

؟ تقييم النموذج الذي تم ضبطه بدقة

بعد الضبط الدقيق، من المهم تقييم مدى جودة أداء النموذج الخاص بك. إليك كيفية القيام بذلك:

# Evaluate the model
eval_results = trainer.evaluate()

# Print the results
print(f"Perplexity: {eval_results['perplexity']}")

؟ نشر النموذج المضبوط لديك

بمجرد أن تصبح راضيًا عن النتائج، يمكنك حفظ النموذج الخاص بك ونشره:

# Save your fine-tuned model
trainer.save_model("./fine-tuned-mistral")

# Load and use the model for inference
model = AutoModelForCausalLM.from_pretrained("./fine-tuned-mistral")

؟ التفاف

وهذا كل شيء! ؟ لقد نجحت في ضبط ماجستير إدارة الأعمال الخاص بك باستخدام ميسترال. الآن، قم بإطلاق العنان لقوة نموذجك في مهام البرمجة اللغوية العصبية (NLP) الخاصة بك. تذكر أن الضبط الدقيق هو عملية متكررة، لذا لا تتردد في تجربة مجموعات البيانات والعصور والمعلمات الأخرى المختلفة للحصول على أفضل النتائج.

لا تتردد في مشاركة أفكارك أو طرح الأسئلة في التعليقات أدناه. ضبط سعيد! ?

بيان الافراج يتم استنساخ هذه المقالة على: https://dev.to/abhinowwww/fine-tuning-your-large-language-model-llm-with-mistral-a-step-by-step-b2؟1 إذا كان هناك أي انتهاك ، فيرجى الاتصال بـ [email protected] لحذفها.

أحدث البرنامج التعليمي أكثر>

كيف يمكنني الحفاظ على تقديم خلايا JTable المخصصة بعد تحرير الخلايا؟
ومع ذلك ، من الأهمية بمكان التأكد من الحفاظ على التنسيق المطلوب حتى بعد التحرير العمليات. في مثل هذه السيناريوهات ، قد لا يتم تطبيق القيمة الافتراض...

برمجة نشر في 2025-05-08
ما هو الفرق بين الوظائف المتداخلة والإغلاق في بيثون
لا تعتبر غير المساواة Make_printer (MSG): طابعة DEF (): طباعة (MSG) إرجاع طابعة هنا ، وظيفة الطابعة هي وظيفة متداخلة داخل Make_...

برمجة نشر في 2025-05-08
كيفية تنفيذ الأحداث المخصصة باستخدام نمط المراقب في Java؟
إنشاء أحداث مخصصة في Java لا غنى عن الأحداث المخصصة في العديد من سيناريوهات البرمجة ، مما يتيح مكونات التواصل مع بعضها البعض استنادًا إلى مشغلات...

برمجة نشر في 2025-05-08
ابحث عن طريقة عنصر البرنامج النصي التي تنفذ حاليًا JavaScript
كيفية الرجوع إلى عنصر البرنامج النصي الذي قام بتحميل البرنامج النصي الذي تم تنفيذه حاليًا فهم المشكلة في سيناريوهات معينة ، قد يحتاج المطورون ...

برمجة نشر في 2025-05-08
كيف يمكنني تنفيذ عبارات SQL متعددة في استعلام واحد باستخدام Node-MySQL؟
نصف كولون (؛) لفصل العبارات. ومع ذلك ، ينتج عن هذا خطأ يوضح أن هناك خطأ في بناء جملة SQL. لتمكين هذه الميزة ، تحتاج إلى تعيين تعدد الأطوار على صواب...

برمجة نشر في 2025-05-08
الإدخال: لماذا "تحذير: mysqli_query () يتوقع أن تكون المعلمة 1 mysqli ، مورد معطى" يحدث خطأ وكيفية إصلاحه؟ الإخراج: يجب أن تكون معلمة التحليل والتثبيت لحل الخطأ "تحذير: mysqli_query () mysqli بدلاً من المورد"
mysqli ، المورد المعطى "يمكن أن يحدث خطأ. يشير هذا الخطأ إلى عدم تطابق بين نوع المعلمة الأولى ونوع المورد المتوقع. لا يمكن تبديل هاتين الامتد...

برمجة نشر في 2025-05-08
$كيفية حل \ "رفض تحميل البرنامج النصي ... \" الأخطاء بسبب سياسة أمان محتوى Android \؟$
كيفية حل \ "رفض تحميل البرنامج النصي ... \" الأخطاء بسبب سياسة أمان محتوى Android \؟
تنبع هذه المشكلة من توجيهات سياسة أمان المحتوى (CSP) ، والتي تقيد تحميل الموارد من مصادر غير موثوق بها. ومع ذلك ، يمكن أن يكون حل هذا التحدي واضحًا...

برمجة نشر في 2025-05-08
لماذا توجد خطوط في خلفية التدرج الخطية ، وكيف يمكنني إصلاحها؟
لحفر خطوط الخلفية من التدرج الخطي عند توظيف خاصية الدرجات الخطية لخلفية ، قد تواجه خطوطًا ملحوظة عندما يتم ضبط الاتجاه على الأعلى أو الأسفل. ي...

برمجة نشر في 2025-05-08
$ما هي الطريقة الأكثر كفاءة للكشف عن نقطة في polygon: تتبع الأشعة أو matplotlib \'s path.contains_points؟$
ما هي الطريقة الأكثر كفاءة للكشف عن نقطة في polygon: تتبع الأشعة أو matplotlib \'s path.contains_points؟
الكشف الفعال في polegon في python تحديد ما إذا كانت النقطة تكمن في مضلع هي مهمة متكررة في الهندسة الحسابية. يعد إيجاد طريقة فعالة لهذه المهمة مف...

برمجة نشر في 2025-05-08
ما هي القيود المفروضة على استخدام Current_Timestamp مع أعمدة الطابع الزمني في MySQL قبل الإصدار 5.6.5؟
Current_timestamp جملة. امتد هذا القيد إلى أعداد صحيحة ، و bigint ، و smallint عندما تم تقديمها في البداية في عام 2008. Current_Timestamp Value: إ...

برمجة نشر في 2025-05-08
كيفية اكتشاف المصفوفات الفارغة بكفاءة في PHP؟
إذا كانت الحاجة هي التحقق من وجود أي عنصر صفيف ، فإن الكتابة الفضفاضة لـ PHP تسمح بالتقييم المباشر للمصفوفة نفسها: إذا (! $ playerlist) { // ...

برمجة نشر في 2025-05-08
مستخدم تنسيق الوقت المحلي ودليل عرض إزاحة المنطقة الزمنية
عرض التاريخ/الوقت في تنسيق لغة المستخدم مع إزاحة الوقت عند تقديم التواريخ والأوقات إلى المستخدمين النهائيين ، من الأهمية بمكان عرضها في الوقت ...

برمجة نشر في 2025-05-08
كيفية التقاط وتدفق stdout في الوقت الحقيقي لتنفيذ أوامر chatbot؟
ومع ذلك ، تنشأ التحديات عند محاولة استرداد STDOUT في الوقت الفعلي. للتغلب على هذا ، نحتاج إلى طريقة لالتقاط ودفق STDOUT بشكل مستمر مع تنفيذ البرنا...

برمجة نشر في 2025-05-08
كيف يمكنني قراءة ملف كبير بكفاءة بترتيب عكسي باستخدام Python؟
قراءة ملف بترتيب عكسي في Python فيما يلي حل فعال لمعالجة هذه المهمة: مولد قارئ السطر العكسي يحدد الكود التالي وظيفة المولد ، REVELS_READLI...

برمجة نشر في 2025-05-08
كيفية التحقق مما إذا كان كائن لديه سمة محددة في بيثون؟
فكر في المثال التالي حيث تثير محاولة الوصول إلى خاصية غير محددة خطأً: >>> a = someclass () >>> A.Property Traceback (أحدث مكالمة أخيرة): ملف &...

برمجة نشر في 2025-05-08