فهم معمارية التحويلات بأسلوب بسيط

فهم بنية المحولات بلغة بسيطة
لقد أحدثت المحولات ثورة في مجال الذكاء الاصطناعي، خاصة في معالجة اللغات الطبيعية (NLP). يهدف هذا المقال إلى تبسيط تعقيدات بنية المحولات إلى مفاهيم يسهل فهمها، مما يجعلها متاحة حتى لأولئك الجدد في الذكاء الاصطناعي.
ما هي المحولات؟
المحولات هي نوع من بنية الشبكات العصبية مصممة لمعالجة البيانات التسلسلية، وخاصة اللغة. تم تقديمها في ورقة بحثية رائدة من قبل باحثين في Google في عام 2017، ومنذ ذلك الحين أصبحت العمود الفقري للعديد من نماذج اللغة الحديثة، بما في ذلك BERT و GPT.
تكمن الابتكارات الرئيسية في المحولات في قدرتها على التعامل مع الاعتماديات بعيدة المدى في النص بشكل أكثر فعالية من النماذج السابقة، مثل الشبكات العصبية التكرارية (RNNs).
الميزات الرئيسية للمحولات:
- آلية الانتباه الذاتي: وهذا يسمح للنموذج بوزن أهمية الكلمات المختلفة في جملة بالنسبة لبعضها البعض، مما يمكن من فهم أعمق للسياق.
- ترميز المواقع: تستخدم المحولات الترميز المكاني للحفاظ على ترتيب الكلمات، نظرًا لأنها تعالج جميع الكلمات بالتوازي بدلاً من التسلسل.
- قابلية التوسع: على عكس الشبكات العصبية التكرارية، يمكن توسيع المحولات بسهولة، مما يجعلها مناسبة للتدريب على مجموعات بيانات ضخمة.
بنية المحول
تتكون بنية المحول من عنصرين رئيسيين: المشفر (Encoder) والمفكك (Decoder). يتكون كل عنصر من مجموعة من الطبقات المتطابقة.
المشفر
المشفر يعالج بيانات الإدخال ويتكون من عدة طبقات، يحتوي كل منها على طبقتين رئيسيتين:
- انتباه ذاتي متعدد الرؤوس: تتيح هذه الآلية للنموذج التركيز على أجزاء مختلفة من جملة الإدخال في وقت واحد، مما يلتقط تباينات المعنى المختلفة.
- شبكة عصبية للتغذية الأمامية: بعد آلية الانتباه، يتم تمرير البيانات عبر شبكة تغذية أمامية لمزيد من المعالجة.
المفكك
المفكك ينتج تسلسل الإخراج بناءً على الإدخال المشفر ويتكون من طبقات مماثلة للمشفر، مع طبقة فرعية إضافية للحضور إلى إخراج المشفر. هذا يمكّن النموذج من إنتاج استجابات منطقية وملائمة للسياق.
كيف تعمل المحولات؟
تعمل المحولات على تحويل نص الإدخال إلى سلسلة من المتجهات التي تلتقط المعنى وسياق الكلمات. إليك تحليل مبسط للعملية:

