أصبح نموذج Gemini 3 Pro Image، المعروف باسم Nano Banana Pro، واحداً من أبرز أدوات الذكاء الاصطناعي في مجال توليد الصور، منذ إطلاقه في منتصف نوفمبر الماضي، بعدما قدّم مستوى بصرياً غير مسبوق خاصة في التعامل مع النصوص العربية، وهو التحدي الذي ظلّ يمثّل عقبة أمام النماذج السابقة لسنوات.
هذا التقدّم لم يأتِ من تحسينات سطحية، بل كان نتيجة إعادة بناء شاملة لطريقة تدريب النموذج وفهمه للعناصر البصرية.
وأفاد البيان التوضيحي للنموذج، بأنه ينتمي إلى الجيل الجديد من نماذج Gemini 3 Pro متعددة الوسائط القادرة على معالجة المعلومات عبر النص والصورة في سياق واحد، مع نافذة سياق تصل إلى مليون رمز (Token)، ما يمنحه قدرة استثنائية على فهم العلاقات بين العناصر داخل المشهد.
هذا التقدّم لم يأتِ من تحسينات سطحية، بل كان نتيجة إعادة بناء شاملة لطريقة تدريب النموذج وفهمه للعناصر البصرية.
اعتمدت "جوجل" في تدريب النموذج على مجموعة بيانات بصرية ضخمة وجودة عالية، تشمل أمثلة تصميم تحتوي نصوصاً عربية ولغات متعددة.
ومكّن هذا التنوع النموذج من فهم شكل الحروف العربية وتوزيعها داخل التصميم وربطها بالمعنى والسياق، وهي نقطة شديدة الحساسية في توليد الصور التي تحتوي على نصوص.





شارك برأيك
نموذج جديد من جوجل يغير مفهوم توليد الصور بالذكاء الاصطناعي