أعلنت جوجل عن تحديث كبير لنموذج الذكاء الاصطناعي الخاص بها، "Gemini"، حيث دمجت النموذج الأحدث لتوليد الصور، Imagen 3، لتعزيز القدرات البصرية لروبوت الدردشة Gemini.

هذا التحديث، الذي تم الكشف عنه يوم الأربعاء، يهدف إلى تحسين ميزات توليد الصور وجعل هذه الأدوات المتقدمة متاحة لجميع المستخدمين، بما في ذلك أولئك الذين يستخدمون النسخة المجانية.

كما سيتمكن المطورون الذين يستخدمون واجهة برمجة تطبيقات (API) الخاصة بـGemini من الوصول إلى Imagen 3 لتطوير تطبيقات وتجارب بصرية محسّنة.


أقرأ أيضاً.. ميزة جديدة من "جوجل فوتوز" تسهل مشاركة الصور والتنقل بين الألبومات



يمكن الآن لجميع مستخدمي Google Gemini إنشاء صور باستخدام نموذج الذكاء الاصطناعي الأحدث Imagen 3، سواء كانوا يستخدمونه عبر الإنترنت، في التطبيق، أو ضمن نظام أندرويد. في السابق، كانت هذه الميزة متاحة فقط للمشتركين في خدمة Gemini Advanced عبر إصدار الويب من الذكاء الاصطناعي.

تم الكشف عن Imagen 3 خلال حدث I/O الذي عقدته جوجل في وقت سابق من هذا العام. وقد تم تطويره بواسطة مختبر الأبحاث الخاص بالشركة، DeepMind، ويتميز بقدرته على إنشاء صور مربعة عالية الواقعية، مشابهة لتلك التي ينتجها Midjourney أو Flux.


أقرأ أيضاً.. جوجل تعزز أمان متصفح كروم بتحديثات جديدة لحماية المستخدمين

 

 


ومع ذلك، هناك بعض القيود، خاصة للمستخدمين المجانيين لـGemini. حالياً، لا يمكنك استخدامه لإنشاء صور للأشخاص إلا إذا كنت مشتركاً في خدمة Gemini Advanced بسعر 19 دولاراً شهرياً، وحتى في هذه الحالة، لن يتمكن من توليد صور لأشخاص حقيقيين.

تكمن قوة Gemini الحقيقية في توليد الصور في قدرته على تعديل الصور بسهولة أو حتى تغييرها بالكامل بناءً على وصف نصي بسيط. قد تحتاج إلى تحديث التطبيق للحصول على هذه الميزة.

يعتبر Imagen 3 ترقية بصرية مقارنة بالإصدار السابق Imagen 2، حيث يوفر صوراً أكثر غنىً وتفصيلاً، كما أن النموذج أكثر دقة في اتباع التعليمات المعطاة له من قبل Gemini.

كانت جوجل قد أزالت سابقاً قدرات توليد الصور من Gemini لبعض الوقت بسبب مخاوف تتعلق بالحذر المفرط عند إنشاء صور لأشخاص. كما كان النموذج السابق يميل إلى جعل كل شيء يبدو وكأنه مصنوع من البلاستيك.

يجلب النموذج الجديد قدرات توليد الصور في جوجل إلى مستوى قريب من DALL-E 3 الخاص بـ OpenAI، على الرغم من أنه لا يزال ينتج صوراً مربعة فقط، في حين يمكن لـChatGPT استخدام DALL-E 3 لإنشاء صور بأي حجم أو اتجاه.