لدى غوغل نظام ذكاء اصطناعي جديد سيجعل إنشاء الصور أسهل. أطلقت الشركة Whisk، وهو نموذج جديد يتخلص من المطالبات المميزة ويستخدم ببساطة صورًا أخرى للحصول على مؤشرات لما يجب أن ينشئه.
يعمل Whisk بطريقة بسيطة جدًا. لإنشاء صورة، يتعين على المستخدم فقط إضافة صورة تعمل كموضوع (أي الموضوع الرئيسي للصورة)؛ سواء كان حيوانًا أو شخصًا أو شيئًا أو أي عنصر آخر. من الضروري أيضًا إضافة صورة أخرى تعمل كخلفية، على سبيل المثال، منظر طبيعي، بالإضافة إلى صورة ثالثة تعمل كمصدر إلهام للأسلوب. ومن الممكن في هذه الحالة تضمين مشهد أنمي مثلاً بحيث يتم إنشاء الصورة بنفس هذه الجمالية.
يتيح لك الذكاء الاصطناعي الجديد من غوغل أيضًا إدخال وصف نصي مختصر جدًا بحيث تكون الصورة أكثر دقة مما يريد الشخص إنشاءه. على سبيل المثال، إذا أضاف المستخدم صورة لكلب، وخلفية فضائية، ونمط رسوم متحركة، فيمكنه ببساطة وضع الوصف .
وتستخدم غوغل Gemini، نموذجها اللغوي القوي، للحصول على وصف نصي للصور المرفقة وإرسالها إلى Image 3، نموذج توليد الصور الخاص بالشركة، وهو المسؤول عن إنشاء التصميم.
توضح الشركة أيضًا أن Whisk مصمم ليتم استخدامه “كأداة إبداعية” وليس كمحرر صور تقليدي. “لقد قمنا بتطويره للاستكشاف البصري السريع، وليس لإجراء تعديلات مثالية للبكسل. يتعلق الأمر باستكشاف الأفكار بطرق جديدة ومبتكرة، مما يسمح لك بالعمل من خلال عشرات الخيارات وتنزيل الخيار الذي تفضله أكثر.”
الذكاء الاصطناعي الجديد من غوغل والذي يسمح لك بإنشاء صور من خلال صور أخرى، متاح حاليا في الولايات المتحدة. يمكن للمستخدمين تجربتها من خلال موقع Labs الخاص بالشركة. وفي الوقت الحالي، من غير المعروف متى سيكون متاحًا في الدول الأخرى.