GPT-4O आपको ऑब्जेक्ट्स पर टेक्स्ट के साथ जटिल छवियां बनाने की अनुमति देता है। स्रोत: Openai
Openai ने GPT-4O के लिए एक महत्वपूर्ण अपडेट पेश किया है जो आपको अविश्वसनीय रूप से सटीक पाठ के साथ छवियों को उत्पन्न करने की अनुमति देता है। यह नई क्षमता उपयोगकर्ताओं को भाषण संकेतों के साथ विस्तृत, उच्च गुणवत्ता वाली छवियों को बनाने और उनके इच्छित अर्थ को सटीक रूप से पुन: पेश करने की प्रक्रिया में समायोजित करने की अनुमति देती है।
यहाँ हम क्या जानते हैं
ऐसा लगता है कि अब हम अवैध शिलालेखों या विचित्र प्रतीकों के बारे में भूल सकते हैं जो अक्सर पुराने एआई मॉडल में दिखाई देते थे।
पारंपरिक छवि पीढ़ी के तरीकों के विपरीत, जहां आपको एक एकल क्वेरी में सुधार करने की आवश्यकता है, GPT-4O एक गतिशील दृष्टिकोण का उपयोग करता है। सबसे पहले, आप एक मूल सुराग प्रदान करते हैं, जैसे “कैट”, और फिर आप वांछित विवरणों को जोड़ने के लिए मॉडल के साथ एक संवाद में संलग्न हो सकते हैं, जैसे कि जासूसी की टोपी या मोनोकल।
Openai ने दिखाया कि कैसे उपयोगकर्ता धीरे -धीरे विभिन्न छवियों से तत्वों को मिलाकर दृश्य बना सकते हैं। मॉडल संकेतों या वस्तुओं पर पाठ को पुन: पेश करने में उच्च सटीकता को प्रदर्शित करता है, जो पिछले मॉडल पर एक महत्वपूर्ण अग्रिम है जो लिखित शब्दों को सही ढंग से पुन: पेश नहीं कर सकता है।
GPT-4O भी आपको उनमें परिवर्तन लागू करके फ़ोटो के साथ काम करने की अनुमति देता है। मॉडल एक दृश्य में 10-20 वस्तुओं को संभाल सकता है, जहां अन्य मॉडल अक्सर 5-8 पर रुकते हैं।
हालांकि, सब कुछ सही नहीं है: कुछ कमियां हैं, जैसे नीचे से फसल, गैर-लैटिन पाठ के साथ गलतफहमी, और 20 से अधिक वस्तुओं के साथ समस्याएं। फिर भी, नई सुविधा सटीकता और लचीलापन प्रदान करती है जो डिजाइनरों और क्रिएटिव के लिए नई संभावनाओं को खोलती है।
स्रोत: ओपनई, गिज़मोचाइना