CHATGPT GPT-4O मॉडल पठनीय लेबल के साथ छवियां उत्पन्न करता है

CHATGPT GPT-4O मॉडल पठनीय लेबल के साथ छवियां उत्पन्न करता है

GPT-4O आपको ऑब्जेक्ट्स पर टेक्स्ट के साथ जटिल छवियां बनाने की अनुमति देता है। स्रोत: Openai

Openai ने GPT-4O के लिए एक महत्वपूर्ण अपडेट पेश किया है जो आपको अविश्वसनीय रूप से सटीक पाठ के साथ छवियों को उत्पन्न करने की अनुमति देता है। यह नई क्षमता उपयोगकर्ताओं को भाषण संकेतों के साथ विस्तृत, उच्च गुणवत्ता वाली छवियों को बनाने और उनके इच्छित अर्थ को सटीक रूप से पुन: पेश करने की प्रक्रिया में समायोजित करने की अनुमति देती है।

यहाँ हम क्या जानते हैं

ऐसा लगता है कि अब हम अवैध शिलालेखों या विचित्र प्रतीकों के बारे में भूल सकते हैं जो अक्सर पुराने एआई मॉडल में दिखाई देते थे।

पारंपरिक छवि पीढ़ी के तरीकों के विपरीत, जहां आपको एक एकल क्वेरी में सुधार करने की आवश्यकता है, GPT-4O एक गतिशील दृष्टिकोण का उपयोग करता है। सबसे पहले, आप एक मूल सुराग प्रदान करते हैं, जैसे “कैट”, और फिर आप वांछित विवरणों को जोड़ने के लिए मॉडल के साथ एक संवाद में संलग्न हो सकते हैं, जैसे कि जासूसी की टोपी या मोनोकल।

Openai ने दिखाया कि कैसे उपयोगकर्ता धीरे -धीरे विभिन्न छवियों से तत्वों को मिलाकर दृश्य बना सकते हैं। मॉडल संकेतों या वस्तुओं पर पाठ को पुन: पेश करने में उच्च सटीकता को प्रदर्शित करता है, जो पिछले मॉडल पर एक महत्वपूर्ण अग्रिम है जो लिखित शब्दों को सही ढंग से पुन: पेश नहीं कर सकता है।

GPT-4O भी आपको उनमें परिवर्तन लागू करके फ़ोटो के साथ काम करने की अनुमति देता है। मॉडल एक दृश्य में 10-20 वस्तुओं को संभाल सकता है, जहां अन्य मॉडल अक्सर 5-8 पर रुकते हैं।

हालांकि, सब कुछ सही नहीं है: कुछ कमियां हैं, जैसे नीचे से फसल, गैर-लैटिन पाठ के साथ गलतफहमी, और 20 से अधिक वस्तुओं के साथ समस्याएं। फिर भी, नई सुविधा सटीकता और लचीलापन प्रदान करती है जो डिजाइनरों और क्रिएटिव के लिए नई संभावनाओं को खोलती है।

स्रोत: ओपनई, गिज़मोचाइना

Exit mobile version