Pune

Google Veo 3: जेमिनी को मिला नया फीचर, अब तस्वीर से बनेगा वीडियो

Google Veo 3: जेमिनी को मिला नया फीचर, अब तस्वीर से बनेगा वीडियो

गूगल ने Gemini में Veo 3 को अपग्रेड कर इमेज से वीडियो बनाने की क्षमता जोड़ी है। अब उपयोगकर्ता एक छवि और टेक्स्ट प्रॉम्प्ट देकर AI वीडियो बना सकते हैं। यह सुविधा फिलहाल वेब पर ही उपलब्ध है और भारत में शुरू नहीं हुई है।

Google: गूगल ने अपनी जनरेटिव AI क्षमताओं को और बेहतर बनाते हुए Veo 3 मॉडल को एक नई क्रांतिकारी शक्ति के साथ अपग्रेड किया है। अब उपयोगकर्ता Gemini वेब इंटरफेस के जरिए केवल एक छवि और टेक्स्ट प्रॉम्प्ट से वीडियो तैयार कर सकते हैं। इस फीचर के जुड़ने से गूगल न सिर्फ टेक्स्ट और इमेज जनरेशन के क्षेत्र में, बल्कि वीडियो निर्माण में भी अग्रणी भूमिका निभा रहा है। यह तकनीक फिलहाल मोबाइल ऐप्स पर उपलब्ध नहीं है, लेकिन गूगल इसे चुनिंदा देशों में जेमिनी वेब इंटरफेस के माध्यम से सार्वजनिक कर रहा है। हालाँकि, भारत अभी इसकी पहुंच से बाहर है।

इमेज से वीडियो: कैसे करेगा काम Veo 3?

Veo 3 का नया अपडेट उपयोगकर्ता को एक संदर्भ छवि (Reference Image) जोड़ने की अनुमति देता है, साथ ही एक टेक्स्ट प्रॉम्प्ट, जिसमें बताया जाता है कि उस छवि में क्या-क्या बदलाव या एनीमेशन होने चाहिए। यह टेक्स्ट और छवि मिलकर Veo 3 को निर्देश देते हैं कि वीडियो में क्या दिखाया जाए। उदाहरण के लिए, अगर आप एक पहाड़ की तस्वीर देते हैं और प्रॉम्प्ट में लिखते हैं, ;सूरज उगता है, पक्षी उड़ते हैं, और एक बच्चा चढ़ाई करता है; तो Veo 3 इस निर्देशानुसार वीडियो तैयार कर सकता है। यानी, अब आपकी कल्पनाएं केवल शब्दों तक सीमित नहीं रहीं — एक तस्वीर और विचार से बन सकता है एक प्रभावशाली वीडियो।

जेमिनी में कहां मिलेगा नया फीचर?

जो उपयोगकर्ता जेमिनी का उपयोग कर रहे हैं, वे वेब ब्राउज़र में जाकर टेक्स्ट बॉक्स के ठीक नीचे एक "वीडियो" टैब देख सकते हैं। इस टैब पर क्लिक करते ही उपयोगकर्ता को एक नया विकल्प मिलेगा – छवि जोड़ने का। हाँ पर उपयोगकर्ता एक फोटो अपलोड कर सकते हैं और उसके साथ ही टेक्स्ट प्रॉम्प्ट डाल सकते हैं। इसके बाद, Veo 3 मॉडल उस छवि और टेक्स्ट के आधार पर ऑटोमैटिकली वीडियो जनरेट कर देगा।

डेमो ने किया सबको हैरान

गूगल ने एक दिलचस्प डेमो वीडियो भी रिलीज़ किया है, जिसमें उन्होंने Veo 3 की असली ताकत दिखाई। इस डेमो में एक आम कार्डबोर्ड बॉक्स की तस्वीर को लिया गया और उस पर तीन अलग-अलग वीडियो तैयार किए गए:

  1. बॉक्स के अंदर खाना बनाता हुआ एक हैम्स्टर।
  2. बॉक्स में कूदता हुआ एक इंसान।
  3. बॉक्स से बाहर निकलती एक लिफ्ट।

इस डेमो ने यह साबित कर दिया कि Veo 3 केवल साधारण मूवमेंट ही नहीं, बल्कि जटिल और कलात्मक एनीमेशन भी बना सकता है।

सुरक्षा भी पूरी तरह सुनिश्चित

गूगल ने इस नई सुविधा में पारदर्शिता और सुरक्षा का खास ख्याल रखा है।

  • हर वीडियो में एक दृश्यमान वॉटरमार्क जोड़ा गया है जो दर्शाता है कि यह वीडियो AI द्वारा जनरेट किया गया है।
  • साथ ही, Google की SynthID तकनीक के माध्यम से हर वीडियो में एक अदृश्य वॉटरमार्क भी डाला गया है, जिसे कोई भी क्रॉप, एडिट या मिटा नहीं सकता।

यह तकनीक भविष्य में Deepfake या फेक वीडियो की पहचान में मददगार साबित हो सकती है, जो डिजिटल दुनिया के लिए एक बेहद जरूरी कदम है।

किन क्षेत्रों में उपयोगी हो सकता है यह फीचर?

Google Veo 3 का यह इमेज-टू-वीडियो फीचर केवल एक एन्हांसमेंट नहीं, बल्कि AI जनरेटिव मीडिया का भविष्य है। यह सुविधा एनीमेशन, विज्ञापन, गेमिंग और यहां तक कि शिक्षा के क्षेत्र में भी नई संभावनाएं खोल सकती है।

  • शिक्षा में: एक फोटो से जटिल कॉन्सेप्ट को वीडियो में बदलकर बच्चों को आसानी से समझाया जा सकता है।
  • मार्केटिंग में: प्रोडक्ट की एक फोटो से प्रभावशाली वीडियो विज्ञापन तैयार किया जा सकता है।
  • मनोरंजन में: फिल्म डायरेक्टर और लेखक अपनी कहानियों को विज़ुअल फॉर्म में तेजी से बना सकते हैं।

भविष्य की संभावनाएं

Veo 3 की यह क्षमता आने वाले समय में और भी विकसित हो सकती है। भविष्य में:

  • यूजर्स लंबी वीडियो स्टोरीज बना सकेंगे।
  • अलग-अलग एंगल से इमेज और मूवमेंट को कंट्रोल किया जा सकेगा।
  • मोबाइल ऐप्स में भी यह सुविधा जोड़ी जा सकती है।

Google की यह पहल OpenAI, Runway और Pika Labs जैसे वीडियो जनरेशन प्लेटफॉर्म्स को सीधी टक्कर दे रही है।

Leave a comment