आर्टिफिशियल इंटेलिजेंस से मीडिया का अंत तो नहीं होगा, लेकिन इसकी लागत बढ़ेगी
सेवंती निनान
नवंबर 2022 में ओपनएआई द्वारा चैटजीपीटी जारी किए जाने के बाद से दो वर्षों में, ऑनलाइन खोज और मीडिया उद्योग के लिए आर्टिफिशियल इंटेलिजेंस के निहितार्थ विकसित होते रहे हैं, लेकिन उतने तीव्र नहीं जितने की भविष्यवाणी की गई थी।
2023 में, ऐसा लग रहा था कि ऑनलाइन सर्च ने केवल समाचार लेखों के लिंक देने से लेकर AI द्वारा दिए गए प्रश्नों के सीधे उत्तर देने की प्रक्रिया शुरू कर दी है। Google और Microsoft दोनों ने इस तरह के संवर्द्धन को शामिल करने के लिए अपने सर्च इंजन में सुधार की घोषणा की। इसके बाद चिंताजनक विश्लेषण हुआ: जिस डेटा पर बड़े भाषा मॉडल प्रशिक्षित होते हैं, वह आमतौर पर कम से कम एक साल पुराना होता है, इसलिए उन सीधे उत्तरों के कितने अपडेट होने की संभावना थी, खासकर जब बात समाचारों की हो?
इससे भी ज़्यादा, ऑनलाइन रेवेन्यू पर इसका क्या असर होगा जिस पर प्रकाशक निर्भर हैं? 2020 से, विभिन्न देशों में प्रकाशकों के संघ ऐसे कानून की पैरवी कर रहे हैं जिससे प्लेटफ़ॉर्म को उन खबरों के लिए पारदर्शी तरीके से भुगतान करना पड़े जिनसे वे सर्च रेवेन्यू प्राप्त करते हैं। अगर सर्च इंजन अपने स्वयं के AI द्वारा दिए गए सीधे उत्तरों पर निर्भर होते, तो उन्हें किसी भी ऑनलाइन समाचार कानून का पालन करने की ज़रूरत नहीं होती, जैसे कि कुछ सरकारों ने बनाए हैं।
दो साल बाद, राजस्व के सवाल के बहुत अलग आयाम हैं – कॉपीराइट और लाइसेंसिंग सामग्री जो AI कंपनियों को उनके बड़े भाषा मॉडल को प्रशिक्षित करने के लिए सामग्री स्क्रैप करने के लिए है। जबकि सरकारें पहले ऑनलाइन समाचार कानून पारित कर रही थीं ताकि समाचार प्रकाशकों को खोज दिग्गजों से राजस्व अर्जित करने में मदद मिल सके, उदाहरण के लिए, यूनाइटेड किंगडम में सरकार अब इसके विपरीत प्रस्ताव दे रही है। यह वर्तमान में AI कंपनियों के लिए ‘ऑप्ट-आउट’ कॉपीराइट व्यवस्था शुरू करने के प्रस्तावों पर सुनवाई कर रही है। यह तकनीकी व्यवसायों को प्रकाशकों और क्रिएटिव की सामग्री को वेब से स्क्रैप करने की अनुमति देगा जब तक कि उन अधिकार-धारकों ने स्पष्ट रूप से मना नहीं किया हो। इस कदम का उद्देश्य AI कंपनियों को बड़े भाषा मॉडल को प्रशिक्षित करने के लिए सामग्री इकट्ठा करने में मदद करना है, इसका उद्देश्य इन कंपनियों को यूके के AI उद्योग को विकसित करने के लिए अधिक तेज़ी से आगे बढ़ने में मदद करना है। इस कदम का सुनवाई में भाग लेने वाले व्यक्तिगत प्रकाशकों के साथ-साथ यूके के प्रोफेशनल पब्लिशर एसोसिएशन ने भी कड़ा विरोध किया है।
जहां तक एआई कम्पनियों को सामग्री का लाइसेंस देने से राजस्व अर्जित करने वाले प्रकाशकों का सवाल है, तो अभी तक इस बात के पर्याप्त साक्ष्य नहीं हैं कि ऐसे उपयोग की अनुमति देने और उस पर नज़र रखने से सार्थक राजस्व अर्जित किया जा सकता है।
एआई के आगमन ने और अधिक खोज स्टार्ट-अप को जन्म दिया, जिसमें एआई और पारंपरिक खोज लेबल वाली पुनर्प्राप्ति-संवर्धित पीढ़ी के एक नए संकर को विकसित करने के साथ प्रयोग करने वाले लोग शामिल हैं। आप सबसे पहले सबसे प्रासंगिक सामग्री वाले पृष्ठों की पहचान करने के लिए खोज उपकरण लागू करते हैं, उन्हें ‘पढ़ने’ के लिए प्राकृतिक भाषा प्रसंस्करण का उपयोग करते हैं, और फिर खोज क्वेरी के लिए एक पाठ्य प्रतिक्रिया के लिए उन्हें एक बड़े भाषा मॉडल में फीड करते हैं। हालाँकि दो साल बाद भी, प्रकाशित समाचारों के लिंक अभी भी खोज को आगे बढ़ा रहे हैं।
लेकिन Google Cloud हमें यह विश्वास दिलाएगा कि AI एजेंट समाचार स्रोतों पर खोज की निर्भरता को कुछ हद तक कम कर रहे हैं। Gemini 2.0 जारी करने के बाद AI खोज के साथ अपनी सफलता पर यह बहुत सकारात्मक दृष्टिकोण रखता है। दिसंबर 2024 के अंत में, इसने AI एजेंटों के साथ पारंपरिक खोज के अपने संवर्द्धन के वास्तविक दुनिया के जनरेशन AI उपयोग के मामलों को प्रकाशित किया। “AI एजेंटों को जो बात अद्वितीय बनाती है, वह यह है कि वे विशिष्ट लक्ष्यों को प्राप्त करने के लिए कार्रवाई कर सकते हैं, चाहे वह किसी दुकानदार को सही जोड़ी के जूते की ओर मार्गदर्शन करना हो, किसी कर्मचारी को सही स्वास्थ्य लाभ की तलाश में मदद करना हो, या शिफ्ट बदलने के दौरान मरीज को सौंपने में नर्सिंग स्टाफ की सहायता करना हो।”
लेकिन इनमें से कोई भी बात विश्वसनीय समाचार देने में AI एजेंटों की सफलता का संकेत नहीं देती है। पिछले हफ़्ते, BBC ने इस बारे में शोध प्रकाशित किया कि AI सहायक समाचारों के बारे में सवालों के कितने सटीक उत्तर देते हैं। ChatGPT और Gemini सहित चार प्रमुख, सार्वजनिक रूप से उपलब्ध AI सहायकों का BBC की वेबसाइट से समाचारों पर एक महीने से अधिक समय तक परीक्षण किया गया। यह पाया गया कि समाचारों के बारे में सवालों के लिए बॉट द्वारा तैयार किए गए 51% उत्तरों में किसी न किसी रूप में महत्वपूर्ण समस्याएँ थीं, जैसे कि तथ्यात्मक त्रुटियाँ पेश करना या BBC के लेखों से उद्धरण उद्धृत करना जो वास्तव में उस लेख में मौजूद नहीं थे। उन परिणामों के बाद, समाचार और समसामयिक मामलों के लिए BBC के CEO पूछ रहे थे, “हम मुश्किल समय में जी रहे हैं, और ऐसा कब तक होगा जब AI द्वारा विकृत शीर्षक वास्तविक दुनिया को महत्वपूर्ण नुकसान पहुँचाएगा?”
एआई और समाचार के बीच संबंधों का दूसरा आयाम चैटबॉट्स द्वारा अपनी कार्यप्रणाली में उद्धरणों को शामिल करके जो कुछ भी सामने आता है उसकी विश्वसनीयता बढ़ाने का सवाल रहा है। इसका नतीजा मिला-जुला रहा, जिसमें कुछ चैटबॉट्स यूआरएल को लेकर भ्रमित हो गए, जो कि नकली या टूटे हुए लिंक का हवाला देने के लिए एक विनम्र शब्द है, और डीपसीक जैसे अन्य, वास्तव में श्रेय प्रदान करते हैं। नीमन लैब ने पाया कि चीनी चैटबॉट अक्सर अपने जवाब के पाठ में सीधे शीर्षक, लेखक द्वारा लिखे गए या प्रकाशन तिथि को शामिल करके समाचार लेखों को श्रेय देते हैं। बेशक, इसने टूटे हुए लिंक भी पेश किए।
मीडिया उद्योग के लिए, AI तेज़ी से एक ऐसा नवाचार बन गया है जिस पर आप न तो पूरी तरह से निर्भर हो सकते हैं और न ही इसके बिना काम चल सकता है। न्यूज़रूम में कई तरह के कार्यों को बढ़ाने के लिए विश्वसनीय तरीके से AI का उपयोग करना एक बहुत महंगा प्रस्ताव है, जिस पर कुछ अच्छी तरह से संसाधन वाले प्रकाशक निवेश कर रहे हैं। यदि आप अपने AI सहायकों द्वारा उपयोग किए जा रहे डेटा के बारे में सुनिश्चित होना चाहते हैं, तो आप न्यूज़रूम कार्यों के लिए अपने स्वयं के बड़े भाषा मॉडल और AI उपकरण बनाएँ। और उन्हें विश्वसनीय डेटासेट पर प्रशिक्षित करें। ब्लूमबर्ग और फाइनेंशियल टाइम्स जैसे संपन्न संगठन AI उपकरण बनाने या प्राप्त करने में निवेश कर रहे हैं, और फिर उनके प्रदर्शन का परीक्षण करने के लिए पर्याप्त शोध प्रयास कर रहे हैं, जैसा कि BBC ने किया था।
ब्लूमबर्ग ने ब्लूमबर्गजीपीटी को बहुत पहले ही विकसित कर लिया था, जो एक बड़ा भाषा मॉडल है जिसे विशेष रूप से वित्तीय डेटा की एक विस्तृत श्रृंखला पर प्रशिक्षित किया गया है ताकि वित्तीय उद्योग के भीतर प्राकृतिक भाषा प्रसंस्करण कार्यों के विविध सेट का समर्थन किया जा सके। तब इसने कहा कि वित्तीय डोमेन की जटिलता और अनूठी शब्दावली एक डोमेन-विशिष्ट मॉडल की गारंटी देती है।
अग्रणी प्रकाशक भी क्यूरेटेड डेटासेट बनाने या हासिल करने की तलाश में हैं। एआई मॉडल को सीखने के लिए उच्च गुणवत्ता वाले डेटा इनपुट की आवश्यकता होती है, और गुणवत्ता वाले इनपुट बेहतर परिणाम देते हैं। इसलिए, उदाहरण के लिए, फाइनेंशियल टाइम्स अपनी सामग्री को डेटासेट के रूप में पेश करता है। अखबार ने Google News Initiative के साथ साझेदारी में कई देशों के समाचार संगठनों के लिए AI लॉन्चपैड कार्यक्रम भी चलाया है, जिनके पास तकनीकी क्षमता और वित्तीय क्षमता थी। प्रकाशक इस बात पर चर्चा करते हैं कि क्या अपने स्वयं के बड़े भाषा मॉडल और लेखन या प्रतिलेखन उपकरण बनाना बेहतर है या उन्हें खरीदना है। बड़े समाचार संगठनों के पास अब ये निर्णय लेने में मदद करने के लिए AI संपादक हैं। मीडिया उद्योग के लिए परिदृश्य, तो, प्रलय के दिन से बहुत दूर है। लेकिन भरोसेमंद एआई उपयोग को बढ़ावा देना सस्ता नहीं है। द टेलीग्राफ से साभार
सेवंती निनान एक मीडिया टिप्पणीकार हैं। वह श्रम समाचार पत्र, वर्कर वेब भी प्रकाशित करती हैं।