ब्रेकिंग
Ketana Agarwal Murder Case: हत्या से एक दिन पहले कैफे में मिले थे आरोपी; CCTV फुटेज ने खोली साजिश की... Faridabad Crime News: नशे की लत में पति ने पत्नी का 1 लाख में किया सौदा; विरोध करने पर की बेरहमी से ... Bollywood News: आमिर खान की शादी से लेकर कॉलेज लाइफ तक; अभिनेता के बारे में जानें ये अनसुने किस्से FIFA World Cup 2026: पहली बार वर्ल्ड कप खेल रही कुरासाओ टीम ने बनाया अनोखा नियम; खिलाड़ी साथ रख सकेंग... Venezuela Tragedy: इमारतों का मलबा, चीखती आवाजें और रेस्क्यू ऑपरेशन; देखें भूकंप तबाही का खौफनाक मंज... Real Estate Boom in Religious Cities: अयोध्या और वाराणसी में घर दिल्ली से भी महंगे; धार्मिक पर्यटन न... Google Earthquake Alert: भूकंप आने से पहले कैसे मिल जाता है अलर्ट? जानें गूगल के इस स्मार्ट सिस्टम क... Muharram Facts: मुहर्रम के 10 दिन मातम के क्यों होते हैं? ताजिया और आशूरा से जुड़ी पूरी जानकारी Health Tips: ऑफिस में घंटों बैठकर काम करते हैं? हर घंटे सिर्फ 5 मिनट की सैर से मिलेंगे ये गजब के फाय... MP Land Controversy: मुख्यमंत्री मोहन यादव के समर्थन में उतरे अखिलेश यादव; AIMIM चीफ ओवैसी ने कहा- य...

Hidden Costs of AI: OpenAI और Claude पर हिंदी भाषा का पड़ता है ज्यादा असर, टोकन खर्च बढ़ने से बढ़ रहा है बिल

नई दिल्ली: यदि आप OpenAI, Anthropic या Google के AI मॉडल्स का उपयोग हिंदी या अन्य क्षेत्रीय भाषाओं में कर रहे हैं, तो सावधान हो जाएं। रिसर्चर्स के नए डेटा से पता चला है कि अंग्रेजी के अलावा अन्य भाषाओं में AI का उपयोग करना ‘छिपे हुए खर्च’ यानी ‘लैंग्वेज टैक्स’ की वजह से काफी महंगा पड़ सकता है। कंपनियां भले ही अपने मॉडल्स को सभी के लिए समान बताएं, लेकिन भाषा के आधार पर प्रोसेसिंग लागत में भारी अंतर है।

⚙️ क्यों महंगा है हिंदी में AI का उपयोग?

AI मॉडल किसी भी निर्देश (प्रॉम्प्ट) को ‘टोकन’ (Tokens) के रूप में प्रोसेस करते हैं। सरल शब्दों में, एआई सिस्टम टेक्स्ट को पढ़ने के लिए छोटी इकाइयों का उपयोग करता है। अंग्रेजी की तुलना में, हिंदी जैसे भाषाओं में शब्दों की संरचना भिन्न होने के कारण AI ज्यादा टोकन्स जेनरेट करता है। जो काम अंग्रेजी में कम टोकन्स में हो जाता है, वही हिंदी में कहने पर सिस्टम ज्यादा टोकन्स खर्च करता है, जिससे अंततः यूजर को ज्यादा पैसे चुकाने पड़ते हैं।

📉 क्या है ‘लैंग्वेज टैक्स’ का गणित?

रिसर्चर्स इसे एक ‘छिपा हुआ खर्च’ मानते हैं जो AI के टोकनाइजर (Tokenizer) की कार्यप्रणाली पर निर्भर करता है। हालिया प्रयोगों के नतीजे चौंकाने वाले हैं:

  • OpenAI के टोकेनाइज़र पर: हिंदी टेक्स्ट के लिए अंग्रेजी की तुलना में लगभग 1.37 गुना ज्यादा टोकन खर्च होते हैं।

  • Anthropic के Claude टोकेनाइजर पर: यह अंतर और भी बढ़ जाता है, जहाँ हिंदी के लिए 3.24 गुना ज्यादा टोकन की आवश्यकता होती है।

  • अन्य भाषाएं: अरबी के लिए 2.86 गुना और चीनी भाषा के लिए 1.71 गुना ज्यादा टोकन खर्च होते हैं।

💡 डेवलपर्स और यूजर्स के लिए चुनौती

यह शोध साबित करता है कि वर्तमान AI मॉडल्स अंग्रेजी-केंद्रित हैं। ‘द बिटर लेसन’ जैसे बेंचमार्क के माध्यम से यह साफ हो गया है कि भाषा की विविधता के बावजूद, तकनीक का मौजूदा ढांचा गैर-अंग्रेजी भाषी यूजर्स पर आर्थिक बोझ डाल रहा है। यदि आप भारी मात्रा में AI का उपयोग कर रहे हैं, तो यह टोकन खर्च आपके बजट को प्रभावित कर सकता है।