ब्रेकिंग
Operation Sindoor Heroes: नेशनल वॉर मेमोरियल की वेबसाइट पर दर्ज हुआ ऑपरेशन सिंदूर के 6 शहीदों का नाम Amit Shah on Drugs: नार्को-आतंकवाद पर बड़ा प्रहार; 6,000 करोड़ की ड्रग्स नष्ट करने का लक्ष्य, NCB के न... Arvind Kejriwal in Ayodhya: राम मंदिर दर्शन के बाद केजरीवाल का बड़ा बयान; कहा- 'चंदा चोरी करने वालों ... Rahul Gandhi as LoP: लोकसभा में नेता प्रतिपक्ष के रूप में राहुल गांधी के दो साल पूरे; सोशल मीडिया पर... ⚖️ केतन अग्रवाल हत्याकांड: सीएम फडणवीस का सख्त रुख, उज्ज्वल निकम होंगे विशेष सरकारी वकील, फास्ट ट्रै... West Champaran News: रामगढ़वा में शादी के दौरान बड़ा हादसा; दूल्हे की अचानक मौत से पसरा सन्नाटा, बिना... Allahabad High Court News: ग्राम प्रधानों को प्रशासक बनाने के मामले में हाई कोर्ट की सख्त टिप्पणी; स... Jaisalmer News: जैसलमेर में मानवता शर्मसार; महिला को पैरों में बेड़ियां बांधकर रखा गया, DLSA ने किया ... Jaipur Crime News: जयपुर में कलयुगी बेटे का कारनामा; बुजुर्ग पिता को बेरहमी से पीटा, CCTV वीडियो हुआ... Delhi Crime News: कश्मीरी गेट ISBT पर सक्रिय था शातिर लुटेरा; नशीली फ्रूटी पिलाकर करता था लूट, गिरफ्...

Hidden Costs of AI: OpenAI और Claude पर हिंदी भाषा का पड़ता है ज्यादा असर, टोकन खर्च बढ़ने से बढ़ रहा है बिल

नई दिल्ली: यदि आप OpenAI, Anthropic या Google के AI मॉडल्स का उपयोग हिंदी या अन्य क्षेत्रीय भाषाओं में कर रहे हैं, तो सावधान हो जाएं। रिसर्चर्स के नए डेटा से पता चला है कि अंग्रेजी के अलावा अन्य भाषाओं में AI का उपयोग करना ‘छिपे हुए खर्च’ यानी ‘लैंग्वेज टैक्स’ की वजह से काफी महंगा पड़ सकता है। कंपनियां भले ही अपने मॉडल्स को सभी के लिए समान बताएं, लेकिन भाषा के आधार पर प्रोसेसिंग लागत में भारी अंतर है।

⚙️ क्यों महंगा है हिंदी में AI का उपयोग?

AI मॉडल किसी भी निर्देश (प्रॉम्प्ट) को ‘टोकन’ (Tokens) के रूप में प्रोसेस करते हैं। सरल शब्दों में, एआई सिस्टम टेक्स्ट को पढ़ने के लिए छोटी इकाइयों का उपयोग करता है। अंग्रेजी की तुलना में, हिंदी जैसे भाषाओं में शब्दों की संरचना भिन्न होने के कारण AI ज्यादा टोकन्स जेनरेट करता है। जो काम अंग्रेजी में कम टोकन्स में हो जाता है, वही हिंदी में कहने पर सिस्टम ज्यादा टोकन्स खर्च करता है, जिससे अंततः यूजर को ज्यादा पैसे चुकाने पड़ते हैं।

📉 क्या है ‘लैंग्वेज टैक्स’ का गणित?

रिसर्चर्स इसे एक ‘छिपा हुआ खर्च’ मानते हैं जो AI के टोकनाइजर (Tokenizer) की कार्यप्रणाली पर निर्भर करता है। हालिया प्रयोगों के नतीजे चौंकाने वाले हैं:

  • OpenAI के टोकेनाइज़र पर: हिंदी टेक्स्ट के लिए अंग्रेजी की तुलना में लगभग 1.37 गुना ज्यादा टोकन खर्च होते हैं।

  • Anthropic के Claude टोकेनाइजर पर: यह अंतर और भी बढ़ जाता है, जहाँ हिंदी के लिए 3.24 गुना ज्यादा टोकन की आवश्यकता होती है।

  • अन्य भाषाएं: अरबी के लिए 2.86 गुना और चीनी भाषा के लिए 1.71 गुना ज्यादा टोकन खर्च होते हैं।

💡 डेवलपर्स और यूजर्स के लिए चुनौती

यह शोध साबित करता है कि वर्तमान AI मॉडल्स अंग्रेजी-केंद्रित हैं। ‘द बिटर लेसन’ जैसे बेंचमार्क के माध्यम से यह साफ हो गया है कि भाषा की विविधता के बावजूद, तकनीक का मौजूदा ढांचा गैर-अंग्रेजी भाषी यूजर्स पर आर्थिक बोझ डाल रहा है। यदि आप भारी मात्रा में AI का उपयोग कर रहे हैं, तो यह टोकन खर्च आपके बजट को प्रभावित कर सकता है।