llms.txt फ़ाइल क्या है?
llms.txt आपके डोमेन रूट (/llms.txt) पर एक Markdown फ़ाइल है जो AI सिस्टम के लिए महत्वपूर्ण पेज और संक्षिप्त विवरण सूचीबद्ध करती है। यह पूरा साइट क्रॉल किए बिना क्यूरेटेड मानचित्र देती है। मानक llmstxt.org पर है।
अपनी वेबसाइट से AI-अनुकूलित llms.txt बनाएं। sitemap URL पेस्ट करें, डोमेन दर्ज करें या पेज सूचीबद्ध करें — बिना AI, क्रेडिट या लॉगिन।
नीचे एक इनपुट विधि चुनें। हम सार्वजनिक पेज क्रॉल करके शीर्षक और meta विवरण से वैध llms.txt बनाते हैं।
llms.txt आपकी साइट रूट (yoursite.com/llms.txt) पर एक plain-text Markdown इंडेक्स है जो AI सिस्टम के लिए महत्वपूर्ण पेज और संक्षिप्त विवरण सूचीबद्ध करता है।
यह प्रारूप 2024 में Jeremy Howard द्वारा प्रस्तावित था और llmstxt.org पर दस्तावेज़ित है। यह समुदाय सम्मेलन है, आधिकारिक मानक नहीं, पर अपनाया जा रहा है।
इसे भाषा मॉडल के लिए क्यूरेटेड रीडिंग लिस्ट समझें: H1 शीर्षक, blockquote सारांश, और H2 सेक्शन में Markdown लिंक। यह sitemap.xml और robots.txt की पूरक है।
वैध llms.txt llmstxt.org पर परिभाषित सरल Markdown लेआउट का पालन करता है:
पूर्ण URL अनुशंसित। text/plain या text/markdown के रूप में सर्व करें।
ये तीन रूट फ़ाइलें अलग दर्शकों के लिए हैं। तीनों प्रकाशित करना सामान्य है।
llms.txtrobots.txtsitemap.xmlप्रकाशन से पहले यथार्थवादी अपेक्षाएँ रखें। llms.txt सस्ता है पर बड़े AI उत्पादों में अपनाना विकसित हो रहा है।
बड़ी साइटों के लिए sitemap URL, छोटी के लिए होमपेज URL, या विशिष्ट URL पेस्ट करें। पूर्वावलोकन देखें, डाउनलोड करें, डोमेन रूट पर अपलोड करें।
llms.txt पर सीधे उत्तर — लंबी-पूँछ SEO और AI-उद्धरण योग्य Q&A के लिए।
llms.txt आपके डोमेन रूट (/llms.txt) पर एक Markdown फ़ाइल है जो AI सिस्टम के लिए महत्वपूर्ण पेज और संक्षिप्त विवरण सूचीबद्ध करती है। यह पूरा साइट क्रॉल किए बिना क्यूरेटेड मानचित्र देती है। मानक llmstxt.org पर है।
हाँ — 100% मुफ्त, बिना साइनअप, क्रेडिट या लॉगिन। हम सार्वजनिक पेज क्रॉल कर HTML शीर्षक और meta विवरण से फ़ाइल बनाते हैं, AI का उपयोग नहीं। तुरंत कॉपी या डाउनलोड करें।
डोमेन रूट पर अपलोड करें ताकि https://yourdomain.com/llms.txt पर उपलब्ध हो। कुछ साइटें /docs/llms.txt उपयोग करती हैं, पर रूट सबसे आम है।
llms.txt संक्षिप्त विवरण के साथ क्यूरेटेड लिंक इंडेक्स है — ज्यादातर साइटों को यही चाहिए। llms-full.txt पूर्ण पेज टेक्स्ट inline करता है और बहुत बड़ा हो सकता है।
नहीं — यह Google रैंकिंग कारक नहीं है और Google खोज इंडेक्सिंग में इसका उपयोग नहीं करता। मूल्य AI टूलिंग और कोडिंग असिस्टेंट में है। SEO के लिए sitemap, meta और कंटेंट पर ध्यान दें।
कोई बड़ा AI प्रदाता production में llms.txt उपयोग की आधिकारिक प्रतिबद्धता नहीं देता। अपनाना अनिश्चित है, कुछ क्रॉलर कभी-कभी /llms.txt फेच करते हैं। सबसे स्पष्ट उपयोग: कोडिंग असिस्टेंट।
नहीं — यह समावेश और क्यूरेशन फ़ाइल है, ब्लॉकिंग नहीं। GPTBot या ClaudeBot सीमित करने के लिए robots.txt और opt-out दस्तावेज़ उपयोग करें।
सर्वर लॉग में /llms.txt अनुरोध फ़िल्टर करें और User-Agent देखें। GPTBot, ClaudeBot, PerplexityBot, Google-Extended खोजें। एक बार फेच निरंतर उपयोग नहीं दर्शाता।
हर URL सूचीबद्ध करने के बजाय सर्वोत्तम पेज चुनें। ~150K शब्द या ~700KB से काफी नीचे रहें। गुणवत्ता विशाल डंप से बेहतर है।
आमतौर पर नहीं — इंडेक्स होने योग्य .md मिरर से डुप्लिकेट कंटेंट समस्या हो सकती है। canonical URL लिंक और विवरण पर्याप्त हैं।
महत्वपूर्ण पेज जोड़ने, हटाने या बदलने पर अपडेट करें। सक्रिय साइटों के लिए मासिक या प्रत्येक deploy पर sitemap से पुनर्जनन करें।
नहीं। जेनरेटर सार्वजनिक HTML क्रॉल कर programmatically शीर्षक, विवरण और URL संरचना निकालता है। कुछ भी Gemini या अन्य मॉडल को नहीं भेजा जाता।
बड़ी साइटों और ब्लॉग के लिए sitemap URL। छोटी साइटों के लिए होमपेज URL। चुनिंदा पेज के लिए URL पेस्ट करें।
कुछ साइटें bot सुरक्षा, Cloudflare या WAF से स्वचालित अनुरोध ब्लॉक करती हैं। URL मैन्युअल पेस्ट करें या सार्वजनिक sitemap उपयोग करें।