search engine internet खोज इंजन कहां रेंगते हैं?



search engine name (3)

खोज इंजन बॉट्स शुरुआती बिंदु के रूप में क्या इस्तेमाल करते हैं? क्या यह डीएनएस लुक अप है या क्या वे अच्छी तरह से जानी जाने वाली साइटों की कुछ निश्चित सूची से शुरू करते हैं? कोई अनुमान या सुझाव?


Answer #1

सिद्धांत रूप में वे कुछ नहीं से शुरू करते हैं तभी जब कोई व्यक्ति उन्हें अपनी वेबसाइट को शामिल करने के लिए स्पष्ट रूप से बताता है तो वे इस साइट को क्रॉल करना शुरू कर सकते हैं और उस साइट के लिंक को अधिक खोज करने के लिए उपयोग कर सकते हैं

हालांकि, व्यवहार में सर्च इंजन के निर्माता (ओं) को कुछ मनमानी साइटों में रखा जाएगा जो वे सोच सकते हैं। उदाहरण के लिए, अपने स्वयं के ब्लॉग्ज या उनके बुकमार्क में साइटें

सिद्धांत में एक भी कुछ यादृच्छिक अनुरागों को भी चुन सकता है और देख सकता है कि वहां कोई वेबसाइट है या नहीं। मुझे संदेह है कि ये कोई भी करता है; उपरोक्त विधि सिर्फ ठीक काम करेगी और बस खोज इंजन को बूटस्ट्रैप करने के लिए अतिरिक्त कोडिंग की आवश्यकता नहीं है।


Answer #2

आपका प्रश्न दो तरीकों से व्याख्या किया जा सकता है:

क्या आप पूछ रहे हैं कि जहां खोज इंजन सामान्य से अपनी क्रॉल शुरू करते हैं, या जहां वे किसी विशेष साइट को क्रॉल करते हैं?

मुझे नहीं पता कि बड़े खिलाड़ी कैसे काम करते हैं; लेकिन अगर आप अपना स्वयं का खोज इंजन बनाते हैं तो आप इसे लोकप्रिय पोर्टल साइट्स के साथ बीज देंगे। DMOZ.org एक लोकप्रिय प्रारंभिक बिंदु है। चूंकि बड़े खिलाड़ियों के पास इतना अधिक डेटा है जितना हम करते हैं वे शायद विभिन्न स्थानों से अपनी क्रॉल शुरू करते हैं

यदि आप पूछ रहे हैं कि एक एसई आपकी विशेष साइट को क्रॉल करने के लिए कहां शुरू कर रहा है, तो संभवत: आपके पृष्ठों में से कौन सा सबसे लोकप्रिय हैं मैं सोचता हूं कि यदि आपके पास एक सुपर लोकप्रिय पृष्ठ है जो बहुत से अन्य साइटें लिंक करते हैं, तो वह ऐसा पृष्ठ होगा जो एसई शुरू हो जाएंगे क्योंकि अन्य साइटों से बहुत अधिक प्रविष्टि बिंदु हैं

ध्यान दें कि मैं एसईओ या कुछ भी नहीं हूं; मैंने अभी एक परियोजना के लिए थोड़ी देर के लिए बॉट और एसई यातायात का अध्ययन किया था।


Answer #3

आप अपनी साइट को अपने साइट सबमिशन फॉर्म का उपयोग करके खोज इंजन में सबमिट कर सकते हैं - यह आपको अपने सिस्टम में मिल जाएगा। जब आप वास्तव में क्रॉल हो जाते हैं, तो यह कहना असंभव है - अनुभव से यह आमतौर पर एक सप्ताह के प्रारंभिक क्रॉल के लिए होता है (होमपेज, दूसरे पृष्ठ 1-लिंक से जुड़ा हुआ है)। आप अपने पृष्ठों के कितने पदों को क्रॉल और अनुक्रमित कर सकते हैं, स्पष्ट शब्दावली लिंक संरचना का प्रयोग करके और साइटमैप सबमिट करना - ये आपको अपने सभी पृष्ठों को सूचीबद्ध करने की अनुमति देता है, और उन्हें एक दूसरे के सापेक्ष भारोत्तोलन करता है, जो खोज इंजन को समझने में मदद करता है कि आप कितने महत्वपूर्ण हैं साइट के प्रत्येक भाग दूसरों के सापेक्ष

यदि आपकी साइट को अन्य क्रॉल किए गए वेबसाइटों से लिंक किया गया है, तो आपकी साइट को क्रॉल किया जाएगा, पृष्ठ से लिंक किया जाएगा, और अंत में आपकी शेष साइट पर फैल जाएगा। यह एक लंबा समय ले सकता है, और लिंकिंग साइटों की क्रॉल आवृत्ति पर निर्भर करता है, इसलिए यूआरएल सबमिशन Google को आपके बारे में जाने का सबसे तेज़ तरीका है!

एक उपकरण जो मैं अत्यधिक पर्याप्त नहीं सुझा सकता है वह Google वेबमास्टर टूल है यह आपको यह देखने की अनुमति देता है कि आप कितनी बार क्रॉल कर चुके हैं, googlebot (टूटी हुई लिंक, आदि) में किसी भी त्रुटियों को ठोकर खाई है और इसमें कई अन्य उपयोगी उपकरण हैं





search-engine