بعد از اینکه سایتتان را ساختید، باید به رباتهای گوگل و دیگر موتورهای جستجو اعلام کنید کدام صفحات سایتتان را کرال (crawl ) کنند و کدام را نکنند. برای این منظور فایل robots.txt را میسازیم. از آنجا که این فایل راهنمای رباتهای موتورهای جستجوست، از نظر سئو سایت نیز تأثیر بسیار زیادی بر نحوه ایندکس شدن سایت خواهد گذاشت. در این مطلب با نحوه عملکرد فایل robots.txt، نحوه ساخت، بهینهسازی و معرفی آن به گوگل آشنا خواهید شد.
تنها افراد عادی نیستند که به سایت شما سر میزنند؛ بلکه رباتهای گوگل نیز در دورههای زمانی مختلف از سایت شما بازدید میکنند و به این کار Crawl گفته میشود. بازدید رباتهای گوگل از سایت شما به دلیل یافتن صفحات جدید یا ایندکس کردن صفحات سایت انجام میشود.فایل robots.txt یک فایل متنی است که نحوه کراول کردن رباتها و ایندکس کردن صفحات در سایت را مشخص میکند؛ یعنی به طور کلی، به رباتهای گوگل برای سر زدن و گردش در سایت راهنمایی میرساند. فایل robots.txt از پروتکل REF یا Robots Exclusion Protocol تشکیل میشود که لینکهای فالو و نوفالو هم جزء همین پروتکل هستند. این فایل توسط وبمسترها برای رباتهای گوگل ساخته میشوند تا از طریق آن به رباتها دستور دهند کدام صفحات سایت را کراول یا ایندکس کنند و کدام صفحات را خیر؛ بنابراین اگر بهعنوان یک متخصص سئو، وبمستر یا مدیر سایت فعالیت میکنید، در ادامه این مقاله جزئیات بیشتری درباره نحوه استفاده از این فایل را در اختیار شما میگذاریم.
موتورهای جستجو دو وظیفه اصلی دارند:
• وبسایت را برای دیسکاور کردن محتوا کرال میکنند.
• این محتوا را ایندکس میکنند تا در اختیار کاربرانی که به دنبال اطلاعات هستند قرار بگیرد.
برای کرال کردن سایتها، موتورهای جستجو لینکها را دنبال میکنند تا از یک سایت به سایت دیگر بروند. در نهایت، از طریق میلیاردها لینک وبسایت کرال میشوند. این شکل از کرال کردن، حالت عنکبوتی دارد. پس از ورود به یک وبسایت، ربات گوگل به دنبال یک فایل robots.txt میگردد. اگر بتواند آن را پیدا کند، قبل از ادامه کرال صفحه ابتدا آن فایل را میخواند. از آنجا که فایل robots.txt حاوی اطلاعاتی درباره چگونگی خزیدن موتور جستجو است، اطلاعات موجود در این فایل، دستورالعملهای بیشتری را در اختیار ربات خزنده قرار میدهد. اگر فایل robots.txt فاقد دستورالعملهایی باشد که فعالیت user-agent را مجاز نمیداند (یا مثلا اگر سایت، فایل robots.txt نداشته باشد)، به جستجوی سایر اطلاعات در سایت ادامه میدهد.
نتیجه گیری:
اگر فایل Robots.txt خود را به درستی راه اندازی کنید، می توانید فرآیند ایندکسینک سایت خود را بهبود ببخشید .وقتی موتورهای جستجو بهینه تر بودجه خزش شما را مصرف کنند، تغییرات محتوایی شما سریعتر توسط گوگل دیده می شود. همچنین ایجاد فایل Robots.txt کار چندانی نیست. این یک تنظیم یک بار است که می توانید با توجه به نیاز خود آن را سفارشی کنید.