Ara

Web Siteniz İçin Robots.Txt Dosyası Nasıl Hazırlanır?

Web siteleri için arama motorlarıyla etkileşim oldukça önemlidir. Arama motorları, sitenizdeki içeriği keşfetmek ve indekslemek için "web crawler" adı verilen botları kullanır. Ancak, bazı sayfaların veya bölümlerin taranmasını engellemek isteyebilirsiniz. İşte burada, robots.txt dosyası devreye girer. Bu makalede, robots.txt dosyasının nasıl olması gerektiğini ve güvenlik açısından dikkat edilmesi gerekenleri ayrıntılı bir şekilde ele alacağız.

 

robots.txt Dosyası Nedir?

robots.txt dosyası, web sitenizin kök dizininde bulunan ve arama motoru botlarına hangi sayfaları tarayıp hangi sayfaları taramayacaklarını bildiren basit bir metin dosyasıdır. Bu dosya, sitenizi ziyaret eden arama motoru botlarına rehberlik eder.

 

robots.txt Dosyasının Yapısı

robots.txt dosyasının temel yapısı oldukça basittir. Temel komutlar şunlardır:

  • User-agent: Hangi botlara bu kuralların uygulanacağını belirtir.
  • Disallow: Botların erişimini engellemek istediğiniz sayfaları belirtir.
  • Allow: (Opsiyonel) Botların erişimine izin vermek istediğiniz sayfaları belirtir.
  • Sitemap: (Opsiyonel) Sitenizin sitemap dosyasının yolunu belirtir.

 

Örnek Bir robots.txt Dosyası

User-agent: *
Disallow: /admin/
Disallow: /login/
Allow: /public/

Sitemap: http://www.example.com/sitemap.xml

Bu örnekte, tüm botlara (User-agent: *) yönetici paneline (/admin/) ve giriş sayfasına (/login/) erişim engellenmiş, ancak genel erişime açık sayfalara (/public/) izin verilmiştir. Ayrıca, sitemap dosyasının yolu belirtilmiştir.

 

Güvenlik Açısından Dikkat Edilmesi Gerekenler

robots.txt dosyasının güvenlik açısından dikkat edilmesi gereken bazı önemli noktaları vardır:

  1. Hassas Bilgileri Gizlemeyin: robots.txt dosyasına hassas bilgileri (örneğin, gizli sayfaların yolları) eklemek, kötü niyetli kullanıcılar için bu bilgileri ortaya çıkarabilir. Çünkü robots.txt dosyası herkese açıktır.
  2. Disallow Komutunu Akıllıca Kullanın: Yönetici panelleri, kullanıcı hesapları ve diğer kritik sayfaların indekslenmesini engellemek için Disallow komutunu kullanın.
  3. Sitemap Kullanımı: Sitemap dosyasını belirtmek, arama motorlarının sitenizi daha verimli bir şekilde taramasına yardımcı olur. Bu da SEO performansınızı artırır.
  4. User-agent Spesifik Kurallar: Belirli botlar için özel kurallar belirleyerek, önemli botların (örneğin, Googlebot) sitenizi daha iyi taramasını sağlayabilirsiniz.

Author

Bilgisayar programcılığı bölümü mezunuyum. Web ve masaüstü uygulama geliştiricisiyim. C#,.Asp.Net Core, JQuery, Ajax, Entity Framework konularında bilgi sahibiyim. Bu sitenin kurucusuyum . Aynı zamanda şiir yazmayı seven birisiyim. 2023 yılında "Gökkuşağının Koyu Tonu" adlı ilk şiir kitabım yayınlandı. Yazmaya devam ediyorum.
Yorum Yap
Yorumlar (0)