Web siteleri için arama motorlarıyla etkileşim oldukça önemlidir. Arama motorları, sitenizdeki içeriği keşfetmek ve indekslemek için "web crawler" adı verilen botları kullanır. Ancak, bazı sayfaların veya bölümlerin taranmasını engellemek isteyebilirsiniz. İşte burada, robots.txt dosyası devreye girer. Bu makalede, robots.txt dosyasının nasıl olması gerektiğini ve güvenlik açısından dikkat edilmesi gerekenleri ayrıntılı bir şekilde ele alacağız.
robots.txt Dosyası Nedir?
robots.txt dosyası, web sitenizin kök dizininde bulunan ve arama motoru botlarına hangi sayfaları tarayıp hangi sayfaları taramayacaklarını bildiren basit bir metin dosyasıdır. Bu dosya, sitenizi ziyaret eden arama motoru botlarına rehberlik eder.
robots.txt Dosyasının Yapısı
robots.txt dosyasının temel yapısı oldukça basittir. Temel komutlar şunlardır:
User-agent
: Hangi botlara bu kuralların uygulanacağını belirtir.Disallow
: Botların erişimini engellemek istediğiniz sayfaları belirtir.Allow
: (Opsiyonel) Botların erişimine izin vermek istediğiniz sayfaları belirtir.Sitemap
: (Opsiyonel) Sitenizin sitemap dosyasının yolunu belirtir.
Örnek Bir robots.txt Dosyası
User-agent: *
Disallow: /admin/
Disallow: /login/
Allow: /public/
Sitemap: http://www.example.com/sitemap.xml
Bu örnekte, tüm botlara (User-agent: *
) yönetici paneline (/admin/
) ve giriş sayfasına (/login/
) erişim engellenmiş, ancak genel erişime açık sayfalara (/public/
) izin verilmiştir. Ayrıca, sitemap dosyasının yolu belirtilmiştir.
Güvenlik Açısından Dikkat Edilmesi Gerekenler
robots.txt dosyasının güvenlik açısından dikkat edilmesi gereken bazı önemli noktaları vardır:
- Hassas Bilgileri Gizlemeyin: robots.txt dosyasına hassas bilgileri (örneğin, gizli sayfaların yolları) eklemek, kötü niyetli kullanıcılar için bu bilgileri ortaya çıkarabilir. Çünkü robots.txt dosyası herkese açıktır.
- Disallow Komutunu Akıllıca Kullanın: Yönetici panelleri, kullanıcı hesapları ve diğer kritik sayfaların indekslenmesini engellemek için
Disallow
komutunu kullanın. - Sitemap Kullanımı: Sitemap dosyasını belirtmek, arama motorlarının sitenizi daha verimli bir şekilde taramasına yardımcı olur. Bu da SEO performansınızı artırır.
- User-agent Spesifik Kurallar: Belirli botlar için özel kurallar belirleyerek, önemli botların (örneğin, Googlebot) sitenizi daha iyi taramasını sağlayabilirsiniz.
Yorum Yap