Hizmetler Hosting & Sunucu Araçlar Blog Ara Kurumsal EnglishEN
Teklif Alın

XML Sitemap Nedir?

XML sitemap (site haritası), bir web sitesindeki sayfaların adreslerini arama motorlarına bildiren, XML formatında yazılmış bir dosyadır. Amacı basittir: sitenizde hangi sayfaların bulunduğunu, mümkünse ne zaman güncellendiğini arama motoru botlarına doğrudan söylemek. Bu, özellikle iç bağlantı yapısı zayıf olan, yeni yayınlanmış veya çok sayıda sayfası bulunan sitelerde botların sayfaları keşfetmesini kolaylaştırır.

Sitemap bir sayfanın sıralamasını yükseltmez; sadece keşfedilmesine ve taranmasına yardımcı olur. Sayfanın arama sonuçlarında nasıl performans göstereceği içerik kalitesi, bağlantılar ve teknik SEO'nun bütünüyle ilgilidir.

Hangi Siteler Sitemap'ten Daha Çok Fayda Görür?

İç bağlantı yapısı zayıf olan, çok sayıda ürün veya kategori sayfası barındıran e-ticaret siteleri, içeriğini JavaScript ile render eden tek sayfa uygulamaları (SPA) ve henüz dışarıdan az bağlantı almış yeni siteler, sitemap'ten en çok fayda gören site tipleridir. Botlar bu tür sitelerde sayfaları yalnızca iç bağlantılar üzerinden keşfetmekte zorlanabilir; sitemap bu keşfi doğrudan ve güvenilir hale getirir. Küçük, birkaç sayfalık ve güçlü iç bağlantı yapısına sahip bir kurumsal sitede ise sitemap'in etkisi daha sınırlıdır.

Sitemap ile robots.txt Arasındaki Fark

robots.txt ve sitemap.xml genelde birlikte anılır ama işlevleri tam tersidir. robots.txt botlara nereye girmemesi gerektiğini söyler; sitemap.xml ise botlara nereye bakmaları gerektiğini önerir. İkisi çelişmemelidir: sitemap'e eklediğiniz bir URL robots.txt tarafından Disallow edilmişse, bot o adresi sitemap'te görse bile taramaz.

Sitemap Protokolü ve Dosya Yapısı

Sitemap dosyaları Sitemap Protokolü 0.9'a göre yazılır — http://www.sitemaps.org/schemas/sitemap/0.9 XML şemasını kullanan, Google, Bing ve diğer büyük arama motorlarının ortak kabul ettiği standart bir format. Dosya bir <urlset> kök öğesi içinde, her sayfa için bir <url> bloğundan oluşur:

  • <loc>: Sayfanın mutlak (tam) URL'i. Tek zorunlu alandır.
  • <lastmod>: Sayfanın en son güncellenme tarihi (YYYY-AA-GG). Doğru ve güncel girildiğinde crawler'ların değişen sayfaları yeniden taramaya öncelik vermesine yardımcı olur.
  • <changefreq>: Sayfanın tahmini değişim sıklığı (always, hourly, daily, weekly, monthly, yearly, never).
  • <priority>: 0.0 ile 1.0 arasında, sitenin kendi sayfaları arasındaki göreli önceliğini belirten bir öneri değeri.

priority ve changefreq Gerçekten İşe Yarıyor mu?

Google, priority ve changefreq değerlerinin modern indeksleme sürecinde büyük ölçüde göz ardı edildiğini kamuya açık şekilde belirtmiştir; bu alanlar bir taahhüt değil, öneri niteliğindedir. Buna karşılık doğru girilen lastmod değeri gerçekten işe yarar. Bu yüzden sitemap hazırlarken enerjinizi büyük ölçüde lastmod'u doğru tutmaya, geri kalan iki alanı ise makul varsayılan değerlerde bırakmaya harcamak daha isabetlidir.

Yine de changefreq değerini rastgele seçmek yerine sayfanın gerçek güncelleme sıklığına yaklaştırmak, hem dosyanın anlamlı kalmasını sağlar hem de ileride sitemap'i gözden geçirirken hangi sayfa grubunun ne sıklıkta değiştiğini hatırlamanızı kolaylaştırır:

changefreq değeriTipik kullanım alanı
alwaysSürekli güncellenen canlı veri sayfaları
hourlyHaber sitesi anasayfası
dailyBlog anasayfası, sık güncellenen listeleme sayfaları
weeklyDüzenli yayınlanan blog yazıları
monthlyKurumsal sayfalar, kategori sayfaları
yearlyHakkımızda, iletişim gibi nadiren değişen sayfalar
neverArşivlenmiş, artık güncellenmeyecek içerik

Sitemap Boyut Sınırları ve Sitemap Index

Tek bir sitemap dosyası en fazla 50.000 URL ve 50 MB (sıkıştırılmamış) içerebilir. Bu sınırı aşan büyük sitelerde, birden fazla sitemap dosyasına işaret eden bir sitemap index dosyası (<sitemapindex>) kullanılır. Küçük ve orta ölçekli siteler için tek bir sitemap.xml genelde yeterlidir.

Sitemap index dosyasının yapısı, tek tek sitemap dosyalarına çok benzer; sadece <url> yerine <sitemap> girdileri içerir:

  • <sitemapindex>: Kök öğe, tüm sitemap referanslarını sarmalar.
  • <sitemap>: Her bir alt sitemap dosyası için ayrı bir blok.
  • <loc>: İlgili alt sitemap dosyasının tam adresi.
İpucu
Binlerce sayfalık bir sitede sitemap'i kategori, ürün veya blog gibi bölümlere ayırıp ayrı dosyalar halinde tutmak, hem sınırları aşmamayı hem de hangi bölümün ne kadar iyi tarandığını takip etmeyi kolaylaştırır.

Sitemap Dosyasını Yayınlama ve Search Console'a Gönderme

Dosyayı oluşturduktan sonra sitenizin kök dizinine yükleyin, örneğin https://example.com/sitemap.xml. Ardından iki adımı tamamlayın:

  • robots.txt dosyanıza Sitemap: https://example.com/sitemap.xml satırını ekleyin; bu, sitemap'in botlar tarafından otomatik keşfedilmesini kolaylaştırır.
  • Google Search Console üzerinden sitemap'i doğrudan gönderin; bu, ilk keşfi ve indekslemeyi hızlandırabilir.

Hangi Sayfalar Sitemap'e Dahil Edilmeli?

Sitemap'e yalnızca kurallı (canonical), indekslenebilir ve 200 durum koduyla erişilebilen sayfaları eklemek gerekir. Yönlendirme yapan URL'ler, 404 döndüren bağlantılar, noindex etiketli sayfalar ve parametre farklarından doğan yinelenen (duplicate) URL'ler sitemap'te yer almamalıdır; bunlar botun zamanını gereksiz sayfalara harcamasına yol açar ve sitemap'in güvenilirliğini azaltır.

Sık Yapılan Sitemap Hataları

  • Sitemap'e yönlendirme (redirect) yapan, hataya düşen (404) veya noindex etiketli sayfaları dahil etmek.
  • <loc> alanına göreli yol yazmak; bu alan mutlaka mutlak (http:// veya https:// ile başlayan) bir URL olmalıdır.
  • Sitemap'i güncel tutmamak — yeni sayfalar eklenip eskiler kaldırıldığında dosyayı yeniden üretmemek.
  • 50.000 URL sınırını aşan bir siteyi tek dosyada toplamaya çalışmak.

XML Sitemap Oluşturucu ile Hızlıca Hazırlayın

Sitemap'i elle XML olarak yazmak hem zaman alır hem de küçük bir sözdizimi hatası tüm dosyayı geçersiz kılabilir. KEYDAL'ın XML sitemap oluşturucusu, düz bir URL listesini (her satırda bir tane) alıp changefreq, priority ve lastmod seçenekleriyle geçerli bir sitemap.xml çıktısı üretir. Araç girilen her satırı doğrular, http:// veya https:// ile başlamayan geçersiz satırları ayrı gösterir ve tamamen tarayıcınızda çalışır.

Dosyayı yayınladıktan sonra Search Console'daki Sitemap'ler raporunda gönderilen URL sayısını, taranan ve indekslenen sayfa sayısıyla karşılaştırarak sitenizin ne kadarının keşfedildiğini zaman içinde takip edebilirsiniz.

WhatsApp