Facebook krizinin şifreleri... İnternete en hızlı yoldan gitmenin yolu BGP sistemi nedir?

Kısa sosyal medya tarihinin en büyük erişim krizi dün akşam Facebook'ta yaşandı. Instagram ve WhatsApp da çökerken sıkıntı, sitelerin en hızlı şekilde internete veri aktarmasını sağlayan BGP sistemi üzerinde gerçekleşti. BGP nedir? Facebook nasıl bu felaketi öngöremedi?

Son Güncelleme:

Türkiye saati ile saat 18:40’tan itibaren Facebook, WhatsApp ve Instagram’a erişim sorunu yaşanmaya başladı. Facebook kısa bir süre sonra sorunun farkında olduğunu söyleyip, ‘bazı’ kullanıcıların etkilendiğini ifade etti. Bir süre sonra ortaya çıktı ki bu ‘bazı’ kullanıcılar bütün dünyaydı.

Kesinti 6 saat kadar sürerken Silikon Vadisi'nde bilgi teknolojileri sektöründe çalışanlar sorunun Facebook’un BGP (Border Gateway Protocol) sisteminden kaynaklandığını anladı. BGP bir sitenin internete en hızlı yoldan data göndermesinin yoluna verilen isim.

BİR HARİTA GİBİ DÜŞÜNÜN

Bu sisteme ihtiyaç duyuluyor çünkü bir sitenin internete veri göndermesi için birçok internet sağlayıcı, omurga yönlendirici, ve sunucu bulunuyor. BGP’nin işi ise internet sitesine en hızlı yoldan hangi şekilde internete data ulaştırabileceğini göstermek. Bu sistem internet sitesi adminleri için bir haritaya benzetilebilir. BGP internete en hızlı şekilde ulaşılmasını sağlayan bir harita.

İnternet sürekli olarak değişen bir yapı olduğu için bu BGP yollarının da güncellenmesi gerekiyor ve Facebook'un da bunu yaptığı düşünülüyor.

EKİPLER ARASI İLETİŞİM KOPUKLUĞU?

Facebook’un mühendislik ekibi dün akşam yaptığı açıklamada aksaklık teknik olarak şöyle açıklandı: Omurga yönlendiricinde (backbone routers) yapılan ayar değişiklikleri ağ trafiğimiz ve veri merkezimiz arasındaki durumu koordine ediyordu. Burada yapılan değişiklik data merkezi ile iletişimi kopardı.

Bu açıklama Facebook’un farklı ekipleri arasındaki iletişim kopukluğu sebebiyle sitenin çöktüğünü düşündürtüyor. Çünkü bu çapta bir güncellemede sitenin kapanmaması için gereken önlemler alınır veya önden kullanıcılara bunun duyurusu yapılır.

BİR KALE HENDEK ETRAFINDAKİ KÖPRÜSÜNÜ ÇEKTİ

Facebook, BGP sisteminde yaşanan aksaklık ile internete ‘kapalıyım’ mesajı gönderdi. Şöyle düşünebilirsiniz; etrafında hendek olan bir kale köprüsünü kaldırarak dış dünya ile bağlantısını kopardı. Facebook’un BGP sisteminde olan bu aksaklık yüzünden WhatsApp ve Instagram’a da erişim sağlanamadı. BGP sunucuları geri çekildikten kısa bir süre sonra kullanıcılar durumu fark etti.

Kullanıcılar baştan bunun bir DNS hatası olabileceğini düşündü. Latin harfleri ile girilen internet sitesi adreslerini arka planda bilgisayarın okuyabileceği IP adresine dönüştüren sistemin hata verdiğine yönelik izler vardı.

(DNS ayarları bir bilgisayara hangi internet adresine gideceğini söyler, BGP ise nasıl gideceğini anlatır.)

BGP hatlarının neden çalışmadığı tam olarak bilinmiyor. Tek ortaya çıkan nokta, bu hatlar üzerinde yapılan güncellemenin bir felaketle sonuçlanmış olabileceği. Bir Facebook mühendisinin daha sonra sildiği sosyal medya paylaşımına göre BGP hatlarında yapılan güncellemenin ardından bir internet sitesinin kendine gelmesi birkaç saat alabiliyor. Şimdi asıl soru bu güncelleme yapılırken sitenin bu hale gelip gelmeyeceğinin Facebook tarafından hesaplanıp hesaplanmadığı.

İnternet siteleri normal koşullarda DNS kayıtlarını her birkaç saatte bir günceller. Fakat tam bir güncelleme günler sürebilir. Cloudflare CTO’su dün akşam Facebook’un çok sayıda BGP güncellemesi yaptığını duyurdu.

Daha önceki yıllarda da ağ güncellemeleri internette büyük olaylara sebep olmuştu. 2004 yılında Türkiye çapında internet gitmiş, Pakistan, Youtube’u sadece kendi ülkesi için yasaklamak isterken bütün dünyada erişim engellenmişti.

Özet: Bir sebeple Facebook serverları, internete bağlanmak için elindeki haritaları (BGP) kullanmadı. Facebook konuyla ilgili olarak detaylı bir açıklama yapacaktır.

SORUN NASIL DÜZELDİ?

6 saat süren kriz kolay çözülmedi. Öncelikle şirkette öyle bir an geldi ki çalışanlar kartlarının okuduğu kapılardan bile geçemedi ve ekiplerin birbiri ile ilişki kuramadığı anlar oldu. Böyle bir anda kimin sorunu çözecek bilgisi olduğu, kimin bunu çözmeye yetkili olduğu ve bu insanlara nasıl ulaşılacağı büyük bir problem. Sorunun BGP güncellemelerin tamamlanması sonucunda düzeldiği düşünülüyor.

Eski bir data mühendisi Frances Haugen, Facebook’un bütün sırlarını dünyaya dökerken şirketin aynı zamanda büyük bir teknoloji krizi yaşaması enteresan bir zamana denk geldi.

Kaynaklar: Tech Crunch, Cloudflare, Verge

Kaynak: Web Özel

Sonraki Haber