Bu yazımızda, depolama birimleri hakkında bilgi edinmemizde yardımcı olan S.M.A.R.T. verileri nedir ve ne işe yarar detaylıca değiniyoruz.
Bildiğiniz üzere her elektronik cihazda olduğu gibi depolama birimlerinin de belirli bir ömrü ve kullanım aralığı bulunuyor. Birçoğumuzun muzdarip olduğu aniden bozulmalara karşı geliştirilen S.M.A.R.T. (Self-Monitoring, analysis and Reporting Technology / Kendini İzleme, Analiz ve Raporlama Teknolojisi) ile sabit disk veya katı hal sürücümüzün (SSD) ömrünü, sağlık durumunu ve hatalarını kolayca öğrenebiliyoruz. Bu sayede diskler daha ömrünü doldurmadan hemen öncesindeyken, değerli verilerimizi yedekleme fırsatımız oluyor.
Hem sistem yöneticileri için hem de normal kullanıcılar için disk sağlığının kolay raporlanması oldukça önem arz ediyor zira teknolojik aletlerin ne zaman ömrünün dolduğunu bilmek olası kayıpları engelleyebilmemizi sağlamakta. Yerleşik bir raporlama teknolojisinin olmaması durumunda bu sürücülerin sağlığının izlenmesi maalesef çok zor hale geliyor. Depolama sürücülerinin sağlığının ne kadar kaldığına dair veriler geleneksel sistemlerde daha çok firmware üzerindeki belirli eşiklerin aşılması durumunda ortaya çıkıyor.
S.M.A.R.T. ise katı hal sürücülerinin çıkışından yıllar yıllar öncesinde sabit diskler ile birlikte teknoloji dünyasına adım atmış bir raporlama sistemi. S.M.A.R.T. verilerinin değerlendirilmesindeki ana kıstas ise ne yazık ki günümüzde bir standarda bağlanmadı. Yani hangi S.M.A.R.T. raporlama yapısının sürücüdeki ne kadar fiziksel değişikliği ifade ettiği, öznitelikleri net hatlarla belirtilmiş değil. Her üretici ürettiği disklere kendi uygun raporlama teknolojisini yerleştirmekte. Bu nedenle çeşitli depolama birimlerinin, SSD veya HDD’lerin üreticilerine bağlı olarak raporlama şekli değişebilir. Ama yine de temelde S.M.A.R.T. teknolojisi, kullanıcıya sağlık verilerini rapor ederek diskteki verilerin kurtarılmasına yardımcı oluyor.
Genel itibariyle bu raporlara erişebilmek için üçüncü parti yazılımlardan yararlanılır. Bunlar sürücüyü üreten firmanın sağlamış olduğu yazılımlar olabileceği gibi, bağımsız geliştiriciler tarafından da yazılan programlar olabilir. Bazı üçüncü parti raporlama yazılımlar aracılığıyla elde edilen bilgiler hatalı da olabilir zira bir önceki paragrafta bahsetmiş olduğumuz gibi S.M.A.R.T. teknolojisinin veri değerlendirmesi, öznitelikleri ve eşikleri net bir standarda sahip değil. Donanımı üreten firmanın yazılım geliştiriciye doğru raporlama için gereken bilgileri sunmaması durumunda alınan sonuçlar hatalı olabilmekte. Örneğin gerçekte diskinizde az sayıda hata var diyelim. Uyumsuz bir yazılımla bunu kontrol ettiğinizdeyse bu hata değerleri olması gerekenden daha yüksek veya daha alçak çıkabilir. Bu nedenle depolama birimlerinizi kontrol ederken üretici firmanın sağlamış olduğu yazılımları kullanmanızı öneririz.
S.M.A.R.T. Tarafından Raporlanan Hatalar Nedir?
Bu yazımız sadece teorik olarak S.M.A.R.T.’ın ne olduğuna elbette değinmekle kalmayacak. Raporlanan değerler, öznitelikler çeşitli anlamlar ifade etmekte. Genelde raporlanan değerlerin yanında bir sayı bulunur. Bu kimi zaman kullanım ömrünü, kimi zaman da hatalara dair bizlere ufak bilgiler verir. Fazla uzatmadan bu özniteliklere değinmeye başlayalım.
Percentage Lifetime Used: Yaşam Süresinin Yüzdelik Kullanım Oranı
Adından da anlaşılabileceği gibi “Percentage Lifetime Used” değeri, bir sürücünün yaşam döngüsünün belirli zaman dilimi içerisinde ne kadar kullanıldığını ifade eder. Yeni bir SSD aldığınızda “Percentage Lifetime Used” 0 iken, ömrünün sonuna geldiğinde veya ömrünün bitmesine az kala 100 değerine ulaşacaktır. Yine de bu değer kesinlik ifade etmez. 100’ü aşsa bile bir süre daha diskiniz çalışmaya devam edebilir. Bu sadece katı hal sürücünüzü değiştirmeniz için bir uyarıdır. Burada üçüncü parti yazılımların bu veriyi tam tersi şekilde raproladığını da belirtelim. Örğenğin CrystalDiskInfo’da bu değer %100 olarak başlayıp disk kullanıldıkça %0’a kadar inecektir. Öte yandan değerin %0 olması, diskin öldüğü anlamına gelmez!
Normalde katı hal NAND yongaların ömrünü belirleyen bir kıstas vardır, o da tahmin edebileceğiniz gibi veri saklama ömrü. Belirtilen bu ömür verilerinizi güvenle saklayabileceğiniz ve sağlık azaldığında başarılı bir şekilde başka sürücülere aktarabileceğiniz zaman dilimini ifade eder. Genelde yeni bir SSD veya yeni NAND yongaları kullanan depolama birimleri kullanıma bağlı olarak 2 ila 10 sene içerisinde zayıf hale gelirler veya zayıf haldeyken de 1-2 sene daha dayanabilirler. İçinden her elektrik geçen cihazın başına gelen elektron aşınması bu tarz katı hal cihazlarda biraz daha bariz yaşanır. Her veri yazma ve okumada (veri okumak yazmak kadar aşınmaya neden olmaz) bu yongaların ömrü biraz daha azalır ve aşınma yaşanır.
Ne Zaman Veri Yedeklemeli?
JEDEC (The Joint Electron Device Engineering Council / Birleşik Elektron Cihaz Mühendislik Konseyi) adı verilen birlik günümüzde yarı iletken yongalar ve cihazlarla ilgili çeşitli standartlar belirleyen bir oluşum. Çoğu SSD üreticisi bu birliğe üye ve standartlara uyar konumda. Buna göre çeşitli amaçlarla bilgisayarlarda kullanılan bir katı hal sürücü 30 derece sıcaklıkta, güçsüz ve zayıf konumda 1 sene daha dayanabilmekte ve dosyaları kurtarabilmeye imkan tanımaktadır. Bu nedenle diskin ömrü bitmiş gibi gözükse bile telaşa kapılmayın, halen dosyalarınızı rahatça kopyalayabileceğiniz zamanınız var.
Bütün buradan çıkarabileceğimiz sonuç şu ki “Percentage Lifetime Used” değeri 100 olsa bile halen daha veri yazabilirsiniz ve verilerinizi başka bir diske daha aktarma fırsatınız var. Buna bakarak SSD’lerin aslında çok daha uzun soluklu ve iyi çalışan depolama birimleri olduğunu anlayabiliriz. Yine de her geçen gün her elektronik alette olduğu gibi ömrü gitgide azalacak, eninde sonundaysa sürücüler yetisini kaybedince yeni yazma ve okuma işlemleri kabul edilmeyecek. Şunu da unutmamak gerekir ki bozulan bir SSD’den veri kurtarmak maalesef ki kimi zaman imkansız denilecek kadar zor. Okurlarımızın da ilgili değer 100 olduğunda disk içindeki verileri yedeklemelerini tavsiye ediyoruz. Yedekleri aldıktan sonra sürücünüzü bozulana kadar kullanmaya devam edebilirsiniz.
Bozulma esnasında da katı hal sürücüsünde çeşitli hatalar meydana gelir. Genelde SSD’nin kendi üretici yazılımı tarafından bu hatalar çeşitli yöntemler kullanılarak (ECC hata düzeltme, bakım, veri saklama kapasitesinin kademeli bir şekilde azaltılması gibi) giderilmeye çalışılır. NAND yongalarda bozulan veri bölümleri çalışma esnasında arka planda yedekleriyle değiştirilip çalışmaya devam edilebilir. Böylece ömrünün sonuna yaklaşmış bir SSD bile yeterince iyi çalışır, sadece blokların hasar görmesi nedeniyle hız azalması gibi durumlar yaşanabilir.
Retired NAND Blocks: Kullanımdan Kaldırılan NAND Blokları
S.M.A.R.T. teknolojisi tarafından sürekli izlenen diskin durumlarında belirtilen özniteliklerden birisi olan “Retired NAND Blocks” değerinde, kaldırılan NAND blokları ifade edilir. Bir önceki başlık altında değindiğimiz gibi firmware SSD’nin performanstan ödün vermemesi ve halen kullanılabilir halde olması için bozulan veya çok yıpranmış NAND bloklarını tedavülden kaldırır. Bu işlem esnasında veriler genelde SSD’nin diğer bölümlerinden güvenli olan başkasına taşınır. Bu bloklar silinemediği için kullanıma kapatılır.
RAIN Successful Recovery Page Count: Başarılı RAIN Kurtarma Sayısı
Redundant Array of Independent NAND / Yedekli Bağımsız NAND Dizisi yani RAIN, bildiğimiz RAID yapılarını kullanarak veri yedeklemeye benzerdir. Bu işlemler katı hal sürücüleri yani SSD’lerde normal sabit diskleri RAID yaptığımızdaki süreç kadar sancılı ve uğraştırıcı olmaz. İşlemler sessizce sürücü içinde gerçekleşir. RAIN ise SSD’lerde hem verileri korumak hem de sürücünün ömrünü uzatmak amacıyla konuşlandırılmış bir özelliktir. Normalde RAIN olayı çok nadir gerçekleşir, bu sayıda anormal bir artış varsa diğer özniteliklerin veya hataların varlığı incelenmeli, gerekirse disk değiştirilmeli.
Her ne kadar veri güvenliği ve sürücü ömrünü uzatması bakımından olumlu bir özellik olsa da, RAIN işleminin sürekli yapılması performans bakımından bariz bir düşüşe ve yavaşlamaya neden olabilir. Zira arkada eşlik “parity” yedeklemesi devam ederken sürücü normal olarak kullanılmaya devam edebilir fakat bu işlem esnasında sürekli I/O kullanımı yaşanır. Olağandışı süregelen performans düşüşleri varsa bu değerin kontrol edilmesi gerekir.
Unexpected Power Loss Count: Beklenmeyen Güç Kaybı Sayısı
Normalde bilgisayarlarda kapatma esnasında SSD’lere gücün kesileceği ve donanımların kapatılacağına dair bir çağrı yollanır. SSD’ler bu çağrıyı aldıklarında var olan işlemi bir süre daha güvenli bir şekilde tamamlayabilirler. İşlem tamamlandığında bilgisayar güvenli bir şekilde kapatılır.
Maalesef ki gücün aniden kesildiği durumlar da söz konusudur. Özellikle elektrik kesintilerinin sıklıkla görüldüğü bölgelerde bu durum sorunlara yol açabilir. Yine de SSD’ler çeşitli şekillerde bu durumları telafi edebilir fakat bilgisayarlar bir sonraki başlatma esnasında daha yavaş açılacaktır. Bu değer genelde yaşanan bu kesintiler hakkında bilgi vermeyi amaçlar. Bu sayıya bakarak bilgisayarı nasıl doğru kapatmanız gerektiği hakkında araştırmaya başlayabilir veya güç kaynaklarında sorun olup olmadığını anlayabilirsiniz.
Enclosure Temperature: Muhafaza Sıcaklığı
Çeşitli SSD üreticilerinin sunmuş olduğu yazılımlarda bulunan bu değer sürücünüzün sıcaklığını gösterir. İdeal ve uzun ömürlü bir kullanım için SSD sıcaklığının 0 ila 70 derece arasında olmasına dikkat edilmeli. Elektronik cihazların çoğu ne olursa olsun yüksek sıcaklıklara ulaştıklarında soğutulması gerekir aksi takdirde ısıya bağlı yıpranmaya uğrarlar. Bu nedenle SSD’ler uygun olmayan değerlerde geziyorsa çeşitli soğutma önemlerini almalısınız. Özellikle M.2 formundaki katı hal sürücülerinde yüksek ısı değerleri görülür, bu formdaki SSD’lerde duruma göre soğutucular kullanılması gerekir.
Initial Invalid Blocks: İlk Bozuk Bloklar
İlk bozuk bloklar, ürün piyasaya çıkmadan önce yazılır. Bu kötü bloklar, üretim sürecinde maliyet düşürme önlemlerinin kaçınılmaz bir sonucudur ve Flash teknolojisinin doğasında vardır. 1. veya 2. sayfaların yedek bölgesindeki 6. bayt, bir “FFh” içerip içermediğini görmek için kontrol edilir. Değilse, bu fabrika tarafından işaretlenmiş bozuk bir bloktur ve “İlk Geçersiz Bloklar (Initial Invalid Blocks)” tablosu, bozuk blok için bir girdi ile güncellenir. Bu tablo, yeniden başlatma sırasında silinmeyi önlemek için hatasız bir bloğa kopyalanır.
Micron’un konuyla ilgili açıklaması:
Bozuk bloklar, güvenilirliği garanti edilmeyen bir veya daha fazla geçersiz bit içeren bloklardır. Cihaz sevk edilirken bozuk bloklar olabilir veya cihazın kullanım ömrü boyunca gelişebilir.
Bozuk bloklara sahip cihazlar, tüm blokların geçerli olduğu cihazlarla aynı kalite seviyesine ve aynı AC ve DC özelliklerine sahiptir. Kötü bir blok, seçilen bir transistör tarafından bit hattından ve ortak kaynak hattından izole edildiğinden geçerli blokların performansını etkilemez.
NAND Flash cihazlarında hata bitlerini yönetmek için hatalı blok yönetimi, blok değiştirme ve hata düzeltme kodu (ECC) yazılımı gereklidir.
Hardware ECC Recovered
Donanım ECC Kurtarıldı SMART parametresi, ECC (Error Correction Code/ Hata Düzeltme Kodu) tarafından düzeltilen hatalar arasındaki süreyi gösterir.
Bu parametre çoğu donanım satıcısı tarafından kritik olarak kabul edilmese de, bu parametrenin bozulması diskin elektromekanik problemlerini gösterebilir. Düzenli yedekleme önerilir. Başka (kritik) parametrelerden hiçbiri bir sorun bildirmiyorsa, donanımın yalnızca sunucular gibi kritik görev yapan sistemlerde değiştirilmesi önerilir.
Spinrite’dan Steve Gibson’a göre, S.M.A.R.T. değerleri anlık okumalar olarak değil, zamana göre ele alınmalıdır. Bu, 47 değerinin aylardır 47 olması durumunda mutlaka kötü olmadığı anlamına gelir. Bununla birlikte, değer bir saat önce 42 ise ve hızla yükseliyorsa bu, sürücünün verilerin bir kısmına erişmede zorluk yaşadığı ve yakında sektörü hiç okuyamayacağı anlamına gelir. Sürücüdeki verilerin değerine bağlı olarak onu değiştirmek isteyebilirsiniz.
Özet ve Sonuç
Özetle bu yazımızda S.M.A.R.T.’ın ne olduğuna ve ne işe yaradığına değinmeye çalıştık. Yazıyı buraya kadar okuduysanız artık S.M.A.R.T. sonuçlarında çıkan değerlerin ne anlama geldiğini biliyor olmalısınız.
Her şeye rağmen S.M.A.R.T. teknolojisi SSD’ler için kesinlik ifade eden bir teşhis, kontrol yöntemi değildir. Yine de kullanıcıya disk hakkında verdiği bilgiler fayda sağlamakla beraber aynı zamanda gereken tedbirlerin uygun vakitte alınmasında yardımcı oluyor. Yine de S.M.A.R.T. verilerini öğrenmek için kullandığınız yazılımın sürücünüze uygun değerleri sunup sunmadığından emin olmalısınız. Uyumsuz bir raporlama yazılımından elde edilecek sonuçlar sizleri yanlış yönlendirebilir bu nedenle SSD’lerin kendi üreticilerinin sunmuş olduğu yazılımları kullanarak sağlık kontrolünü sağlamanızda yarar var.






