Nvlddmkm.sys-VIDEO_TDR_FAILURE hatası

dege

Femtopat
Katılım
9 Temmuz 2024
Mesajlar
19
Daha fazla  
Cinsiyet
Erkek
Merhaba. Ekran kartimda sorun olduğunu düşünüyorum. Zıııt diye bir ses geliyor. Ve oyunlarda çok fazla donma yaşıyorum. Kasam kilitleniyor ve Power Supply'den kapatıyorum ya da Power açma tuşundan.
Kasayı aldığımda detaylı inceleme yapmadım. Eve geldiğimde ekran karti sabit değildi, vidasi yoktu. Zaman zaman mavi ekran yiyorum. Ama Valorant'ı acıyorum. Ve 1-2 saat oynadıktan sonra donuyor. Kasayı aç kapa yapıyorum. Ve oyuna girdiğimde girmeden donuyor ve bazen Windows açılma. Ekranında bile donuyor. Mavi ekran yedim yine. Ve mavi ekran tamamlanmada. Dondu.
 

Direkt dump dosyasını at. Tüm hepsini. RAR'ya da. ZIP klasörüne at Google Drive'ye yükle.

Halledebildim mi?
 
Şimdi...
Öncelikle güvenli moda gir. DDU ile sürücünü sil. Windows Update kapat eski sürücü kurmasın. Ardından en güncel sürücüyü NVIDIA'nın kendi sitesinden kur.

Ardından BIOS güncelle. Mssmbios modülü yüklenmediği için BIOS sürümünü göremedim.

Ardından Intel işlemcinin chipset sürücüsünü güncelle.

Ardından büyük ihtimal bozuk sistem dosyaların var. Onaralım onu da.

Buna rağmen devam eder ise temiz kurulum yap. Temiz kurulumdan sonra ekran kartı sürücünü kur. Chipset güncelle.
 
Şimdi...
Öncelikle güvenli moda gir. DDU ile sürücünü sil. Windows Update kapat eski sürücü kurmasın. Ardından en güncel sürücüyü NVIDIA'nın kendi sitesinden kur.

Ardından BIOS güncelle. Mssmbios modülü yüklenmediği için BIOS sürümünü göremedim.

Ardından Intel işlemcinin chipset sürücüsünü güncelle.

Ardından büyük ihtimal bozuk sistem dosyaların var. Onaralım onu da.

Buna rağmen devam eder ise temiz kurulum yap. Temiz kurulumdan sonra ekran kartı sürücünü kur. Chipset güncelle.

Daha yeni BIOS'tan Windows kurdum tekrar mı kurayım?
 
İlk bakışta ekran kartı arızaya sebep olmuş gibi duruyor fakat tam öyle değil gibi. Attığın minidump'lardan birinde WHEA_UNCORERCTABLE_ERROR adında bir bugcheck görünüyor. İnternette biraz araştırdığımda, bu işlemcinin Machine Check Architecture adı verilen bir tür donanımsal hata tespit mekanizması deskteklediği sonucuna ulaşılıyor. Bu hata tespit özelliği sayesinde işlemcin, Machine Check Exception adı verilen ve donanımsal bir hata gerçekleştiğini ifade eden bir exception fırlatmış. Vikipedideki makalede bu mekanızmanın sadece donanımsal hataları tespit ettiği yazıyor. Dolayısıyla donanımsal bir arıza olması ihtimali yüksek.

Ekran kartı ile ilgili minidumplar'a baktığımızda ise VIDEO_TDR_FAILURE kod adlı bugchecki görüyoruz. Bunun anlamı ekran kartı o an üzerinde çalıştığı görevini (oyunun renderlanması mesela) tamamlayamamış ve işletim sisteminin kendisi için belirlediği tahammül süresinin zaman aşımına uğramasına sebep olmuş.
Tahminimce ekran kartı haricindeki sistemdeki diğer komponentlerden biri hata verdiğinden ekran kartı da yanıt vermeyi kesmiş ve bu hataya sebep olmuş. Bana göre sorun ekran kartında olmayabilir.

Okuduğum her yazıda bu donanımsal hatanın çeşitli sebeplerden kaynaklanabileceği yazıyor. En önemlileri şu şekilde sıralanıyor.
  1. Termal problemleri olan CPU.
  2. Kaldırabileceğinden fazla overclocked edilmiş CPU. Bu yukarıdakinin sebebi olabilir. Eğer overclock yapıyorsan. Devre dışı bırakmayı dene.
  3. Hatalı anakart.
  4. Hatalı bellekler. memtest86 ile test et.
  5. Hatalı CPU. Bu yüksel ihtimal birazdan detaylandıracam.
  6. Yetersiz ya da arızalı güç kaynağı.
WHEA_UNCORERCTABLE_ERROR kod adlı minidump'ı detaylı incelediğimde,

Kod:
0: kd> dt nt!_WHEA_ERROR_RECORD ffff950b319c4028
   +0x000 Header           : _WHEA_ERROR_RECORD_HEADER
   +0x080 SectionDescriptor : [1] _WHEA_ERROR_RECORD_SECTION_DESCRIPTOR
0: kd> dx -id 0,0,ffff950b2f893040 -r1 (*((ntkrnlmp!_WHEA_ERROR_RECORD_HEADER *)0xffff950b319c4028))
(*((ntkrnlmp!_WHEA_ERROR_RECORD_HEADER *)0xffff950b319c4028))                 [Type: _WHEA_ERROR_RECORD_HEADER]
    [+0x000] Signature        : 0x52455043 [Type: unsigned long]
    [+0x004] Revision         [Type: _WHEA_REVISION]
    [+0x006] SignatureEnd     : 0xffffffff [Type: unsigned long]
    [+0x00a] SectionCount     : 0x3 [Type: unsigned short]
    [+0x00c] Severity         : WheaErrSevFatal (1) [Type: _WHEA_ERROR_SEVERITY]
    [+0x010] ValidBits        [Type: _WHEA_ERROR_RECORD_HEADER_VALIDBITS]
    [+0x014] Length           : 0x3a8 [Type: unsigned long]
    [+0x018] Timestamp        [Type: _WHEA_TIMESTAMP]
    [+0x020] PlatformId       : {00000000-0000-0000-0000-000000000000} [Type: _GUID]
    [+0x030] PartitionId      : {00000000-0000-0000-0000-000000000000} [Type: _GUID]
    [+0x040] CreatorId        : {CF07C4BD-B789-4E18-B3C4-1F732CB57131} [Type: _GUID]
    [+0x050] NotifyType       : {E8F56FFE-919C-4CC5-BA88-65ABE14913BB} [Type: _GUID]
    [+0x060] RecordId         : 0x1dae135c6e6982a [Type: unsigned __int64]
    [+0x068] Flags            [Type: _WHEA_ERROR_RECORD_HEADER_FLAGS]
    [+0x06c] PersistenceInfo  [Type: _WHEA_PERSISTENCE_INFO]
    [+0x074] Reserved         [Type: unsigned char [12]]
0: kd> dx -id 0,0,ffff950b2f893040 -r1 (*((ntkrnlmp!_WHEA_REVISION *)0xffff950b319c402c))
(*((ntkrnlmp!_WHEA_REVISION *)0xffff950b319c402c))                 [Type: _WHEA_REVISION]
    [+0x000] MinorRevision    : 0x10 [Type: unsigned char]
    [+0x001] MajorRevision    : 0x2 [Type: unsigned char]
    [+0x000] AsUSHORT         : 0x210 [Type: unsigned short]
0: kd> dx -id 0,0,ffff950b2f893040 -r1 (*((ntkrnlmp!_WHEA_ERROR_RECORD_SECTION_DESCRIPTOR (*)[1])0xffff950b319c40a8))
(*((ntkrnlmp!_WHEA_ERROR_RECORD_SECTION_DESCRIPTOR (*)[1])0xffff950b319c40a8))                 [Type: _WHEA_ERROR_RECORD_SECTION_DESCRIPTOR [1]]
    [0]              [Type: _WHEA_ERROR_RECORD_SECTION_DESCRIPTOR]
0: kd> dx -id 0,0,ffff950b2f893040 -r1 (*((ntkrnlmp!_WHEA_ERROR_RECORD_SECTION_DESCRIPTOR *)0xffff950b319c40a8))
(*((ntkrnlmp!_WHEA_ERROR_RECORD_SECTION_DESCRIPTOR *)0xffff950b319c40a8))                 [Type: _WHEA_ERROR_RECORD_SECTION_DESCRIPTOR]
    [+0x000] SectionOffset    : 0x158 [Type: unsigned long]
    [+0x004] SectionLength    : 0xc0 [Type: unsigned long]
    [+0x008] Revision         [Type: _WHEA_REVISION]
    [+0x00a] ValidBits        [Type: _WHEA_ERROR_RECORD_SECTION_DESCRIPTOR_VALIDBITS]
    [+0x00b] Reserved         : 0x0 [Type: unsigned char]
    [+0x00c] Flags            [Type: _WHEA_ERROR_RECORD_SECTION_DESCRIPTOR_FLAGS]
    [+0x010] SectionType      : {9876CCAD-47B4-4BDB-B65E-16F193C4F3DB} [Type: _GUID]
    [+0x020] FRUId            : {00000000-0000-0000-0000-000000000000} [Type: _GUID]
    [+0x030] SectionSeverity  : WheaErrSevFatal (1) [Type: _WHEA_ERROR_SEVERITY]
    [+0x034] FRUText          : "" [Type: char [20]]
0: kd> dx -id 0,0,ffff950b2f893040 -r1 (*((ntkrnlmp!_WHEA_PROCESSOR_GENERIC_ERROR_SECTION*)(0xffff950b319c4028 + 0x158)))
(*((ntkrnlmp!_WHEA_PROCESSOR_GENERIC_ERROR_SECTION*)(0xffff950b319c4028 + 0x158)))                 [Type: _WHEA_PROCESSOR_GENERIC_ERROR_SECTION]
    [+0x000] ValidBits        [Type: _WHEA_PROCESSOR_GENERIC_ERROR_SECTION_VALIDBITS]
    [+0x008] ProcessorType    : 0x0 [Type: unsigned char]
    [+0x009] InstructionSet   : 0x2 [Type: unsigned char]
    [+0x00a] ErrorType        : 0x8 [Type: unsigned char] 
    [+0x00b] Operation        : 0x0 [Type: unsigned char]
    [+0x00c] Flags            : 0x0 [Type: unsigned char]
    [+0x00d] Level            : 0x0 [Type: unsigned char]
    [+0x00e] Reserved         : 0x0 [Type: unsigned short]
    [+0x010] CPUVersion       : 0x306a9 [Type: unsigned __int64]
    [+0x018] CPUBrandString   [Type: unsigned char [128]]
    [+0x098] ProcessorId      : 0x0 [Type: unsigned __int64]
    [+0x0a0] TargetAddress    : 0x0 [Type: unsigned __int64]
    [+0x0a8] RequesterId      : 0x0 [Type: unsigned __int64]
    [+0x0b0] ResponderId      : 0x0 [Type: unsigned __int64]
    [+0x0b8] InstructionPointer : 0x0 [Type: unsigned __int64]

WHEA_PROCESSOR_GENERIC_ERROR_SECTION adlı structure'ın ErrorType adlı elemanının 8 değerinde sahip olduğu görülüyor.

Buradaki değer ise ntddk.h header dosyasındaki,

C:
#define GENPROC_PROCERRTYPE_UNKNOWN          0
#define GENPROC_PROCERRTYPE_CACHE            1
#define GENPROC_PROCERRTYPE_TLB              2
#define GENPROC_PROCERRTYPE_BUS              4
#define GENPROC_PROCERRTYPE_MAE              8

sabitlerinden birine karşılık geliyor. 8 değeri GENPROC_PROCERRTYPE_MAE sabiti ile ilişkilendirilmiş. MAE takısı Micro Architecture Error anlamına geliyor. Yani uzun lafın kısası işlemcin bir mikro-architecture hatası raporlamış. İşlemcin bozuk gibi duruyor.

Yukarıdaki arkadaşın verdiği çözümler işe yararsa güzel ama yaramazsa işlemciyi bi değiştirip sistemi test edebilirsin.
 
İlk bakışta ekran kartı arızaya sebep olmuş gibi duruyor fakat tam öyle değil gibi. Attığın Minidump'lardan birinde WHEA_UNCORERCTABLE_ERROR adında bir bugcheck görünüyor. İnternette biraz araştırdığımda, bu işlemcinin Machine Check Architecture adı verilen bir tür donanımsal hata tespit mekanizması deskteklediği sonucuna ulaşılıyor. Bu hata tespit özelliği sayesinde işlemcin, Machine Check Exception adı verilen ve donanımsal bir hata gerçekleştiğini ifade eden bir exception fırlatmış. Vikipedi'deki makalede bu mekanızmanın sadece donanımsal hataları tespit ettiği yazıyor. Dolayısıyla donanımsal bir arıza olması ihtimali yüksek.

Ekran kartı ile ilgili minidumplar'a baktığımızda ise VIDEO_TDR_FAILURE kod adlı bugchecki görüyoruz. Bunun anlamı ekran kartı o an üzerinde çalıştığı görevini (oyunun renderlanması mesela) tamamlayamamış ve işletim sisteminin kendisi için belirlediği tahammül süresinin zaman aşımına uğramasına sebep olmuş.
Tahminimce ekran kartı haricindeki sistemdeki diğer komponentlerden biri hata verdiğinden ekran kartı da yanıt vermeyi kesmiş ve bu hataya sebep olmuş. Bana göre sorun ekran kartında olmayabilir.

Okuduğum her yazıda bu donanımsal hatanın çeşitli sebeplerden kaynaklanabileceği yazıyor. En önemlileri şu şekilde sıralanıyor.
  1. Termal problemleri olan CPU.
  2. Kaldırabileceğinden fazla overclocked edilmiş CPU. Bu yukarıdakinin sebebi olabilir. Eğer overclock yapıyorsan. Devre dışı bırakmayı dene.
  3. Hatalı anakart.
  4. Hatalı bellekler. Memtest86 ile test et.
  5. Hatalı CPU. Bu yüksel ihtimal birazdan detaylandıracağım.
  6. Yetersiz ya da arızalı güç kaynağı.
WHEA_UNCORERCTABLE_ERROR kod adlı minidumpı detaylı incelediğimde,

Kod:
0: kd> dt nt!_WHEA_ERROR_RECORD ffff950b319c4028.
 +0x000 Header : _WHEA_ERROR_RECORD_HEADER
 +0x080 SectionDescriptor : [1] _WHEA_ERROR_RECORD_SECTION_DESCRIPTOR
0: kd> dx -id 0,0,ffff950b2f893040 -r1 (*((ntkrnlmp!_WHEA_ERROR_RECORD_HEADER *)0xffff950b319c4028))
(*((ntkrnlmp!_WHEA_ERROR_RECORD_HEADER *)0xffff950b319c4028)) [Type: _WHEA_ERROR_RECORD_HEADER]
 [+0x000] Signature : 0x52455043 [Type: unsigned long]
 [+0x004] Revision [Type: _WHEA_REVISION]
 [+0x006] SignatureEnd : 0xffffffff [Type: unsigned long]
 [+0x00a] SectionCount : 0x3 [Type: unsigned short]
 [+0x00c] Severity : WheaErrSevFatal (1) [Type: _WHEA_ERROR_SEVERITY]
 [+0x010] ValidBits [Type: _WHEA_ERROR_RECORD_HEADER_VALIDBITS]
 [+0x014] Length : 0x3a8 [Type: unsigned long]
 [+0x018] Timestamp [Type: _WHEA_TIMESTAMP]
 [+0x020] PlatformId : {00000000-0000-0000-0000-000000000000} [Type: _GUID]
 [+0x030] PartitionId : {00000000-0000-0000-0000-000000000000} [Type: _GUID]
 [+0x040] CreatorId : {CF07C4BD-B789-4E18-B3C4-1F732CB57131} [Type: _GUID]
 [+0x050] NotifyType : {E8F56FFE-919C-4CC5-BA88-65ABE14913BB} [Type: _GUID]
 [+0x060] RecordId : 0x1dae135c6e6982a [Type: unsigned __int64]
 [+0x068] Flags [Type: _WHEA_ERROR_RECORD_HEADER_FLAGS]
 [+0x06c] PersistenceInfo [Type: _WHEA_PERSISTENCE_INFO]
 [+0x074] Reserved [Type: unsigned char [12]]
0: kd> dx -id 0,0,ffff950b2f893040 -r1 (*((ntkrnlmp!_WHEA_REVISION *)0xffff950b319c402c))
(*((ntkrnlmp!_WHEA_REVISION *)0xffff950b319c402c)) [Type: _WHEA_REVISION]
 [+0x000] MinorRevision : 0x10 [Type: unsigned char]
 [+0x001] MajorRevision : 0x2 [Type: unsigned char]
 [+0x000] AsUSHORT : 0x210 [Type: unsigned short]
0: kd> dx -id 0,0,ffff950b2f893040 -r1 (*((ntkrnlmp!_WHEA_ERROR_RECORD_SECTION_DESCRIPTOR (*)[1])0xffff950b319c40a8))
(*((ntkrnlmp!_WHEA_ERROR_RECORD_SECTION_DESCRIPTOR (*)[1])0xffff950b319c40a8)) [Type: _WHEA_ERROR_RECORD_SECTION_DESCRIPTOR [1]]
 [0] [Type: _WHEA_ERROR_RECORD_SECTION_DESCRIPTOR]
0: kd> dx -id 0,0,ffff950b2f893040 -r1 (*((ntkrnlmp!_WHEA_ERROR_RECORD_SECTION_DESCRIPTOR *)0xffff950b319c40a8))
(*((ntkrnlmp!_WHEA_ERROR_RECORD_SECTION_DESCRIPTOR *)0xffff950b319c40a8)) [Type: _WHEA_ERROR_RECORD_SECTION_DESCRIPTOR]
 [+0x000] SectionOffset : 0x158 [Type: unsigned long]
 [+0x004] SectionLength : 0xc0 [Type: unsigned long]
 [+0x008] Revision [Type: _WHEA_REVISION]
 [+0x00a] ValidBits [Type: _WHEA_ERROR_RECORD_SECTION_DESCRIPTOR_VALIDBITS]
 [+0x00b] Reserved : 0x0 [Type: unsigned char]
 [+0x00c] Flags [Type: _WHEA_ERROR_RECORD_SECTION_DESCRIPTOR_FLAGS]
 [+0x010] SectionType : {9876CCAD-47B4-4BDB-B65E-16F193C4F3DB} [Type: _GUID]
 [+0x020] FRUId : {00000000-0000-0000-0000-000000000000} [Type: _GUID]
 [+0x030] SectionSeverity : WheaErrSevFatal (1) [Type: _WHEA_ERROR_SEVERITY]
 [+0x034] FRUText : "" [Type: char [20]]
0: kd> dx -id 0,0,ffff950b2f893040 -r1 (*((ntkrnlmp!_WHEA_PROCESSOR_GENERIC_ERROR_SECTION*)(0xffff950b319c4028 + 0x158)))
(*((ntkrnlmp!_WHEA_PROCESSOR_GENERIC_ERROR_SECTION*)(0xffff950b319c4028 + 0x158))) [Type: _WHEA_PROCESSOR_GENERIC_ERROR_SECTION]
 [+0x000] ValidBits [Type: _WHEA_PROCESSOR_GENERIC_ERROR_SECTION_VALIDBITS]
 [+0x008] ProcessorType : 0x0 [Type: unsigned char]
 [+0x009] InstructionSet : 0x2 [Type: unsigned char]
 [+0x00a] ErrorType : 0x8 [Type: unsigned char]
 [+0x00b] Operation : 0x0 [Type: unsigned char]
 [+0x00c] Flags : 0x0 [Type: unsigned char]
 [+0x00d] Level : 0x0 [Type: unsigned char]
 [+0x00e] Reserved : 0x0 [Type: unsigned short]
 [+0x010] CPUVersion : 0x306a9 [Type: unsigned __int64]
 [+0x018] CPUBrandString [Type: unsigned char [128]]
 [+0x098] ProcessorId : 0x0 [Type: unsigned __int64]
 [+0x0a0] TargetAddress : 0x0 [Type: unsigned __int64]
 [+0x0a8] RequesterId : 0x0 [Type: unsigned __int64]
 [+0x0b0] ResponderId : 0x0 [Type: unsigned __int64]
 [+0x0b8] InstructionPointer : 0x0 [Type: unsigned __int64]

WHEA_PROCESSOR_GENERIC_ERROR_SECTION adlı Structure'ın errortype adlı elemanının 8 değerinde sahip olduğu görülüyor.

Buradaki değer ise ntddk.h header dosyasındaki,

C:
#define GENPROC_PROCERRTYPE_UNKNOWN 0
#define GENPROC_PROCERRTYPE_CACHE 1
#define GENPROC_PROCERRTYPE_TLB 2
#define GENPROC_PROCERRTYPE_BUS 4
#define GENPROC_PROCERRTYPE_MAE 8

Sabitlerinden birine karşılık geliyor. 8 değeri genproc_procerrtype_mae sabiti ile ilişkilendirilmiş. Mae takısı Micro architecture error anlamına geliyor. yani uzun lafın kısası işlemcin bir mikro-architecture hatası raporlamış. İşlemcin bozuk gibi duruyor.

Yukarıdaki arkadaşın verdiği çözümler işe yararsa güzel ama yaramazsa işlemciyi bir değiştirip sistemi test edebilirsin.

Gerçekten senden çok teşekkür ediyorum arkadaşın dediği şeylerin %75'ini yaptim ama hala donma yaşıyorum yani geçmedi bu yüzden işlemciyi değiştireceğim bir de öğle deneyeceğim çok teşekkür ederim seni de uğraştırdım.
 
Gerçekten senden çok teşekkür ediyorum arkadaşın dediği şeylerin %75'ini yaptim ama hala donma yaşıyorum yani geçmedi bu yüzden işlemciyi değiştireceğim bir de öğle deneyeceğim çok teşekkür ederim seni de uğraştırdım.
İşlemcinde overclock var mıydı? ya da ısınma problemi?
 

Technopat Haberler

Yeni konular

Geri
Yukarı