Blauwe schermen (blue screen of death = BSOD)
- Introductie
- SYSTEM_SERVICE_EXCEPTION (0x3b)
- PAGE_FAULT_IN_NONPAGED_AREA (0x50)
- KERNEL_DATA_INPAGE_ERROR (0x7a)
- SYSTEM_THREAD_EXCEPTION_NOT_HANDLED (0x7e)
- DRIVER_POWER_STATE_FAILURE (0x9f)
- CRITICAL_STRUCTURE_CORRUPTION (0x109)
- Links
Introductie
SYSTEM_SERVICE_EXCEPTION (0x3b)
Ik probeerde een Kali Linux virtuele machine te starten in Virtual Box (van Oracle), en had meteen een blue screen.
Het blijkt dat er een conflict is met Microsoft virtualisatie-software
(Hyper-V
), en je moet die Windows-component
dus uitschakelen.
VMWare Player
handelt dit probleem gelukkig wel goed af, en geeft gewoon een foutmelding.
PAGE_FAULT_IN_NONPAGED_AREA (0x50)
Ik werd door iemand te hulp geroepen wiens PC (HP, oorspronkelijk Windows 7 maar bijgewerkt naar Windows 10) tegen dit blue screen aanliep. Hij startte spontaan opnieuw, maar dan kreeg je weer hetzelfde blue screen.
Het meest voor de hand liggende is te proberen in
safe mode te starten,
maar hoewel ik vanaf het 1e begin F8
intikte
lukte dat niet.
Later las ik ergens dat veilige modus sinds Windows 8 standaard uit staat,
en dat je het via de Boot Configuration Database weer moet aanzetten.
Ik heb ook nog in het BIOS naar 2 opties gekeken. Ten 1e kan "fast boot" soms problemen veroorzaken, maar ik was even vergeten dat deze PC oorspronkelijk W7 was. Toen bestond dat nog niet.
Ten 2e wilde ik memory caching uitzetten, maar daar was nergens iets over te vinden in het BIOS.
Ik kon wel bij de diagnostische routines van HP komen (door bij het
starten onmiddellijk op Esc
te drukken).
Een battery test, korte disk test en korte memory test leverden niets op.
Toen heb ik maar een lange disk test gestart, en die leverde een fail op.
Goede kans dus dat er diskproblemen waren.
De volgende stap was booten van een Windows 7 DVD.
Je kan dan in elk geval in de command line komen, en ik wilde het
commando BCDEDIT /SET {DEFAULT} BOOTMENUPOLICY LEGACY
uitvoeren, omdat je dan blijkbaar het F8
-menu weer
krijgt.
Ik vond het overigens wel een beetje riskant om dit vanuit een W7-omgeving
op een W10-PC te proberen.
Maar je moet toch wat.
Ik kreeg de melding:
Het opgegeven type elementgegevens wordt niet herkend of is niet van toepassing
op de opgegeven vermelding.
Vervolgens gebruikte ik de command line om een
chkdsk te doen, hoewel ik ook dit riskant vond
(met de chkdsk
van W7 een schijf in een W10-systeem
controleren).
Ik probeerde eerst zonder opties (read-only modus) en kreeg zoveel fouten
dat mijn argwaan nog versterkt werd.
Toen probeerde ik nog maar weer eens gewoon W10 te starten en gebeurde er iets
interessants.
Waarschijnlijk door mijn gepruts met chkdsk
ontdekte
W10 nu dat er iets met de schijf niet in de haak was, en werd er automatisch
een controle gestart.
Daarna was het systeem in elk geval weer bruikbaar, en heb ik
eerst een backup van de hele disk gemaakt, en daarna voor de zekerheid
nog een chkdsk /f /r
gedraaid.
Ik heb daar de resultaten nog niet van kunnen zien, maar de PC functioneert
weer zonder problemen.
Ik heb nog wel een interessant screen shot van het programma
Hard Disk Sentinel
gezien: op de dag van de crash
is de health van de hard disk van 100% naar 83% gedaald.
Bij de disk self test waren er 8 bad sectors geconstateerd.
In de help-informatie van Microsoft geven ze ook aan dat deze bug check door een corrupt NTFS-systeem kan komen (en door talloze andere dingen). Dat lijkt dus te kloppen in dit geval.
KERNEL_DATA_INPAGE_ERROR (0x7a)
Ik zette het scherm van mijn PC (Windows 7) op het werk aan, en had een blauw scherm. De PC staat zodanig ingesteld dat er automatisch een kernel dump gemaakt wordt in geval van een crash, maar in dit geval is er helaas geen dump.
De laatste melding in Logboeken (Event logs)
was een iaStorA, 129 event van de
dag ervoor.
En het was niet de enige.
Al ongeveer 20 uur eerder begonnen de meldingen, en om de 30 seconden
kwam er 1.
Dit verklaart ook dat er geen dump is. Er waren kennelijk problemen met disk (of met de verbinding van disk met moederbord), en daardoor lukte ook het wegschrijven van de dump niet meer.
Als eerste heb ik natuurlijk een
chkdsk
gedaan,
en de SMART-parameters bekeken.
Zo op het oog geen vreemde zaken.
Vervolgens heb ik met
Seatools for Windows
achtereenvolgens een Drive Self Test, een short generic test en een
long generic test gedaan.
Ook daar kwamen geen problemen uit.
Veel mensen die met dit probleem bezig zijn geweest hebben het over een
instelling die je te zien krijgt als
Intel Rapid Storage Technology
is
geïnstalleerd.
Ik dacht eerst dat dat pakket niet op mijn PC zat, maar dankzij de tool
DriverView
kwam ik er achter dat het wel zo is.
Het programma is niet te zien in de lijst van geïnstalleerde programma's,
(via de applet appwiz.cpl),
maar als ik in DriverView
zoek naar de driver
iaStorA
, dan zie ik in de kolom
Product Name
dat deze driver wel degelijk hoort
bij Rapid Storage Technology
.
Kortom, de oorzaak blijft voorlopig duister, omdat de meldingen na het herstarten niet meer optraden. Overigens zijn er eerder dit jaar (2017) ook al een keer veel van deze meldingen geweest.
Volgende geval
Op 5-12-2017 kreeg ik als Sinterklaascadeautje weer een blue screen, zelfde
type, maar nu met een andere driver, Ntfs.sys
In dit geval zijn er opnieuw om de 30 seconden meldingen van
iaStorA
in de event log te vinden, maar ze beginnen
op een moment waarop ik vrij nauwkeurig weet wat er gebeurde.
Vrijdagavond 1-12 werkte ik tot ca. 22:30 door, en ik heb altijd een externe SSD-drive bij me (soort USB-stick, maar dan met veeeeel meer opslagruimte). Ik probeer altijd zo'n drive netjes af te sluiten voor ik hem er uit trek, maar vaak heeft iets hem dan toch weer vast, ook al kan dat in feite niet.
In dit geval was de Sysinternals tool Procmon
de
boosdoener.
Ik had inderdaad met die tool gewerkt, maar hem allang weer afgesloten.
Desondanks zei een andere tool van hen, Process
Explorer
, dat Procmon
de disk nog vast had.
Ik dacht, niet mekkeren, eruit rukken dat ding :-).
En precies op dat moment beginnen de meldingen. Dat kan ik zien doordat vlak daarvoor 3 Kernel-PnP, 225 meldingen optreden. Dat is mooi, want ik heb dit probleem vaak, dus nu moet ik het met een beetje geluk kunnen reproduceren. Wordt vervolgd.
SYSTEM_THREAD_EXCEPTION_NOT_HANDLED (0x7e)
Probleembeschrijving
Dit was de computer van een vriendin, ca. 3 jaar oud, opgewaardeerd van Windows 7 naar 10.
Ze had steeds crashes, na ongeveer 1 uur draaien.
Ik heb betrekkelijk weinig info kunnen verzamelen, omdat ik via
Teamviewer
haar PC op afstand bestuurde.
Verzamelen van informatie
Er was wel een file MEMORY.DMP
, maar toen ik die
naar mijn eigen PC probeerde over te halen kreeg ik zelf een crash voor
mijn kiezen.
Verder kon in
Logboeken
(Event Viewer)
zien dat de bugcheck code 0x0000007e
was.
Zij zelf zag bij een crash op het scherm de volgende bestandsnaam:
NVLDDMKM.SYS
Bij bestandsnamen die beginnen met 'nv' kan je onmiddellijk aan de grafische kaart denken, die vaak van fabrikant nVidia is. En die trouwens ook best vaak voor crashes zorgen.
Oplossing
Aangezien de meeste mensen nooit de drivers voor dingen als grafische kaarten bijwerken, *en* deze PC ook nog van W7 naar W10 was gegaan, leek een upgrade van de driver mij een goede zaak.
Ik probeerde de driver gewoon te installeren, en koos voor een optie waarbij eerst de oude driver wordt verwijderd. Daarna moet je de PC herstarten.
Het lijkt erop dat daarmee het probleem is opgelost.
DRIVER_POWER_STATE_FAILURE (0x9f)
Probleembeschrijving
Het gaat om een 3 jaar oude Asus laptop, die een upgrade heeft gehad van Windows 8 naar Windows 10.
Het starten van de PC duurde gruwelijk lang, en na ca. 10 minuten kwam de volgende melding:
Your PC ran into a problem and need to restart. We're just
collecting some error info, and then we'll restart for you. (0%
complete).
Verzamelen van informatie
Kijk ook op mijn algemene pagina over het oplossen van problemen.
De meest logische plek om te beginnen is de verzameling van informatie,
waarschuwings- en foutmelding op het systeem:
Logboeken
.
Logboeken (event log)
Ik zag 4 interessante meldingen:
- Over het niet snel kunnen starten van de PC;
- Over een driver die niet geladen kon worden;
- Over een processor waarvan de snelheid beperkt werd;
- Over fouten op de harde schijf.
Voorlopig heeft alleen de 1e melding tot nu toe concreet resultaat opgeleverd.
Snelle start niet mogelijk
Hoewel het lang duurde voor het blauwe scherm verscheen is er maar 1 event in
die periode te vinden:
Kernel-Boot, 129
Dit betekent: Windows kan niet snel worden opgestart met de
foutstatus 0xC0000001
Sinds Windows 8 kan in het Energiebeheer
-applet
bepaald worden dat Windows sneller kan starten (dit is ook de standaard).
Diverse mensen raden aan om dit mechanisme uit te zetten i.v.m. problemen.
Dat is dus ook mijn 1e aan te raden oplossing.
Driver wil niet laden
De 1e melding na het blauwe scherm is ook een interessante:
The driver \Driver\WudfRd failed to load for the
device ACPI\ACPI0008\2&daba3ff&2
Dit is de Windows Driver Foundation - User-mode Driver
Framework Reflector
.
Ik zie op Internet verschillende meldingen van anderen die freezes en blue screens hebben in combinatie met deze melding.
Een paar mensen raden aan de service
Windows Driver Foundation
op Automatic
te zetten i.p.v.
Manual
o.i.d.
De grote vraag is: welk device is
ACPI\ACPI0008\2&daba3ff&2
.
Misschien dat dat het zoeken naar de oorzaak verder zou kunnen helpen.
Gelukkig had een vriend van mij een logische tip waar ik desondanks zelf niet
opgekomen was: zoeken in het register.
Ik heb op dit moment geen toegang tot de PC van degene met de problemen,
maar op mijn eigen Windows PC werkt dat perfect.
Daar vind ik inderdaad een apparaat met id ACPI0008
,
maar ik ga ervan uit dat dat per PC verschilt.
1 dag later zie ik toevallig op het werk in de event log na het starten van de PC zelfs 3 van dit soort meldingen. De bijbehorende apparaten zijn:
Sierra Wireless USB Composite Device
Broadcom Usbccid Smartcard Reader (WUDF)
Control Vault w/ Fingerprint Swipe Sensor
Het lijkt dus vooral om obscure apparaten te gaan, en ik ga er van uit dat deze melding dus niet samenhangt met het blauwe scherm.
Processorsnelheid beperkt
Ook na het blauwe scherm duurde het starten heel lang, en dat zou te maken
kunnen hebben met weer een boeiende melding (waarschuwing)
Kernel-Processor-Power, 37
:
De snelheid van processor 3 in groep 0 wordt beperkt door de
firmware van de computer.
De processor heeft deze lage prestatiestatus gedurende 71 seconden sinds
het laatste rapport.
(The speed of processor 1 in group 0 is being limited by system firmware.
The processor has been in this reduced performance state for 71 seconds since
the last report).
Ik ben even door het nogal beperkte BIOS gelopen, maar zie daar geen rare dingen.
De meldingen betekenen vrijwel zeker niets ernstigs.
Ze worden veroorzaakt door Intel SpeedStep Technology
,
en zijn bedoeld om stroom te besparen.
Hier een aantal mogelijke oplossingen als je wilt vermijden dat de processor terugschakelt naar een lagere snelheid (accu dan eerder leeg).
Schijfwaarschuwingen
Nog weer wat verderop zijn er 2 events die niet veel goeds voorspellen voor
de disk: disk, 153
(The IO operation at logical block address ... for Disk ...
was retried.
)
Status van de disk
Traagheid kan altijd veroorzaakt worden door diskproblemen, en ik zag ook
2 waarschuwingen in
Logboeken (Event Log)
.
De SMART-parameters van de disk laten niets vreemds zien.
Memory dump
Het blauwe scherm heeft gelukkig een mooie dump
(MEMORY.DMP
) opgeleverd.
Het lijkt erop dat ik de dump niet kan
lezen op mijn Windows 7 systeem, dus ik
moest eerst de WDK (Windows Driver Kit)
op mijn
nog behoorlijk nieuwe Windows 10 PC installeren.
Dit pakket bevat ook WinDbg
, nodig om de dump te
bekijken.
De bugcheck code, 0x9f
, staat voor:
A driver has failed to complete a power IRP within a specific
time
.
De 1e parameter, 3
, staat voor:
A device object has been blocking an Irp for too long a time
(Irp staat voor Io Request Packet).
De 'Faulting module' is pci.sys
, en
de 'Primary problem class' is
0x9F_3_POWER_DOWN_iaStorA_IMAGE_pci.sys
De laatste parameter van de bugcheck is het adres van het IO Request Packet, en als je dat gaat analyseren krijg je dit:
2: kd> !irp ffffe0000ce98c60
Irp is active with 4 stacks 3 is current (= 0xffffe0000ce98dc0)
No Mdl: No System Buffer: Thread 00000000: Irp stack trace. Pending has been returned
cmd flg cl Device File Completion-Context
[IRP_MJ_POWER(16), IRP_MN_WAIT_WAKE(0)]
0 0 ffffe0000c7f1060 00000000 fffff8018e936320-fffff8018e907150
\Driver\pci ACPI!ACPIBuildRegOnRequest
Args: 00000000 00000000 00000000 00000002
[IRP_MJ_POWER(16), IRP_MN_WAIT_WAKE(0)]
0 0 ffffe0000c7e5e40 00000000 fffff8018dfc8bd0-00000000
\Driver\ACPI storport!RaidAdapterPowerUpDeviceCompletion
Args: 00000000 00000000 00000000 00000002
>[IRP_MJ_POWER(16), IRP_MN_SET_POWER(2)]
0 e1 ffffe0000c88c050 00000000 fffff803323920b8-ffffe000115d9720 Success Error Cancel pending
*** ERROR: Module load completed but symbols could not be loaded for iaStorA.sys
\Driver\iaStorA nt!PopRequestCompletion
Args: 00051100 00000001 00000001 00000002
[N/A(0), N/A(0)]
0 0 00000000 00000000 00000000-ffffe000115d9720
Args: 00000000 00000000 00000000 00000000
Iemand op Internet suggereert dat vanwege de ERROR m.b.t. de driver iaStorA.sys, deze mogelijk niet up-to-date is en vervangen zou moeten worden. Zie deze thread op de site van Microsoft.
Ik laat het debugger commando !devstack
los op de 2e
parameter van de bugcheck, en krijg dit:
2: kd> !devstack ffffe0000c7f1060
!DevObj !DrvObj !DevExt ObjectName
ffffe0000c88c050 \Driver\iaStorA ffffe0000c88c1a0 RaidPort0
ffffe0000c7e5e40 \Driver\ACPI ffffe0000badac70
> ffffe0000c7f1060 \Driver\pci ffffe0000c7f11b0 NTPNP_PCI0011
!DevNode ffffe0000c7f3a50 :
DeviceInst is "PCI\VEN_8086&DEV_1E03&SUBSYS_15071043&REV_04\3&11583659&0&FA"
ServiceName is "iaStorA"
Op zich zegt mij dit niet erg veel, maar in de op 1 na laatste regel zie ik
wel een identificatie van een device.
En als ik in de uitvoer van msinfo32
zoek naar dat id,
dan kom ik terecht bij de
Intel(R) 7 Series Chipset Family SATA AHCI Controller
,
met als driver iastora.sys
.
Op mijn eigen Windows 10 PC (komt ook vanaf Windows 8) heb ik driverversie 13.5.0.1056. Op de PC met het probleem is versie 11.6.0.1030 geïnstalleerd. Misschien is dat terecht, omdat zij een controller uit de 7 series heeft, en ik uit de 9 series. Maar het is toch iets om in gedachten te houden.
Als poging 1 om het probleem op te lossen niet helpt, is wat mij betreft poging 2 het updaten van de drivers van op zijn minst de Intel Chipset.
Oorzaak 1
Het fast startup mechanisme werkt niet goed.
Oplossing 1
Bij de PC van mijn vriendin heeft dit gewerkt. De blauwe schermen zijn enkele weken lang al niet meer verschenen. De PC start nog wel steeds heel traag.
Oorzaak 2
De driver iastora.sys
is niet up-to-date.
Oplossing 2
Je zou dat evt. kunnen controleren met de
Intel Driver Update Utility 2.4
Maar... een nog veiliger route is het halen van de drivers van de fabrikant van je PC/moederbord. Het zou kunnen zijn dat die iets achter lopen bij de meest recente drivers van Intel, maar je weet dan wel zeker dat ze passen bij je PC.
CRITICAL_STRUCTURE_CORRUPTION (0x109)
Op mijn werk was ik nog maar een paar dagen over naar Windows 10 (vanaf W7).
Omdat mijn armen even rust nodig hadden was ik wat berichtjes op Nu.nl aan het lezen, en ineens had ik een crash.
De bugcheck heeft de volgende parameters:
{a3a002e25c48b802, b3b70f68aecb363c, ffffeaa747792adc, c}
en is waarschijnlijk veroorzaakt door
win32kbase.sys ( win32kbase!rimLoadImage+0 )
Er is op Internet weinig of geen info te vinden, vooral over de routine
rimLoadImage
.
Alleen de 4e parameter betekent iets, nl. het type van het gecorrumpeerde
gebied.
In dit geval is dat
Modification of a session function or .pdata
Dat zegt mij niet bar veel.
De belangrijkste oorzaak waar je in dit geval aan zou kunnen denken is een probleem met memory, en ik zal in het weekend dus wat tests laten draaien. Later meer.
Links
Reageer via E-mail (dalmolen@xs4all.nl)
Deze pagina is voor het laatst gewijzigd op: 15-02-23 14:09:07