root-partition verschwinded beim booten..

G

gu4rdi4n

Freak
hi,
manchmal nachdem der kernel von der root-partition geladen wurde,
verschwinded die einfach, was sich erst bemerkbar macht als er init nicht findet.
Dann schmeisst er mich in ne busybox und ich darf hinterher feststellen das sämtliche Partitonen (/, /home und swap), also deren Gerätedatein verschwunden sind und nurnoch die der platte selbst existiert.
Wobei ich mich dann doch frage wo er den kernel und bootloader hergeladen hat wenn die partitionen doch angeblich nicht existiert?

Könnte das ein Fehler im Program/Script/wasauchimmer sein das die Gerätedatein erstellt? und wenn ja wie bekomme ich ihn weg?

Ein Hardware-Problem schliesse ich hier einfach mal aus da ja sowohl Bootloader als auch Kernel geladen werden konnten.
Wobei andererseits die Zufälligkeit des Fehlers für mich für einen HW-Fehler spricht...

Also woran könnte das liegen ?
Irgendeine Ahnung?


Mein System:
AMD Athlon(tm) 64 X2 Dual Core Processor 4800+
MainBoard: irgendeins von ASUS, mit unbenutzem SATA
Debian Lenny, Kernel: 2.6.486 (version: 2.6.18.dfsg.1-12)
ITE 8212 RAID (nur für hdd und hde)

hda : 80GB (Maxtor)
hda1: 60GB - / (ext2)
hda2: 39GB - /home (ext2)
hda3: 1GB - swap

hdb : 80GB (hitachi)
hdb1: 80GB - C: (ntfs)

hdc : DVD/RW - /mnt/cdrom oder D:

hdd : 250GB (Maxtor)
hdd1: 250GB - /mnt/hdd1 oder E: (ext2)

hde : 300GB (Western Digital)
hde1: 300GB - /mnt/hde1 oder F: (ext2)
 
Hallo,

Du hast auf Deiner hda 80 GB Platte Partitionen mit insgesamt 100 GB.

Zitat:
hda : 80GB (Maxtor)
hda1: 60GB - / (ext2)
hda2: 39GB - /home (ext2)
hda3: 1GB - swap

Das kann nicht funktionieren.

Poste doch mal die Originale Ausgabe von fdisk -l
 
ach mist sry, hab das ausm kopf geschrieben und mich wohl versehen...

Code:
gu4rdi4n:/home/gu4rdi4n# fdisk -l

Disk /dev/hda: 82.3 GB, 82348277760 bytes
255 heads, 63 sectors/track, 10011 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes

   Device Boot      Start         End      Blocks   Id  System
/dev/hda1               1       10010    80405293+   7  HPFS/NTFS

Disk /dev/hdb: 81.9 GB, 81964302336 bytes
255 heads, 63 sectors/track, 9964 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes

   Device Boot      Start         End      Blocks   Id  System
/dev/hdb1   *           1        7295    58597056   83  Linux
/dev/hdb2            9722        9964     1951897+  82  Linux swap / Solaris
/dev/hdb3            7296        9721    19486845   83  Linux

Partition table entries are not in disk order

Disk /dev/hdd: 300.0 GB, 300090728448 bytes
255 heads, 63 sectors/track, 36483 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes

   Device Boot      Start         End      Blocks   Id  System
/dev/hdd1               1       36483   293049666   83  Linux

Disk /dev/hde: 250.0 GB, 250059350016 bytes
255 heads, 63 sectors/track, 30401 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes

   Device Boot      Start         End      Blocks   Id  System
/dev/hde1               1       30401   244196001   83  Linux
gu4rdi4n:/home/gu4rdi4n#

kam aber so ungefähr hin :D
 
Hi,

diese willkürliche Inkosistenz klingt wirklich etwas nach einem Hardware-Fehler. Es kann ja sein, dass der Anfang der Platte, wo der MBR liegt, noch OK ist und der Rest nen Schaden weg hat.

Was sagt ein
Code:
smartctl -a /dev/hda
?

(Hast du das Programm nicht zur Verfügung, kannst du es mit
Code:
apt-get install smartmontools
installieren.)

Ergibt
Code:
dmesg
etwas Auffälliges?

Gibt es irgendwelche anderen Geräte (per USB/Firewire), die mal angesteckt oder abgesteckt sind?
 
ich denke mal du meintest hdb, hab einfach mal beide gemacht:

Code:
gu4rdi4n:/home/gu4rdi4n# smartctl -a /dev/hdb
smartctl version 5.37 [i686-pc-linux-gnu] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Model Family:     Maxtor DiamondMax Plus 9 family
Device Model:     Maxtor 6Y080L0
Serial Number:    Y207C73C
Firmware Version: YAR41BW0
User Capacity:    81.964.302.336 bytes
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   7
ATA Standard is:  ATA/ATAPI-7 T13 1532D revision 0
Local Time is:    Sun Jun 10 08:21:29 2007 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Disabled

SMART Disabled. Use option -s with argument 'on' to enable it.
gu4rdi4n:/home/gu4rdi4n# smartctl -a /dev/hda
smartctl version 5.37 [i686-pc-linux-gnu] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Model Family:     Hitachi Deskstar 7K250 series
Device Model:     HDS722580VLAT20
Serial Number:    VNR81EC2SXJVNM
Firmware Version: V32OA60A
User Capacity:    82.348.277.760 bytes
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   6
ATA Standard is:  ATA/ATAPI-6 T13 1410D revision 3a
Local Time is:    Sun Jun 10 08:21:57 2007 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Disabled

SMART Disabled. Use option -s with argument 'on' to enable it.
gu4rdi4n:/home/gu4rdi4n#

die ausgabe von dmesg war nen bisl lang, also hab ichs in ne extra datei gepackt und hochgeladen: http://dd3.dd.funpic.de/stuff/dmesg.txt
 
momentan ist nur 1 usb-gerät angeschlossen, und das ist die maus.

hier die ausgabe von smartctl:
http://dd3.dd.funpic.de/stuff/smart.txt

also ich kenn mich damit zwar nich so aus, aber ich glaube das ist nicht gut, oder?

Code:
SMART Error Log Version: 1
Warning: ATA error count 253 inconsistent with error log pointer 5

edit:
hab das ma mit uuid versucht, aber er is mir ben trotzdem wieder hängen geblieben.
wobei mir aufgefallen ist das oben folgendes stand:
Code:
...
ide0: reset
unable to read partition table
...

und mir is aufgefallen das grub die platten vertauscht.
weil eigentlich ist es ja so: HD0 is windows, HD1 is Debian.
aber bei ihm is das so das es die windows platte garnicht gibt und HD0 Debian ist..
 
Zuletzt bearbeitet:
Hi,

klingt nicht so gut, allerdings hab ich wenig Erfahrung mit kaputten Festplatten, um solche Meldungen zu interpretieren ;)
Mach mal ein
Code:
smartctl -C -t long /dev/hdb
.

Das mit de UUID dürfte nicht das Problem sein, da du ja geschrieben hast, dass es willkürlich auftritt. Allerdings lasse ich mich auch eines besseren belehren ;)
 
Code:
gu4rdi4n:/home/gu4rdi4n# smartctl -C -t long /dev/hdb
smartctl version 5.37 [i686-pc-linux-gnu] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

SMART Disabled. Use option -s with argument 'on' to enable it.
gu4rdi4n:/home/gu4rdi4n# smartctl -C -t long /dev/hdb -s on
smartctl version 5.37 [i686-pc-linux-gnu] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF ENABLE/DISABLE COMMANDS SECTION ===
SMART Enabled.

=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION ===
Sending command: "Execute SMART Extended self-test routine immediately in captive mode".
Drive command "Execute SMART Extended self-test routine immediately in captive mode" successful.
Testing has begun.
Please wait 37 minutes for test to complete.
Test will complete after Sun Jun 10 20:06:15 2007

gu4rdi4n:/home/gu4rdi4n#

wenn der fertig ist, meldet der sich irgedwie?

und ich denke, wenn der die partitions-table nicht lesen kann, wird auch aus uuid nichts, die die denkichma da gespeichert wird...
 
öhm, also daran lags wohl irgendwie nich:
(es sei denn ich interpretier PASSED falsch ein ^^)

Code:
gu4rdi4n:/home/gu4rdi4n# smartctl -H /dev/hdb
smartctl version 5.37 [i686-pc-linux-gnu] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

gu4rdi4n:/home/gu4rdi4n#

woran könnts denn sonst liegen?
vlcht wirklich ein Fehler in einem der programme?
 
öhm, also daran lags wohl irgendwie nich:
(es sei denn ich interpretier PASSED falsch ein ^^)


woran könnts denn sonst liegen?
vlcht wirklich ein Fehler in einem der programme?
Mh, das klingt ok. Allerdings muss ein bestandener Test nicht heissen, das auch alles ok ist. Aber wir nehmen das jetzt mal so hin :)
Ich weiss jetzt allerdings nicht weiter. Durch das zufällige Auftreten hätte ich auf einen HW-Fehler getippt oder eine Beeinflussung durch andere Speicher/USB-Geräte, die man mal an- und mal abgesteckt hat. Aber das ist ja bei dir nicht so ... hat jemand anders noch eine Idee?

{edit}
Du könntest noch einen Badblock-Test machen. Der ist allerdings etwas gefährlich, ohne Datensicherung würde ich ihn nicht durchführen (auch den Nur-lesen-Test):
Code:
badblocks -vs /dev/hdb  $ENDBLOCK 0
Guck auch lieber nochmal die manualpage dazu an.

Den Endblock bekommst du mit
Code:
sfdisk -s /dev/hdb
 
Zuletzt bearbeitet:
so, hatte in letzter zeit keine zeit dafür, daher sry...


also, ich denke das mit meinem DVD-Brenner was nicht stimmt.
denn erstens kommen einige fehler und wanungen bezüglich /dev/hdc beim start (was ich erstmal ignorierte, da ich dachte er würde nur versuchen das als festplatte zu benutzen und numa nich schreiben kann oda so), und zweitens kann ich nichts mehr brennen, es komt in k3b folgendes:
Code:
Executing 'builtin_dd if=/home/gu4rdi4n/KNOPPIX-5.1-DVD.iso of=/dev/hdc obs=32k seek=0'
/dev/hdc: "Current Write Speed" is 4.0x1352KBps.
          0/4324204544 ( 0.0%) @0x, remaining ??:?? RBU 100.0% UBU   0.0%
          0/4324204544 ( 0.0%) @0x, remaining ??:?? RBU 100.0% UBU   0.0%
          0/4324204544 ( 0.0%) @0x, remaining ??:?? RBU 100.0% UBU   0.0%
          0/4324204544 ( 0.0%) @0x, remaining ??:?? RBU 100.0% UBU   0.0%
          0/4324204544 ( 0.0%) @0x, remaining ??:?? RBU 100.0% UBU   0.0%
:-[ WRITE@LBA=0h failed with SK=3h/ASC=73h/ACQ=03h]: Input/output error
:-( write failed: Input/output error
(wobei mich der befehl bei "Executing" ganz oben etwas stutzig macht, da ich dachte man könne dd nicht fürs brennen nutzen)

ich wollte nur knoppix brennen um ein backup zu machen um badblocks auszuführen, und da zickt der plötzlich rum...

kann es was mit dem Fehler zu tun haben das er die partitions-tabelle der Festplatte nicht lesen kann?


und ausserdem hat er in letzer zeit die blöde angewohnheit mittendrin einfach für 5 sekunden oda so stehn zu bleiben, als hätte der prozessor-takt sekundenschlaf, es lässt sich nichts mehr machen.
is für arbeiten oda so zwar nur geringfügig nerfend, aber wenn ich z.b. warsow zocke kann es "tötlich" sein für 5 sekunden in der gegend rum zu stehen.
im prozessorlast-diagramm ist eine kurze spitze von 100% zu sehen, allerdings sehe ich diese ja erst nach 5 sekunden, kann daher nicht feststellen welcher prozess das denn nun ausgelöst hat. gibt es ein programm das mitloggt welches programm wann eine hohe belastung ausgelöst hat?
 
Deine weitere Fehlerbeschreibung kann mit dem Fehler zu tun haben, kann aber auch ein eigenständiger Fehler sein.

Was passiert denn, wenn du den Brenner mal abklemmst?

Das Problem mit kurzzeitigen einfrieren:

Merk dir die Zeit, wann das war und schau mal unter
Code:
/var/log/syslog
welcher Prozess zu der Zeit was gemacht hat.
 
mhh, da is wirklich was mit hdc, und es sind sogar genau 5 sekunden.

Code:
...
Jun 16 18:27:56 gu4rdi4n kernel: hdc: cdrom_pc_intr: The drive appears confused (ireason = 0x01). Trying to recover by ending request.
Jun 16 18:28:01 gu4rdi4n kernel: hdc: status error: status=0x58 { DriveReady SeekComplete DataRequest }
Jun 16 18:28:01 gu4rdi4n kernel: ide: failed opcode was: unknown
Jun 16 18:28:01 gu4rdi4n kernel: hdc: drive not ready for command
Jun 16 18:28:01 gu4rdi4n kernel: hdc: status timeout: status=0xd8 { Busy }
Jun 16 18:28:01 gu4rdi4n kernel: ide: failed opcode was: unknown
Jun 16 18:28:01 gu4rdi4n kernel: hdc: drive not ready for command
Jun 16 18:28:01 gu4rdi4n kernel: hdc: ATAPI reset complete
...

heisst das jetz das das laufwerk schrott ist?
lesen kann es ja noch...
 
Könnte der Controller sein. Mach auf jedenfall irgendwie ein Backup deiner Daten. In so einem Fall lohnt reparieren nicht, Festplatten kosten ja nichts mehr.
Bin aber auch nich ganz sicher. Aber irgendwas ist da mit Sicherheit nicht in Ordnung ;)
 
Hab das Laufwerk jetz ma abgeklemmt, und plötzlich leuft alles glatt.
(wobei ich bisher ja aber auch nur 2 mal gebootet hab)

Warscheinlich werd ich mich nach nem neuen DVD-Brenner umsehen....

Ansonsten vielen Dank für die Hilfe.
 
mhh, hab mich wohl geirrt, hab grad das CD-RW laufwerk meines zwitrechners angeschlossen und der Fehler mit partitiontabelle konnte nicht gelesen werden kam wieder, als ich es abgeklemmt hab kam er trotzdem noch 4 mal, dann wieder dran und nach weiteren 7 versuchen endlich ein erfolgreicher boot.

aber mit dem CD-Brenner hab ich bisher nicht das Problem des 5-sekunden-freeze gehabt, was aber noch kommen kann da ich grade erst hochgefahren hab, und da ich keine CD-rohlinge da hab kann ich das Brennen grade nicht testen.


@b00
an was bestimmtes gedacht?
 

Ähnliche Themen

Fileserver LVM post mortem

nach opensuse 10.2 probleme beim booten (md raid)

Kernel Panic nach Knoppix-Installation???

Ubuntu und WindowsXP

Kann Fedora Core 5 nicht starten

Zurück
Oben