
Ich habe ein Testcluster mit Proxmox und 3 Nodes laufen. Neulich ist einer von 3 ausgestiegen und wurde als fehlend im Rechenzentrum angezeigt. Nachfolgend ein paar Punkte zur Klärung und Lösung des Problems.
Proxmox VE Node fehlt im Cluster – Checks
- korrekte Systemzeit auf allen Nodes:
- # date
- am besten mit NTP Server synchronisieren
- Service pvestatd läuft auf allen Nodes
- # systemctl status pvestatd.service
- Service corosync läuft auf allen Nodes
- # systemctl status corosync.service
- Member Status
- # cat /etc/pve/.member ({ …”id”: 1, “online”: 0,….) wenn online Null steht dann:
- # systemctl stop pve-ha-lrm pve-ha-crm
- # systemctl restart pve-cluster corosync
- # cat /etc/pve/.member ({ …”id”: 1, “online”: 0,….) wenn online Null steht dann:
- Status des Cluster abfragen
- # pvecm status
- Serverstatus
- # pvesrv status
- trying to aquire cfs lock ‘file-replication_cfg’ …
- …
- error with cfs lock ‘file-replication_cfg’: no quorum!
- System aktualisieren
- # pveupdate
- # pveupgrade
ProxmoxVE – Fehler pvestatd [1489]
Ich konnte noch obigen Checks, folgenden Fehler sehen.
pvestatd[1489] can’t lock file ‘/var/log/pve/tasks/.active.lock’ – can’t open file – Read-only file system
Taucht dieser Fehelr auf, lohnt auch gleich der Blick in die Systemlogs. In meinem Fall war die SSD auf der die virtuellen Maschinen laufen defekt.
Thats it …