TS-469L in boot loop e bloccato se connesso alla rete
Inviato: 13 dic 2017, 09:58
Buongiorno.
Premetto che attualmente il NAS TS-469L è collegato con le due schede Ethernet a 2 LAN diverse ed ha 4 dischi (in fase di migrazione a capacità di superiore) 1x WD 6TB + 3x WD 3TB.
L'altro ieri sera ho fatto un aggiornamento dalla 4.3.3.0396 build 20171205 alla 4.3.4.0411 (Beta 3) build 20171208 (procedura del genere fatta fino ad oggi moltissime volte e sembra l'ombra di un problema) e dal riavvio sono cominciati i problemi: continuo loop di riavvio.
Sul rack ho fatto uno spegnimento e riaccensione manuali lanciando un ping fisso ad uno dei 2 IP ed ho notato che, completata la fase iniziale di boot, il NAS comincia a rispondere per un paio di secondi con latenza <1ms e poi comincia a diventare instabile tra pacchetti persi e latenze variabili che superano i 2 sec., per poi definitivamente andare in pacchetti persi e non rispondere più.
Indagando maggiormente ho notato che nella fase iniziale comincia a rilevare correttamente i dischi ed ad avviarne il funzionamento in RAID-5 con tutti i servizi (luci HDD alternate randomicamente), ma quando comincia l'instabilità dei PING, in effetti, la luce LAN lampeggia secondo il traffico, ma le luci dei dischi smettono di lampeggiare e diventano VERDE FISSO (si interrompe completamente l'attività di accesso ai dischi).
Dopo un po' le 4 luci dei dischi diventano ROSSE, si accendono le 3 luci sopra tutte insieme e si riavvia il NAS (e questo inizia tutto il loop che si ripete nel tempo).
Controllando i log del sistema (dalla cartella "HDA_Root/.logs") non ci sono assolutamente segnalazioni di malfunzionamenti o conflitti di alcun genere. Finisce tutto con boot completato e si legge che ogni 6 minuti circa riprende tutta la procedura di riavvio.
Ho tolto il NAS dal Rack per effettuare una procedura di Firmware Recovery collegandomi in locale ad una scheda di rete del mio PC ed ho scoperto con meraviglia che in questo modo il NAS completa la procedura e funziona correttamente con ping fisso stabile <1ms. Allora l'ho allora riattaccato allo switch ed ho visto che solo in questa situazione comincia il loop reboot.
Se avviato senza dischi, il NAS funziona anche se attaccato allo switch.
Ho colto l'occasione del funzionamento "in locale" al PC per ripristinare la versione di firmware precedente e stabile (4.3.3.0396 build 20171205), ma questo non ha risolto.
Ho provato a mettere un PC in sniffing con l'indirizzo del NAS sulla porta dello switch ed ho verificato che non ci sono sessioni interne o esterne di traffico illecito.
Ho provato a disabilitare la regola di NAT sul firewall per impedire il traffico dal NAS verso Internet e la situazione è sempre la stessa.
Penso di aver scritto tutto: sono in una situazione di stallo.
Scusate la lungaggine, ma come vedete la situazione è proprio anomala.
Che ne pensate?
Grazie
Premetto che attualmente il NAS TS-469L è collegato con le due schede Ethernet a 2 LAN diverse ed ha 4 dischi (in fase di migrazione a capacità di superiore) 1x WD 6TB + 3x WD 3TB.
L'altro ieri sera ho fatto un aggiornamento dalla 4.3.3.0396 build 20171205 alla 4.3.4.0411 (Beta 3) build 20171208 (procedura del genere fatta fino ad oggi moltissime volte e sembra l'ombra di un problema) e dal riavvio sono cominciati i problemi: continuo loop di riavvio.
Sul rack ho fatto uno spegnimento e riaccensione manuali lanciando un ping fisso ad uno dei 2 IP ed ho notato che, completata la fase iniziale di boot, il NAS comincia a rispondere per un paio di secondi con latenza <1ms e poi comincia a diventare instabile tra pacchetti persi e latenze variabili che superano i 2 sec., per poi definitivamente andare in pacchetti persi e non rispondere più.
Indagando maggiormente ho notato che nella fase iniziale comincia a rilevare correttamente i dischi ed ad avviarne il funzionamento in RAID-5 con tutti i servizi (luci HDD alternate randomicamente), ma quando comincia l'instabilità dei PING, in effetti, la luce LAN lampeggia secondo il traffico, ma le luci dei dischi smettono di lampeggiare e diventano VERDE FISSO (si interrompe completamente l'attività di accesso ai dischi).
Dopo un po' le 4 luci dei dischi diventano ROSSE, si accendono le 3 luci sopra tutte insieme e si riavvia il NAS (e questo inizia tutto il loop che si ripete nel tempo).
Controllando i log del sistema (dalla cartella "HDA_Root/.logs") non ci sono assolutamente segnalazioni di malfunzionamenti o conflitti di alcun genere. Finisce tutto con boot completato e si legge che ogni 6 minuti circa riprende tutta la procedura di riavvio.
Ho tolto il NAS dal Rack per effettuare una procedura di Firmware Recovery collegandomi in locale ad una scheda di rete del mio PC ed ho scoperto con meraviglia che in questo modo il NAS completa la procedura e funziona correttamente con ping fisso stabile <1ms. Allora l'ho allora riattaccato allo switch ed ho visto che solo in questa situazione comincia il loop reboot.
Se avviato senza dischi, il NAS funziona anche se attaccato allo switch.
Ho colto l'occasione del funzionamento "in locale" al PC per ripristinare la versione di firmware precedente e stabile (4.3.3.0396 build 20171205), ma questo non ha risolto.
Ho provato a mettere un PC in sniffing con l'indirizzo del NAS sulla porta dello switch ed ho verificato che non ci sono sessioni interne o esterne di traffico illecito.
Ho provato a disabilitare la regola di NAT sul firewall per impedire il traffico dal NAS verso Internet e la situazione è sempre la stessa.
Penso di aver scritto tutto: sono in una situazione di stallo.
Scusate la lungaggine, ma come vedete la situazione è proprio anomala.
Che ne pensate?
Grazie