Errore SIGFPE con PyTorch

di il
3 risposte

Errore SIGFPE con PyTorch

Sto sperimentando con PyTorch su un PC Debian 12, AMD Phenom II e scheda video AMD. In alternativa ho un portatile (sempre Debian 12) con Intel i7 + nVidia Quadro 2000.

Sul portatile un programmino di due righe preso da un sito funziona, ma avendo il portatile solo 8 Giga di RAM, le prestazioni sono modeste.

Sul desktop dovrebbe funzionare meglio, avendo 16 GB di RAM. Il problema è che il programma termina quasi subito, con un SIGFPE.

Secondo voi, la causa è l'hardware? Il software dovrebbe essere lo stesso...

Qui ci sono le due righe del programma: sul portatile le esegue tutte e due (in circa 5 minuti), sul desktop dopo un minuto si ferma senza eseguire la seconda riga.

train_set = torchvision.datasets.CIFAR10(root='./data', train=True, download=True, transform=transforms.ToTensor())
test_set = torchvision.datasets.CIFAR10(root='./data', train=False, download=True, transform=transforms.ToTensor())

3 Risposte

  • Re: Errore SIGFPE con PyTorch

    Assicurati di NON USARE la scheda grafica.

    SIGFPE e' un Signal Floating Point Exception

    c'e' qualche pasticcio in qualche calcolo

    Assicurati di RI-scaricare i dataset: magari un dataset e' corrotto (vai tu a saperlo)

  • Re: Errore SIGFPE con PyTorch

    Aggiornamento: sono passato a Windows 10 con Python 3.11, stesso hardware. Ho installato torch 2.51 e torchvision 0.20.1 (perchè la versione "latest" non mi funzionava proprio, già su "import torchvision" mi ritornava Process finished with exit code -1073741676 (0xC0000094)).

    Ho ottenuto questo (in meno di un minuto):

    PycharmProjects\image_classifier\venv\Scripts\python.exe PycharmProjects\image_classifier\main.py 
    Downloading https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz to data\cifar-10-python.tar.gz
    100.0%
    Extracting data\cifar-10-python.tar.gz to data
    Files already downloaded and verified
    
    Process finished with exit code 0

    Ho cercato in pytorch.org quali fossero i minimi requisiti Python, ma ancora non li ho trovati.

    Intanto, andiamo avanti...

  • Re: Errore SIGFPE con PyTorch

    C'e' qualcosa che non funziona con la tua installazione.

    Assioma:

    DEVE FUNZIONARE e DEVE ESSERE SEMPLICE INSTALLARE

    Ho installato pytorch e tutte le librerie aggiuntive n-mila volte SENZA colpo ferire.

    QUINDI, SE a te non funziona, il pasticcio DEVE ESSERE da qualche altra parte.

    Ti consiglio di essere MOOOOLTO conservativo in termini di TUTTO: hardware, sistema operativo, software.

    In teoria AMD e Intel non dovrebbero generare problemi

    Il sistema operativo da usare e' Win11 NON Win10, oppure l'ultima LTS di Ubuntu

    Scheda grafica NVIDIA, ANCHE SE si dovrebbe poter utilizzare le schede grafiche AMD.

    Pero, c'e' sempre la possibilita' di utilizzare SOLO LA CPU.

    SE un'installazione "pulita", con SOLO pytorch non ti funziona, mi sa che hai problemi hardware.

    Soluzione? Nuovo hardware.

    Io uso miniconda per creare gli environment e PIP per fare TUTTE le installazioni, con tanto di requirements.txt per tenere traccia delle librerie da installare.

    Nel 99.999999% dei casi NON FORZO la versione della libreria.

    Attento alla versione di python che usi: DEVI USARE quella indicata per pytorch, NON una di testa tua.

    Per esempio per pytorch 2.6, bisogna usare python 3.13

    Rimane il problena che ogni tanto l'ultima versione delle librerie sono bacate oppure hanno incompatibilita', 

    quindi SEMPRE MEGLIO EVITARE l'ultima versione ma usare l'ultima versione STABILE o la versione precedente.

    Insomma, deve essere stata pubblicata almeno 6 mesi fa

Devi accedere o registrarti per scrivere nel forum
3 risposte