Quantizzazione CNN 4 bit

Claudio137

il 11 feb 2025, 11:02

2 risposte

Claudio137

Pochi posts

Iscritto da: feb, 2025

Messaggi:: 2

Quantizzazione CNN 4 bit

11 feb 2025, 11:37

Ciao, per un progetto avrei bisogno di effettuare una quantizzazione variabile per layer di una cnn. L'obiettivo è fare inferenza con pesi e bias quantizzati a 4 bit. Il problema che ho avuto è che usando Tensorflow lite posso avere si pesi a 8 bit ma bias con 32 bit e non ho modo né di variare a seconda del layer ne di uniformare a 8 bit anche i bias. Mentre con Tensorflow model optimization (MOT) ottengo un quantizzazione virtuale con floating point nonostante imposto pesi e bias a 8 o 4 bit.

Avete modo di indicarmi degli esempi dove effettivamente si possono visualizzare pesi e bias a 8 bit ma anche a 4 bit nel formato intero e no floating point? Vi risulta un problema effettivo o sto affrontando male il problema?

Grazie mille per l'attenzione.

2 Risposte

M
migliorabile
Super Famoso
Iscritto da
apr, 2013
Messaggi:
6113
Re: Quantizzazione CNN 4 bit
11 feb 2025, 14:02
Devi usare proprio TF?
Con Pytorch hai maggiori possibilita' di trovare quello che ti serve.
Guarda anche Huggingface: bitesandbytes.
Supportano sia TF che Pytorch.
C
Claudio137
Pochi posts
Iscritto da
feb, 2025
Messaggi:
2
Re: Quantizzazione CNN 4 bit
12 feb 2025, 17:22
11/02/2025 - migliorabile ha scritto:
Devi usare proprio TF?
Con Pytorch hai maggiori possibilita' di trovare quello che ti serve.
Guarda anche Huggingface: bitesandbytes.
Supportano sia TF che Pytorch.
Ti ringrazio, con bitsandbytes e Pytorch sono riuscito effettivamente a vedere i pesi in 4 bit. Vengono memorizzati due pesi insiemi con 8 bit.

Devi accedere o registrarti per scrivere nel forum

2 risposte

Quantizzazione CNN 4 bit

Quantizzazione CNN 4 bit

2 Risposte

Re: Quantizzazione CNN 4 bit

Re: Quantizzazione CNN 4 bit