Salve, sto imparando a programmare in parallelo per fare ciò sto usando la libreria OpenMp.
L'operazione che devo effettuare è la convuluzione di una matrice, la matrice che ho in input è una matrice quadrata, mentre la matrice che uso come maschera è una 4x4.
Per fare questa operazione volevo massimizzare l'utilitilizzo del mio computer il quale ha 11 thread e 11 cpu, per migliorare quindi il rendimento pensavo di suddividere la matrice di input in 10 sottomatrici ognuna delle quali operava uno dei miei thread e l'ultimo thread rimanente faceva da thread master ovvero controllava gli altri.
Secondo voi è valida la mia idea, so che potrebbe essere uno spreco parallelizzare un codice cosi semplice ma il mio scopo è imparare a parallelizzare
Per caso secondo voi ci sarebbero altre idee migliori?