Foto con SOLO testo o foto generica?
La manipolazione dei pixel e' l'equivalende di salire sul marciapiede, quando il tuo obiettivo e' arrivare in cima all'Everest!
Se e' con SOLO testo, allora devi usare una libreria OCR (optical character recognition).
Se e' una foto generica, sono tecniche ESTREMAMENTE sofisticate di elaborazioni di immagini.
MOLTO piu' complesse dell'OCR, il quale SA GIA' che deve analizzare dei caratteri.
Oggi, questi tipi di algoritmi fanno parte di quel settore dell'informatica che si chiama Deep Learning
Fondamentalmente devi mettere in piedi piu' strati di elaborazione, dove OGNI strato gia' di per se' e' estremamente complesso:
1) dai pixel devi estrarre i contorni
2) dai contorni devi estrarre delle sagome coerenti
3) dalle sagome devi estrarre le lettere e la relativa posizione
4) dalla vicinanza delle lettere, le parole
Ma per fare questo, se non trovi gia' una libreria pronta ma la vuoi realizzare da te, devi farti
1) superiori
2) universita'
3) TANTO, TANTO, .... studio
4) e TANTISSIMA matematica, statistica, e ALGORITMI (quelli che conosci, se ne conosci qualcuno, non sono nulla rispetto a quello che dovresti conoscere)
in confronto, saper programmare e' come saper prendere un sasso e saperlo lanciare