Ciao a tutti, quando eseguo il codice inerente all'estrazione di testo da un file immagine, ho questo errore:
text.append(str(pytesseract.image_to_string(Image.open(imagefilename)),encoding='utf-8'))
TypeError: str() takes at most 1 argument (2 given)
dove l'struzione è :
text.append(str(pytesseract.image_to_string(Image.open(imagefilename)),encoding='utf-8'))
avete qualche idea ? So che la sintassi corretta di str è :
str(object, encoding=encoding, errors=errors)
ma o con un solo argomento o con tre il risultato non cambia. Se tolgo tutti gli argomenti e lascio solo :
text.append(str(pytesseract.image_to_string(Image.open(imagefilename)),encoding='utf-8'))
il risultato è :
File "/home/luigi/Scrivania/lettura_pdf.py", line 87, in <module>
text.append(str(pytesseract.image_to_string(Image.open(imagefilename))))
UnicodeEncodeError: 'ascii' codec can't encode character u'\u201c' in position 307: ordinal not in range(128)
qualche suggerimento?