Librerie per traduzioni

di il
5 risposte

Librerie per traduzioni

Buongiorno a tutti, per lavoro ho spesso la necessità di dover tradurre il contenuto di un file html in 2 lingue diverse, ora la mia domanda è poiché è un qualcosa che faccio manualmente vorrei poter sfruttare le mie "competenze informatiche" per scrivere un programma che preso il file faccia il parsing e traduca automaticamente il contenuto.
E.s
File ita.html
<h2>ciao</h2>
dovrà scrivere nel file eng.html
<h2>hello</h2>.

Il linguaggio non ha importanza, volevo sapere se conoscete già qualche libreria in qualsiasi linguaggio che faccia il "parsing tag x tag" o se devo per forza controllare manualmente carattere per carattere dove inizia e finisce il tag. Inoltre volevo qualche suggerimento su come potrei poi effettuare la traduzione della parola: mi conviene creare un mio dizionario o in qualche modo Google mette un API a disposizione per utilizzare il servizio di traduzione?

Potrei usare internet per ricercare un po' ma è molto che non scrivo sul forum quindi poiché non ho fretta preferisco discuterne qui.

Grazie a tutti.

5 Risposte

  • Re: Librerie per traduzioni

    DrBeat1926 ha scritto:


    Il linguaggio non ha importanza, volevo sapere se conoscete già qualche libreria in qualsiasi linguaggio che faccia il "parsing tag x tag" o se devo per forza controllare manualmente carattere per carattere dove inizia e finisce il tag.
    Visto che il linguaggio non ha importanza, sarebbe bastato fare una ricerca su Google per questo tipo di esigenza, cercando - che ne so - "HTML parser" oppure "HTML scraping" e così via.

    DrBeat1926 ha scritto:


    Inoltre volevo qualche suggerimento su come potrei poi effettuare la traduzione della parola: mi conviene creare un mio dizionario o in qualche modo Google mette un API a disposizione per utilizzare il servizio di traduzione?
    Dipende: se si tratta di traduzioni in un contesto mirato, ad esempio nel campo dell'automazione o laddove è presente una terminologia molto specifica, l'uso di un dizionario "mirato" può essere consigliato, ma in tutti gli altri casi non ha senso, o meglio conviene di più appoggiarsi a un servizio esterno che faccia la traduzione in automatico e, oltre al dizionario, implementi anche tutte le altre cose che servono (es. regole grammaticali, frasi fatte, forme di coniugazione, ecc.).

    DrBeat1926 ha scritto:


    Potrei usare internet per ricercare un po' ma è molto che non scrivo sul forum quindi poiché non ho fretta preferisco discuterne qui.
    Per discutere di qualcosa, prima bisogna averla cercata.
  • Re: Librerie per traduzioni

    Alka ha scritto:


    DrBeat1926 ha scritto:


    Il linguaggio non ha importanza, volevo sapere se conoscete già qualche libreria in qualsiasi linguaggio che faccia il "parsing tag x tag" o se devo per forza controllare manualmente carattere per carattere dove inizia e finisce il tag.
    Visto che il linguaggio non ha importanza, sarebbe bastato fare una ricerca su Google per questo tipo di esigenza, cercando - che ne so - "HTML parser" oppure "HTML scraping" e così via.

    DrBeat1926 ha scritto:


    Inoltre volevo qualche suggerimento su come potrei poi effettuare la traduzione della parola: mi conviene creare un mio dizionario o in qualche modo Google mette un API a disposizione per utilizzare il servizio di traduzione?
    Dipende: se si tratta di traduzioni in un contesto mirato, ad esempio nel campo dell'automazione o laddove è presente una terminologia molto specifica, l'uso di un dizionario "mirato" può essere consigliato, ma in tutti gli altri casi non ha senso, o meglio conviene di più appoggiarsi a un servizio esterno che faccia la traduzione in automatico e, oltre al dizionario, implementi anche tutte le altre cose che servono (es. regole grammaticali, frasi fatte, forme di coniugazione, ecc.).

    DrBeat1926 ha scritto:


    Potrei usare internet per ricercare un po' ma è molto che non scrivo sul forum quindi poiché non ho fretta preferisco discuterne qui.
    Per discutere di qualcosa, prima bisogna averla cercata.
    Grazie per le dritte, per quanto riguarda le traduzioni in realtà non è un contesto mirato nel senso che si tratta di schede di prodotti che per quanto possono essere simili alcune parti, ci sono altre del tutto variabili tipo il "racconto del prodotto" (storia del prodotto etc.), quindi non sono neanche sicuro che un dizionario possa fare al caso mio, dovrei cercare tipo qualche API che passando la stringa mi restituisce la stringa tradotta. Per quanto riguarda il parsing cercherò anche se ripeto volevo semplicemente leggere la risposta di qualcuno che già l'aveva fatto, ma non c'è problema grazie lo stesso.
  • Re: Librerie per traduzioni

    Posso chiederti quale sia lo scopo finale?

    Ad oggi gran parte dei browser moderni traducono in automatico le pagine web. Posso quindi aprire il file ita.html (che è in italiano) e chiedere al browser di tradurlo in inglese. Così facendo mi dovrei trovare già tutti i testi in inglese.

    All'utente finale può andare bene? Se si, risparmi tempo e ottieni lo stesso risultato.

    Se invece devi partire dalle specifiche dell'articolo (quindi da dati memorizzati su un database o altro), perchè non traduci le informazioni presenti a DB prima di convertirle in html? In questo modo non hai bisogno di fare il parsing della pagina html.

    Lo dico anche perchè all'interno dell'html si possono trovare parti di codice JavaScript (che magari non va tradotto) e tutto quello che concerne CSS e il rendering grafico delle pagine. Dover gestire una pagina html complessa può essere un lavoro assai certosino
  • Re: Librerie per traduzioni

    Tutto vero, MA chi fa la ""vera"" traduzione e', molto spesso, "Google Translate".

    E per fare questo NON C'E' solo una libreria, c'e' una ""spatafiata"" di potenza di calcolo necessaria per far funzionare le reti neurali che sono state addrestrate con MILIONI/MILIARDI di esempi affinche' imparino a fare le traduzioni.

    E ""comunque"" la traduzione di un ""esperto umano"" non ha nulla a che fare con le ""approssimazioni"" (a volte ""ridicole"") di Google Translate.

    Le API di Google Translate sono "'disponibili"" come uno degli N-mila servizi messi a disposizione da "Google Cloud Platform".
    Ma c'e' anche Amazon, Microsoft, ... e tutte quelle piattaforme di forniscono servizi di "Machine Learning".

    OVVIAMENTE, l'idea di farsi una ""libreria di traduzioni in casa"" e' buona tanto quando quella di volersi costruire lo Space Shattle nello scantinato
  • Re: Librerie per traduzioni

    Grazie ad entrambi, in realtà lo scopo è molto più semplice.
    Nel mio caso quello che devo fare esattamente è:
    ho centinaia di file .html scritti in italiano, si tratta di HTML semplice non c'è JS ne nulla semplicemente nei div con all'interno dei testi.
    Quello che devo fare è scrivere lo stesso file ma in inglese e bulgaro, ma fino ad ora è stato sempre fatto manualmente (ovviamente per ogni file veniva fatta la traduzione immediatamente, ora invece sono stati scritti prima un centinaio di file.html e ora occorre fare la traduzione ).


    Comunque mi sono reso conto che effettivamente posso tradurlo dal borwser e copiarmi il sorgente.
    Il problema non sussiste....


    EDIT: si può chiudere
Devi accedere o registrarti per scrivere nel forum
5 risposte