lic_198 ha scritto:
sto scrivendo un programma in cui mi serve l'output fornito da una pagina PHP.
Il problema è che, quando provo a leggerne il contenuto tramite: "URL cs = new URL("https://paginarichiesta.ph")", mi fornisce l'output con un errore di autenticazione.
Premetto che tale pagina è visualizzabile solo dopo aver effettutato un login.
Esistono soluzioni? Avevo aggirato il problema salvando la pagina in locale e poi elaborandola, ma tale soluzione non mi soddisfa più.
Grazie
Purtroppo, quando si vuole fare "programmaticamente" l'accesso a pagine di un sito e specialmente se c'è di mezzo una autenticazione, la questione può diventare anche abbastanza complessa perché ci sono parecchie variabili da considerare. E ne dico alcune giusto quelle che mi vengono in mente.
- L'autenticazione come è fatta? Tramite autenticazione a livello HTTP (la "basic" o la "digest" authentication)? Oppure è fatta con il classico form gestito a livello "applicativo"?
- Se è quest'ultima, si può fare direttamente la request in POST al url di autenticazione? Oppure bisogna prima fare la request in GET alla pagina che mostra il form, magari perché c'è bisogno di prendere (tipicamente) dei cookie da rimandare nella POST?
- Se c'è un form di login quali sono i nomi dei campi per username/password (non ci sono standard su questo, ogni sito sceglie cosa vuole)?
- La pagina che mostra il form, utilizza dei truschini Javascript per offuscare/criptare ulteriormente la password
prima che venga fatto il submit del form?
Se, come si può immaginare, il sito non è tuo gestito da te, devi scoprire
tu tutti questi aspetti. Devi utilizzare un browser che consente di usare dei "developer tool" (es. Firefox con l'estensione Firebug), analizzare i sorgenti delle pagine, tracciare le chiamate, vedere quale è la sequenza delle request/response, osservare se vengono scambiati cookie, ecc...
Senza altre tue indicazioni più precise a riguardo, non ti si può aiutare ... mi spiace.