Salvataggio pagina php

di il
3 risposte

Salvataggio pagina php

Ciao a tutti,
sto scrivendo un programma in cui mi serve l'output fornito da una pagina PHP.
Il problema è che, quando provo a leggerne il contenuto tramite: "URL cs = new URL("https://paginarichiesta.ph")", mi fornisce l'output con un errore di autenticazione.
Premetto che tale pagina è visualizzabile solo dopo aver effettutato un login.
Esistono soluzioni? Avevo aggirato il problema salvando la pagina in locale e poi elaborandola, ma tale soluzione non mi soddisfa più.
Grazie

3 Risposte

  • Re: Salvataggio pagina php

    lic_198 ha scritto:


    sto scrivendo un programma in cui mi serve l'output fornito da una pagina PHP.
    Il problema è che, quando provo a leggerne il contenuto tramite: "URL cs = new URL("https://paginarichiesta.ph")", mi fornisce l'output con un errore di autenticazione.
    Premetto che tale pagina è visualizzabile solo dopo aver effettutato un login.
    Esistono soluzioni? Avevo aggirato il problema salvando la pagina in locale e poi elaborandola, ma tale soluzione non mi soddisfa più.
    Grazie
    Purtroppo, quando si vuole fare "programmaticamente" l'accesso a pagine di un sito e specialmente se c'è di mezzo una autenticazione, la questione può diventare anche abbastanza complessa perché ci sono parecchie variabili da considerare. E ne dico alcune giusto quelle che mi vengono in mente.

    - L'autenticazione come è fatta? Tramite autenticazione a livello HTTP (la "basic" o la "digest" authentication)? Oppure è fatta con il classico form gestito a livello "applicativo"?
    - Se è quest'ultima, si può fare direttamente la request in POST al url di autenticazione? Oppure bisogna prima fare la request in GET alla pagina che mostra il form, magari perché c'è bisogno di prendere (tipicamente) dei cookie da rimandare nella POST?
    - Se c'è un form di login quali sono i nomi dei campi per username/password (non ci sono standard su questo, ogni sito sceglie cosa vuole)?
    - La pagina che mostra il form, utilizza dei truschini Javascript per offuscare/criptare ulteriormente la password prima che venga fatto il submit del form?

    Se, come si può immaginare, il sito non è tuo gestito da te, devi scoprire tu tutti questi aspetti. Devi utilizzare un browser che consente di usare dei "developer tool" (es. Firefox con l'estensione Firebug), analizzare i sorgenti delle pagine, tracciare le chiamate, vedere quale è la sequenza delle request/response, osservare se vengono scambiati cookie, ecc...

    Senza altre tue indicazioni più precise a riguardo, non ti si può aiutare ... mi spiace.
  • Re: Salvataggio pagina php

    Grazie mille, proverò a capirne di più in termini di autenticazione.
    Temevo non fosse di immediata soluzione
  • Re: Salvataggio pagina php

    andbin ha scritto:


    lic_198 ha scritto:


    sto scrivendo un programma in cui mi serve l'output fornito da una pagina PHP.
    Il problema è che, quando provo a leggerne il contenuto tramite: "URL cs = new URL("https://paginarichiesta.ph")", mi fornisce l'output con un errore di autenticazione.
    Premetto che tale pagina è visualizzabile solo dopo aver effettutato un login.
    Esistono soluzioni? Avevo aggirato il problema salvando la pagina in locale e poi elaborandola, ma tale soluzione non mi soddisfa più.
    Grazie
    Purtroppo, quando si vuole fare "programmaticamente" l'accesso a pagine di un sito e specialmente se c'è di mezzo una autenticazione, la questione può diventare anche abbastanza complessa perché ci sono parecchie variabili da considerare. E ne dico alcune giusto quelle che mi vengono in mente.

    - L'autenticazione come è fatta? Tramite autenticazione a livello HTTP (la "basic" o la "digest" authentication)? Oppure è fatta con il classico form gestito a livello "applicativo"?
    - Se è quest'ultima, si può fare direttamente la request in POST al url di autenticazione? Oppure bisogna prima fare la request in GET alla pagina che mostra il form, magari perché c'è bisogno di prendere (tipicamente) dei cookie da rimandare nella POST?
    - Se c'è un form di login quali sono i nomi dei campi per username/password (non ci sono standard su questo, ogni sito sceglie cosa vuole)?
    - La pagina che mostra il form, utilizza dei truschini Javascript per offuscare/criptare ulteriormente la password prima che venga fatto il submit del form?

    Se, come si può immaginare, il sito non è tuo gestito da te, devi scoprire tu tutti questi aspetti. Devi utilizzare un browser che consente di usare dei "developer tool" (es. Firefox con l'estensione Firebug), analizzare i sorgenti delle pagine, tracciare le chiamate, vedere quale è la sequenza delle request/response, osservare se vengono scambiati cookie, ecc...

    Senza altre tue indicazioni più precise a riguardo, non ti si può aiutare ... mi spiace.

    Ho scoperto qualcosina: per esempio, la richiesta in POST non si può fare ...
    Però mi è venuta un'idea ma non so se sia possibile realizzarla:
    una volta aperta la sessione, viene memorizzato il valore della sessione in un cookie, giusto?
    Tramite programma, non posso in qualche modo passare questo valore? Dopotutto, il browser non si comporta così?
Devi accedere o registrarti per scrivere nel forum
3 risposte