Quando e come si visita noisefromamerika

/ Articolo / Quando e come si visita noisefromamerika
  • Condividi
Andrea Moro

Questo post è il risultato di un dibattito fra editors che dura da diversi anni (fa un po' impressione usare questa parola visto che sembra l'altroieri il giorno in cui abbiamo iniziato) sulla strategia ottimale per massimizzare il numero di visite. Secondo una fazione gli articoli attirano visite, perciò meglio pubblicare tutto quanto disponibile, anche con frequenza plurigiornaliera. Secondo altri, fra cui il sottoscritto, meglio cadenzare le uscite per massimizzare la probabilità che ogni giorno ci sia un nuovo articolo. In quanto segue spiego la mia teoria e la corredo di evidenza empirica.

La mia "teoria" è abbastanza semplice: il lettore medio è abitudinario, ci visita ogni giorno, ma quando non trova nulla dopo un po' si stanca, per cui (1) sono da evitare il più possibile ritardi nella pubblicazione di articoli di più di un paio di giorni. Quando invece la pubblicazione è troppo frequente, i sommari scendono nella homepage per lasciar posto ai nuovi articoli. Frequentemente il terzo o anche il secondo sommario si trovano in una posizione invisibile senza scorrere la pagina verso il basso. E il lettore pigro non vuole mettere la mano sul mouse o cliccare per controllare cosa c'è. Io stesso a volte non mi accorgo dell'esistenza di nuovi articoli se non sono in cima alla fila, e se non vengono citati nel blocco degli ultimi commenti; (2) andrebbe dunque evitata la pubblicazione troppo frequente di articoli.

Per dimostrare la teoria che sottintende questo secondo mio auspicio  (per il primo occorrerebbero dati più precisi di cui non sono a disposizione), ho scaricato i dati salvati sul server sul numero di letture di ciascun articolo, assieme alla loro data e ora di pubblicazione. Ci sono due fattori che complicano l'analisi. Il primo è che esiste un trend di crescita continua di visite che ovviamente influisce sulle letture. Il secondo è che i commenti tendono a moltiplicare le letture, perché le pagine vengono ricaricate da chi controlla i nuovi commenti. È difficile tener conto delle sole "prime visite" a ciascun articolo da parte di ciascun utente; in teoria sarebbe possibile salvare i dati per IP, ma i dati non li abbiamo. Ci accontentiamo dunque di proseguire l'analisi con i dati su visite totali per articolo, numero commenti, e data di pubblicazione.

Ho eliminato tutti gli articoli con più di 18mila visite, si tratta di una ventina di articoli speciali che vengono visitati in continuazione. Il campione risultante è di 1485 articoli. Ho anche eliminato tutti gli articoli pubblicati dopo il 31 Gennaio 2011. Per quanto riguarda il trend, ho adottato due procedure. La prima è di detrendizzare la serie delle visite con un Hodrick-Prescott filter (e che altro se no?). Nella seconda ho applicato un semplice trend quadratico. I risultati della regressione OLS sono nelle prime due colonne della tabella sottostante (errori standard in parentesi). Il risultato di nostro interesse sta nella prima riga, che riporta una variabile che ha valore uno se l'articolo è stato seguito da un articolo pubblicato entro un giorno.


Visite
(Residuo H-P)
Visite Visite
(Residuo H-P)
Visite
Nuovo articolo entro un giorno-579.49**-651.28**-253.35**-324.95**
(115.11)(119.98)(78.66)(82.75)
Pubblicato il Lunedi-344.15-367.98-162.50-193.81
(208.05)(216.74)(141.54)(148.86)
Pubblicato il Martedi-405.95-434.87*-267.46-292.44
(210.81)(219.63)(143.38)(150.82)
Pubblicato il Mercoledi-599.84**-630.13**-450.56**-480.90**
(214.91)(224.56)(146.17)(154.21)
Pubblicato il Giovedi-590.71**-564.65*-352.96*-346.12*
(213.26)(222.30)(145.12)(152.71)
Pubblicato il Venerdi-943.46**-975.30**-374.94**-375.49*
(211.72)(220.54)(144.61)(152.12)
Pubblicato il Sabato-890.24**-959.15**-372.33*-460.62**
(230.46)(240.04)(157.20)(165.24)
Età di nfa (giorni)5.21**5.23**
(0.49)(0.34)
Età ^2-0.00**-0.00**
(0.00)(0.00)
Numero commenti (residuo)41.64**41.45**
(1.00)(1.02)
Costante842.54**3011.21**416.81**2607.33**
(165.56)(256.31)(113.04)(176.24)

Dai risultati della prima e seconda colonna si vede che la pubblicazione di un articolo entro un giorno toglie circa 600 visite (risultato significativo all'1%, mi sono persino permesso di usare le stellette, cosa che di solito non faccio). Le altre righe indicano altre caratteristiche di un articolo, come la data di pubblicazione ed il numero di commenti. La domenica è il giorno migliore per pubblicare. Articoli pubblicati all'inizio della settimana risultano in un numero di visite inferiore a quelli della domenica, ma non in modo significativo. Il risultato peggiore è per gli articoli pubblicati all'approssimarsi del fine settimana.

Il risultato è robusto al metodo di de-trendizzazione. Ho anche testato vari smoothing parameters per il filtro H-P, e il risultato non cambia. La pubblicazione di due articoli in un giorno peggiora le cose ma non di molto, ed in modo non statisticamente significativo. Ho provato a variare anche il "cutoff" di un giorno dalla pubblicazione da 0.2 a 2 giorni, ma la soglia di 1 giorno sembra essere quella rilevante. Va detto che l'ora esatta di pubblicazione è soggetta ad un discreto "measurement error": il sistema che usiamo assegna l'ora al momento della prima creazione di un articolo. In fase di approvazione, l'editor di turno aggiorna la data di pubblicazione ma raramente anche l'ora (almeno io lo faccio raramente). In media questo non dovrebbe influire molto sui risultati.

Le ultime due colonne suggeriscono che parte di questa riduzione è dovuta al minore numero di commenti. In realtà sia commenti che letture dipendono dalla qualità dell'articolo, quindi c'è sicuramente un bias nelle stime, ma lasciamo perdere la questione (non sto scrivendo un paper per JPE). Includendo nella regressione il numero di commenti detrendizzato (con HP nella terza colonna, e con una quadratica nell'ultima) l'effetto "Nuovo articolo" si riduce, ma rimane significativo. L'effetto derivato dal residuo del numero dei commenti rispetto al trend è importante, circa 40 visite per commento. Se l'omitted variable bias di cui parlavo prima non è rilevante, ne deduciamo che parte dell'effetto negativo della pubblicazione frequente di articoli deriva anche dalla riduzione del numero dei commenti.

Quali articoli leggono di più i nostri lettori? I risultati, dalla seguente tabella, sono confortanti. Gli articoli più visitati sono gli Ex-kathedra, con circa 3206 visite in più rispetto a Biblioteka, in media, metà delle quali dovute al numero di commenti sopra il trend in questi articoli, come indica la seconda colonna. Le recensioni di Biblioteka e gli articoli "meta" dove ci guardiamo sull'ombelico sono i meno visitati.


Visite
(Residuo H-P)
Biblioteka(omessa)
ExK3206.24**1596.38**
(290.38)(204.10)
Davinci2247.22**985.03**
(329.91)(229.55)
Avvelenata2337.21**840.75**
(286.85)(201.18)
Markopolo2003.89**757.56**
(329.30)(229.09)
Passaparola1483.76**461.49*
(280.37)(194.92)
FLG2429.20**856.05**
(288.08)(202.37)
Meta1038.53*589.38*
(415.25)(286.47)
N. commenti (residuo)40.23**
(1.00)
Costante-2116.91**-835.97**
(257.76)(180.49)

I risultati non sono granché diversi se mettiamo assieme tutte le variabili della prima con quelle della seconda tabella. Il messaggio a me sembra abbastanza chiaro, e supportato da una evidenza abbastanza solida: gli articoli vanno cadenzati, per quanto possibile. A noi redattori inoltre, l'invito a pubblicare un maggior numero di ex-kathedra, particolarmente apprezzati dai lettori.

Indietro

Commenti

Ci sono 39 commenti

Troppo complicato. Dovreste dirci come sono distribuiti i redattori tra le due fazioni così decidiamo chi ha ragione a simpatia. ;-)

A naso, presumo che il maggior numero di visite per gli ex-kathedra possa derivare anche dal maggior numero di commenti che quel tipo di articoli stimola. Per cui è vero che sono particolarmente graditi ai lettori (io li gradisco assai, e mi unisco all'appello per farne di più) ma non è detto che contribuiscano significativamente ad ingrandire la platea dei lettori.

Casomai un suggerimento: se è probabilmente vero che i post vanno dosati per non creare buchi come quelli che si sono formati recentemente nella programmazione, è vero anche che questi buchi non possono essere riempiti con qualsiasi materiale si abbia per le mani. In qualche caso ho avuto l'impressione che nFA avesse abbandonato gli articoli sostanziosi per darsi più alla polemica politica spicciola (interessante e spesso divertente, comunque, ma meno sostanziosa). Allora, se il centro del vostro lavoro sono gli ex-kathedra, dosate quelli, per cominciare, magari uno a settimana, a prescindere dalla frequenza di pubblicazione degli altri pezzi

Ho eliminato tutti gli articoli con più di 18mila visite, si tratta di una ventina di articoli speciali che vengono visitati in continuazione. Il campione risultante è di 1485 articoli.

 

Ripropongo un suggerimento già fatto a suo tempo a Michele.

Oramai nFA ha un archivio di quasi 1500 articoli, il che vuol dire che il nuovo lettore "medio",  se non si mette alla ricerca degli articoli vecchi, cercando magari attraverso la nuvola di parole, si perde un bel po' di materiale interessante, cosa tra l'altro probabile, dato che hai appena detto che il lettore medio è "pigro"

D'altra parte, pare che ci siano venti articoli "speciali" con un numero di lettori oltre la media.

A questo punto, perchè non prevedere una sezione che contenga una sorta di "best of" o "nFA Hall of Fame", vale a dire articoli, scelti a insidacabile giudizio degli editors,  rapidamente consultabili  e che rappresentino una specie di biglietto da visita del sito, della sua storia e del suo spirito.

Non necessariamente i più letti, ma semplicemente quelli che per voi rappresentano meglio nFA.

 

A questo punto, perchè non prevedere una sezione che contenga una sorta di "best of" o "nFA Hall of Fame"

Sono d'accordo. 

Sono anche favorevole a non pubblicare più di un pezzo al giorno, io personalmente non ce la farei a seguirne due.

Io mi comporto esattamente come ipotizzato all'inizio dell'articolo

In base al mio comportamento, posso dire che la "teoria" di Andrea Moro e' quella che piu' mi piace. Due articoli interessanti nello stesso giorno generano un numero di commenti che non ho il tempo di seguire. Uno al giorno e-, per me, piu- "gestibile" (e pure piu' "digeribile", visto che spesso faccio parecchia fatica a capire il contenuto, data la mia totale ignoranza di tanti argomenti che vengono trattati).

Poi, NFA e' casa vostra, decidete quale sia il modo migliore per prendere una decisione, sono a disposizione tanti modi per decidere, dalle votazioni pure e semplici (una testa, un voto), alle votazioni "pesate" (chi pesa di piu' ha un voto piu' pesante, oppure chi e' piu' alto, o chi ce l'ha piu' lungo, il curriculum, ovviamente), al  duello dietro alle carmelitane scalze, per me va bene tutto. Basta che continuiate a cercare di famri capire. Se poi fate una sezione tipo "economia spiegata ai zucconi e ignoranti", mi fate un grosso regalo (dai, che tra poco e- il mio compleanno). No, non posso laurearmi in economia, non sono abbastanza ricco da fare lo studente e sono ormai troppo zuccone per affrontare un argomento cosi- diverso da quelli che tratto abitualmente.

Sarebbe un'ottima cosa che vi fosse una sezione così, con gli articoli "intramontabili". Non dovrebbe essere complicato confezionarla. Grazie

GD

Questa analisi non considera per nulla i lettori via feed RSS, non sono quanti sono su NfA ma in generale tendono a essere una parte molto importante del totale dei lettori.

Personalmente ho notato che sul mio blog il meglio era un articolo ogni due giorni, ma purtroppo non riuscivo a sostenere il ritmo, alla fine ora non pubblico da qualche mese e quindi non sono un buon parametro di controllo... :P

Propongo due sezioni: la prima il the best of di cui ha parlato chi mi precede: Patruno e Delfiol e la seconda del tipo: "ve lo avevamo detto..." in questo modo per chi ricerca senza essere sempre stato un vostro lettore ci sarà la possibilità di trovare un certo numero di articoli di una certa rilevanza che vi rappresentano.

p.s. OT oggi con explorer riesco a postare commenti:-)

Molto interessante. Mi permetto una proposta: perché non organizzare un'indagine survey sui lettori di nfa? Il volume di visite garantirebbe una numerosita' campionaria decente; gli editors potrebbero ottenere indicazioni interessanti non solo sul profilo dei lettori ma anche su come consumano i contenuti del blog; selezionare un campione rappresentativo dei visitatori, seppur operazione non immediata ed intuitiva, non sarebbe troppo complicato con un buon servizio di tracking.

forse per selezionare un campione sarebbe utile dare la possibilità da parte di chi scrive un articolo, che si suppone legga una gran parte dei commenti di dare un voto ai commentatori, nel corso del tempo la media di questi voti "peserebbe" i commentatori e discriminerebbe la fuffa dai commenti utili....

Insomma un troll che fa 300 commenti dovrebbe pesare molto di chi fa pochi commenti argomentati.

Un post al giorno può anche andar ben, dipende da quello che hai da dire. Se commenti l'attualità politica ed economica (e in Little Italy la sera quello che hanno detto/fatto la mattina già non è più vero) ci puoi stare, forse sarebbe da pensare una sezione Off Topic, in cui accedere se vuoi cazzeggiare, mentre post di stretta economia uno al giorno è impossibile/impensabile, conoscendo le risorse (scarse), ma anche la difficoltà di seguire poi il thread dei  commenti.

Personalmente seguo i thread dove sono coinvolte persone che so che dicono qualcosa di interessante, o quelli dei redattori (quelli sempre, ma se vi sentite la faccia umida sappiate che non sempre è umida per le leccate -)), da questo punto di vista vorrei il tasto "mi piace", perchè dato l'elevato numero di commentatori molte volte trovo che qualcuno ha già espresso il mio pensiero (se ne ho).

Per il resto va bene così, nFA è un piacevole luogo di discussione, mai banale, mai volgare soprattutto. E in cui il cervello va in moto, sempre.

 

forse sarebbe da pensare una sezione Off Topic, in cui accedere se vuoi cazzeggiare,

 

Dai, per questo c'e' facebook. Se mi "dai la molla" qui sopra, il livello crolla terribilmente.

Molto interessante, per me, visto che mi occupo professionalmente di siti web e considero imperdibile ogni aggiornamento del vostro sito.

Devo segnalare però che questa analisi è assai difforme dalle metriche che ci sia aspetta normalmente di trovare nell'analisi del comportamento dell'utenza dei siti web. Nonostante la metodologia rigorosa, infatti, è l'impostazione generale che mi suscita parecchi dubbi.

Ad esempio mi convince poco l'ipotesi di ricostruzione del comportamento dell'utente medio che non scrolla la pagina. Questi comportamenti in genere sono molto eterogenei ( ci saranno utenti del genere, ma quanto significativi nel totale? ). Oppure individuano problemi specifici dell'interfaccia del sito che si risolvono modificando l'interfaccia e non l'articolazione temporale dei contenuti.

Non capisco come sono stimati gli utenti. In genere si combinano grandi guai nella stima delle sessioni di navigazione di un singolo utente, nel calcolare nuovi utenti gli utenti che invece sono di ritorno, nel confondere gli utenti umani con programmi che indicizzano ( non mi stupirebbe se metà del traffico fosse di motori di ricerca o spider ). Da quanto intuisco si sono utilizzati metodi a posteriori partendo dai log, consiglierei di combinare queste stime con metodi basati sul page tagging e di sperimentare poi le ipotesi con test reali sul sito ( se si vuole un riferimento, io consiglio sempre Avinash Kaushik, Web Analytics 2.0 ).

Manca completamente un'analisi dei traffico entrante ( visite ricorrenti dirette, da motori di ricerca, da altri blog o da social networl, da feed e notifiche? ). La destagionalizzazione poi, è calcolata anche sulla base di un ciclo ricorrente settimanale? Questo sembra fondamentale nell'analisi e che potrebbe essere estremamente diverso a seconda della provenienza del traffico. O si tiene conto del trend stagionale mensile, in genere molto forte? ( d'estate, se avete un pubblico italiano c'è il deserto e la disparità fra giorni della stessa settimana è meno rilevante essendo in parte dipendente dall'uso di internet con accesso dal lavoro )

A naso, le ipotesi che fate sono plausibili, solo che il livello di analisi statistica mi sembra poco provante per il tipo di errori di misurazione che ritengo possibili o per la selezione delle variabili significative che si ritengono operare.

Felicissimo di aver contribuito in modo, spero, utile. Visto che normalmente non partecipo attivamente: passo troppo tempo a riflettere e cercare di capire, prima di commentare a sproposito sui temi propriamente economici.

 


Ad esempio mi convince poco l'ipotesi di ricostruzione del comportamento dell'utente medio che non scrolla la pagina. Questi comportamenti in genere sono molto eterogenei ( ci saranno utenti del genere, ma quanto significativi nel totale? ). Oppure individuano problemi specifici dell'interfaccia del sito che si risolvono modificando l'interfaccia e non l'articolazione temporale dei contenuti.

E' un'ipotesi che spiega i dati, che potrebbero certamente essere avere altra causa. L'effetto "articolo pubblicato entro 24 ore" pero' e' statisticamente significativo. Sono d'accordo che un'altra soluzione potrebbe essere la modifica dell'interfaccia. Se dovessimo "provare" che la gente non scrolla, basta mettere due articoli a fianco, per esempio. 

 

Capisco i tuoi dubbi ma non ho le aspettative che hai tu, tempo e risorse per fare un'analisi seria non le ho, quindi ho preso semplicemente gli hits ad ogni singola pagina (salvati dal software xaraya, non dal server log) per fare un'analisi rozza ma interessante. 

Come ho tenuto conto del trend e' spiegato nell'articolo: hodrick-prescott e quadratico. Il primo dovrebbe tener conto della frequenza annuale delle stagioni. Del ciclo settimanale ne tiene conto il fatto che ho messo le dummies dei giorni settimanali. 

 

Benche la scienza sia molto apprezzata e l'articolo molto stimato, esso e' troppo erudito. In breve non lo si e' capito. :-)

perché in tabella viene omessa la biblioteka?

Perche' in una regressione con N categorie devi sempre omettere una delle categorie, in modo che gli indicatori delle categorie siano N-1. Se le metti tutte, la regressione non funziona piu' perche' gli indicatori delle varie categorie diventano indistinguibili dalla costante (il livello "base" di visite).

Il termine tecnico e' collinearita'.

La scelta di quale categoria omettere e' assolutamente arbitraria: Andrea ha scelto bibliotheka (immagino) perche' e' quella con visite minori. I parametri associati alle altre categorie vanno interpretati come "rispetto a Bibliotheka". Ad esempio, gli articoli Ex-K generano in media 3.206 visite in piu' rispetto a quelli Bibliotheka.

 

Non so quanto io sia un lettore tipico. 

Ma vi leggo principalmente tramite i feed RSS, perciò raramente visito il sito. Ci vengo solo per i commenti: quando voglio lasciarne uno,  come ora, o più spesso quando voglio leggerne sull'articolo.

p.s.

Per quanto possibile leggo tutti gli articoli, tranne le poesie forse. ;)

 

 

Sola una cosa: Perchè?

Diceva tal Guccini da Modena:

"Vedi cara: è difficile spiegare, è difficile capire...se non hai capito già"

Per quanto riguarda l'ultima tabella, i coefficienti su certi tipi di articolo forse cambierebbero se uno includesse nella regressione anche gli autori dell'articolo, come di fatto sembri suggerire nell'interpretazione che dai della tabella.

In ogni caso, sono d'accordo sul fatto che sia bene cadenzare gli articoli anche se, come dici all'inizio, "sono da evitare il più possibile ritardi nella pubblicazione di articoli di più di un paio di giorni". Questo ultimo requisito ovviamente puo' essere a volte oneroso in termini di tempo. A questo proposito, io suggerirei a volte di postare anche articoli aperti. Per fare un esempio recente, e' da una settimana che Matteo Renzi appare nelle notizie. Voi magari non avete nulla da dire al riguardo o non avete tempo di leggervi le notizie rilevanti. Ma uno di voi potrebbe aprire un post dicendo: "Ma di questo Renzi, sapete qualcosa?". Cosi', con uno sforzo relativo, fate comunita' e vi tenete al passo con quello che succede.

ogni giorno (con due esclusioni), non uso RSS e la mia modestissima opinione e'c eh di imporre un limite di 101 commenti per "entita'". Toccata quella barriera, chi vuol dire di piu' si impegni a a scrivere un articolo che riassume, chiarifica, formalizza il problema rimasto aperto.

Due vantaggi: si riduce lo sforzo cogntiivo (io, almeno, non sono in grado di seguire uan discussione con duecento punti di vista, modulo ripetizione, scemenze etc.), secondo si mobilita piu' genet a scrievr di piu'

Svantaggio (serio) si da un incentivo a qualche cretinoa s crivere 100 volte la stessa cosa (se questo giustifichi una forma di censura, dicono nelle forze armate is above my pay grade.)

 

Penso che il valore di nFA sia nel livello di approfondimento e nella qualità dei commenti. Di conseguenza è meglio se gli articoli sono pochi. Anche sulla base dell'analisi svolta in questo post, mi pare che un articolo ogni due giorni sia già un buon ritmo.

Si potrebbe poi cercare di limitare il numero di commenti per partecipante, se non altro invitando a postare un solo commento di primo livello (dopo avere ragionato con calma sui contenuti).

Mi associo a chi suggerisce un collegamento diretto agli "intramontabili".