La mia "teoria" è abbastanza semplice: il lettore medio è abitudinario, ci visita ogni giorno, ma quando non trova nulla dopo un po' si stanca, per cui (1) sono da evitare il più possibile ritardi nella pubblicazione di articoli di più di un paio di giorni. Quando invece la pubblicazione è troppo frequente, i sommari scendono nella homepage per lasciar posto ai nuovi articoli. Frequentemente il terzo o anche il secondo sommario si trovano in una posizione invisibile senza scorrere la pagina verso il basso. E il lettore pigro non vuole mettere la mano sul mouse o cliccare per controllare cosa c'è. Io stesso a volte non mi accorgo dell'esistenza di nuovi articoli se non sono in cima alla fila, e se non vengono citati nel blocco degli ultimi commenti; (2) andrebbe dunque evitata la pubblicazione troppo frequente di articoli.
Per dimostrare la teoria che sottintende questo secondo mio auspicio (per il primo occorrerebbero dati più precisi di cui non sono a disposizione), ho scaricato i dati salvati sul server sul numero di letture di ciascun articolo, assieme alla loro data e ora di pubblicazione. Ci sono due fattori che complicano l'analisi. Il primo è che esiste un trend di crescita continua di visite che ovviamente influisce sulle letture. Il secondo è che i commenti tendono a moltiplicare le letture, perché le pagine vengono ricaricate da chi controlla i nuovi commenti. È difficile tener conto delle sole "prime visite" a ciascun articolo da parte di ciascun utente; in teoria sarebbe possibile salvare i dati per IP, ma i dati non li abbiamo. Ci accontentiamo dunque di proseguire l'analisi con i dati su visite totali per articolo, numero commenti, e data di pubblicazione.
Ho eliminato tutti gli articoli con più di 18mila visite, si tratta di una ventina di articoli speciali che vengono visitati in continuazione. Il campione risultante è di 1485 articoli. Ho anche eliminato tutti gli articoli pubblicati dopo il 31 Gennaio 2011. Per quanto riguarda il trend, ho adottato due procedure. La prima è di detrendizzare la serie delle visite con un Hodrick-Prescott filter (e che altro se no?). Nella seconda ho applicato un semplice trend quadratico. I risultati della regressione OLS sono nelle prime due colonne della tabella sottostante (errori standard in parentesi). Il risultato di nostro interesse sta nella prima riga, che riporta una variabile che ha valore uno se l'articolo è stato seguito da un articolo pubblicato entro un giorno.
Visite (Residuo H-P) | Visite | Visite (Residuo H-P) | Visite | |
---|---|---|---|---|
Nuovo articolo entro un giorno | -579.49** | -651.28** | -253.35** | -324.95** |
(115.11) | (119.98) | (78.66) | (82.75) | |
Pubblicato il Lunedi | -344.15 | -367.98 | -162.50 | -193.81 |
(208.05) | (216.74) | (141.54) | (148.86) | |
Pubblicato il Martedi | -405.95 | -434.87* | -267.46 | -292.44 |
(210.81) | (219.63) | (143.38) | (150.82) | |
Pubblicato il Mercoledi | -599.84** | -630.13** | -450.56** | -480.90** |
(214.91) | (224.56) | (146.17) | (154.21) | |
Pubblicato il Giovedi | -590.71** | -564.65* | -352.96* | -346.12* |
(213.26) | (222.30) | (145.12) | (152.71) | |
Pubblicato il Venerdi | -943.46** | -975.30** | -374.94** | -375.49* |
(211.72) | (220.54) | (144.61) | (152.12) | |
Pubblicato il Sabato | -890.24** | -959.15** | -372.33* | -460.62** |
(230.46) | (240.04) | (157.20) | (165.24) | |
Età di nfa (giorni) | 5.21** | 5.23** | ||
(0.49) | (0.34) | |||
Età ^2 | -0.00** | -0.00** | ||
(0.00) | (0.00) | |||
Numero commenti (residuo) | 41.64** | 41.45** | ||
(1.00) | (1.02) | |||
Costante | 842.54** | 3011.21** | 416.81** | 2607.33** |
(165.56) | (256.31) | (113.04) | (176.24) |
Dai risultati della prima e seconda colonna si vede che la pubblicazione di un articolo entro un giorno toglie circa 600 visite (risultato significativo all'1%, mi sono persino permesso di usare le stellette, cosa che di solito non faccio). Le altre righe indicano altre caratteristiche di un articolo, come la data di pubblicazione ed il numero di commenti. La domenica è il giorno migliore per pubblicare. Articoli pubblicati all'inizio della settimana risultano in un numero di visite inferiore a quelli della domenica, ma non in modo significativo. Il risultato peggiore è per gli articoli pubblicati all'approssimarsi del fine settimana.
Il risultato è robusto al metodo di de-trendizzazione. Ho anche testato vari smoothing parameters per il filtro H-P, e il risultato non cambia. La pubblicazione di due articoli in un giorno peggiora le cose ma non di molto, ed in modo non statisticamente significativo. Ho provato a variare anche il "cutoff" di un giorno dalla pubblicazione da 0.2 a 2 giorni, ma la soglia di 1 giorno sembra essere quella rilevante. Va detto che l'ora esatta di pubblicazione è soggetta ad un discreto "measurement error": il sistema che usiamo assegna l'ora al momento della prima creazione di un articolo. In fase di approvazione, l'editor di turno aggiorna la data di pubblicazione ma raramente anche l'ora (almeno io lo faccio raramente). In media questo non dovrebbe influire molto sui risultati.
Le ultime due colonne suggeriscono che parte di questa riduzione è dovuta al minore numero di commenti. In realtà sia commenti che letture dipendono dalla qualità dell'articolo, quindi c'è sicuramente un bias nelle stime, ma lasciamo perdere la questione (non sto scrivendo un paper per JPE). Includendo nella regressione il numero di commenti detrendizzato (con HP nella terza colonna, e con una quadratica nell'ultima) l'effetto "Nuovo articolo" si riduce, ma rimane significativo. L'effetto derivato dal residuo del numero dei commenti rispetto al trend è importante, circa 40 visite per commento. Se l'omitted variable bias di cui parlavo prima non è rilevante, ne deduciamo che parte dell'effetto negativo della pubblicazione frequente di articoli deriva anche dalla riduzione del numero dei commenti.
Quali articoli leggono di più i nostri lettori? I risultati, dalla seguente tabella, sono confortanti. Gli articoli più visitati sono gli Ex-kathedra, con circa 3206 visite in più rispetto a Biblioteka, in media, metà delle quali dovute al numero di commenti sopra il trend in questi articoli, come indica la seconda colonna. Le recensioni di Biblioteka e gli articoli "meta" dove ci guardiamo sull'ombelico sono i meno visitati.
Visite (Residuo H-P) | ||
---|---|---|
Biblioteka | (omessa) | |
ExK | 3206.24** | 1596.38** |
(290.38) | (204.10) | |
Davinci | 2247.22** | 985.03** |
(329.91) | (229.55) | |
Avvelenata | 2337.21** | 840.75** |
(286.85) | (201.18) | |
Markopolo | 2003.89** | 757.56** |
(329.30) | (229.09) | |
Passaparola | 1483.76** | 461.49* |
(280.37) | (194.92) | |
FLG | 2429.20** | 856.05** |
(288.08) | (202.37) | |
Meta | 1038.53* | 589.38* |
(415.25) | (286.47) | |
N. commenti (residuo) | 40.23** | |
(1.00) | ||
Costante | -2116.91** | -835.97** |
(257.76) | (180.49) |
I risultati non sono granché diversi se mettiamo assieme tutte le variabili della prima con quelle della seconda tabella. Il messaggio a me sembra abbastanza chiaro, e supportato da una evidenza abbastanza solida: gli articoli vanno cadenzati, per quanto possibile. A noi redattori inoltre, l'invito a pubblicare un maggior numero di ex-kathedra, particolarmente apprezzati dai lettori.
Troppo complicato. Dovreste dirci come sono distribuiti i redattori tra le due fazioni così decidiamo chi ha ragione a simpatia. ;-)
A naso, presumo che il maggior numero di visite per gli ex-kathedra possa derivare anche dal maggior numero di commenti che quel tipo di articoli stimola. Per cui è vero che sono particolarmente graditi ai lettori (io li gradisco assai, e mi unisco all'appello per farne di più) ma non è detto che contribuiscano significativamente ad ingrandire la platea dei lettori.
Casomai un suggerimento: se è probabilmente vero che i post vanno dosati per non creare buchi come quelli che si sono formati recentemente nella programmazione, è vero anche che questi buchi non possono essere riempiti con qualsiasi materiale si abbia per le mani. In qualche caso ho avuto l'impressione che nFA avesse abbandonato gli articoli sostanziosi per darsi più alla polemica politica spicciola (interessante e spesso divertente, comunque, ma meno sostanziosa). Allora, se il centro del vostro lavoro sono gli ex-kathedra, dosate quelli, per cominciare, magari uno a settimana, a prescindere dalla frequenza di pubblicazione degli altri pezzi