Quando e come si visita noisefromamerika

5 novembre 2011 andrea moro

Questo post è il risultato di un dibattito fra editors che dura da diversi anni (fa un po' impressione usare questa parola visto che sembra l'altroieri il giorno in cui abbiamo iniziato) sulla strategia ottimale per massimizzare il numero di visite. Secondo una fazione gli articoli attirano visite, perciò meglio pubblicare tutto quanto disponibile, anche con frequenza plurigiornaliera. Secondo altri, fra cui il sottoscritto, meglio cadenzare le uscite per massimizzare la probabilità che ogni giorno ci sia un nuovo articolo. In quanto segue spiego la mia teoria e la corredo di evidenza empirica.

La mia "teoria" è abbastanza semplice: il lettore medio è abitudinario, ci visita ogni giorno, ma quando non trova nulla dopo un po' si stanca, per cui (1) sono da evitare il più possibile ritardi nella pubblicazione di articoli di più di un paio di giorni. Quando invece la pubblicazione è troppo frequente, i sommari scendono nella homepage per lasciar posto ai nuovi articoli. Frequentemente il terzo o anche il secondo sommario si trovano in una posizione invisibile senza scorrere la pagina verso il basso. E il lettore pigro non vuole mettere la mano sul mouse o cliccare per controllare cosa c'è. Io stesso a volte non mi accorgo dell'esistenza di nuovi articoli se non sono in cima alla fila, e se non vengono citati nel blocco degli ultimi commenti; (2) andrebbe dunque evitata la pubblicazione troppo frequente di articoli.

Per dimostrare la teoria che sottintende questo secondo mio auspicio  (per il primo occorrerebbero dati più precisi di cui non sono a disposizione), ho scaricato i dati salvati sul server sul numero di letture di ciascun articolo, assieme alla loro data e ora di pubblicazione. Ci sono due fattori che complicano l'analisi. Il primo è che esiste un trend di crescita continua di visite che ovviamente influisce sulle letture. Il secondo è che i commenti tendono a moltiplicare le letture, perché le pagine vengono ricaricate da chi controlla i nuovi commenti. È difficile tener conto delle sole "prime visite" a ciascun articolo da parte di ciascun utente; in teoria sarebbe possibile salvare i dati per IP, ma i dati non li abbiamo. Ci accontentiamo dunque di proseguire l'analisi con i dati su visite totali per articolo, numero commenti, e data di pubblicazione.

Ho eliminato tutti gli articoli con più di 18mila visite, si tratta di una ventina di articoli speciali che vengono visitati in continuazione. Il campione risultante è di 1485 articoli. Ho anche eliminato tutti gli articoli pubblicati dopo il 31 Gennaio 2011. Per quanto riguarda il trend, ho adottato due procedure. La prima è di detrendizzare la serie delle visite con un Hodrick-Prescott filter (e che altro se no?). Nella seconda ho applicato un semplice trend quadratico. I risultati della regressione OLS sono nelle prime due colonne della tabella sottostante (errori standard in parentesi). Il risultato di nostro interesse sta nella prima riga, che riporta una variabile che ha valore uno se l'articolo è stato seguito da un articolo pubblicato entro un giorno.

Visite
(Residuo H-P)
Visite Visite
(Residuo H-P)
Visite
Nuovo articolo entro un giorno -579.49** -651.28** -253.35** -324.95**
(115.11) (119.98) (78.66) (82.75)
Pubblicato il Lunedi -344.15 -367.98 -162.50 -193.81
(208.05) (216.74) (141.54) (148.86)
Pubblicato il Martedi -405.95 -434.87* -267.46 -292.44
(210.81) (219.63) (143.38) (150.82)
Pubblicato il Mercoledi -599.84** -630.13** -450.56** -480.90**
(214.91) (224.56) (146.17) (154.21)
Pubblicato il Giovedi -590.71** -564.65* -352.96* -346.12*
(213.26) (222.30) (145.12) (152.71)
Pubblicato il Venerdi -943.46** -975.30** -374.94** -375.49*
(211.72) (220.54) (144.61) (152.12)
Pubblicato il Sabato -890.24** -959.15** -372.33* -460.62**
(230.46) (240.04) (157.20) (165.24)
Età di nfa (giorni) 5.21** 5.23**
(0.49) (0.34)
Età ^2 -0.00** -0.00**
(0.00) (0.00)
Numero commenti (residuo) 41.64** 41.45**
(1.00) (1.02)
Costante 842.54** 3011.21** 416.81** 2607.33**
(165.56) (256.31) (113.04) (176.24)

Dai risultati della prima e seconda colonna si vede che la pubblicazione di un articolo entro un giorno toglie circa 600 visite (risultato significativo all'1%, mi sono persino permesso di usare le stellette, cosa che di solito non faccio). Le altre righe indicano altre caratteristiche di un articolo, come la data di pubblicazione ed il numero di commenti. La domenica è il giorno migliore per pubblicare. Articoli pubblicati all'inizio della settimana risultano in un numero di visite inferiore a quelli della domenica, ma non in modo significativo. Il risultato peggiore è per gli articoli pubblicati all'approssimarsi del fine settimana.

Il risultato è robusto al metodo di de-trendizzazione. Ho anche testato vari smoothing parameters per il filtro H-P, e il risultato non cambia. La pubblicazione di due articoli in un giorno peggiora le cose ma non di molto, ed in modo non statisticamente significativo. Ho provato a variare anche il "cutoff" di un giorno dalla pubblicazione da 0.2 a 2 giorni, ma la soglia di 1 giorno sembra essere quella rilevante. Va detto che l'ora esatta di pubblicazione è soggetta ad un discreto "measurement error": il sistema che usiamo assegna l'ora al momento della prima creazione di un articolo. In fase di approvazione, l'editor di turno aggiorna la data di pubblicazione ma raramente anche l'ora (almeno io lo faccio raramente). In media questo non dovrebbe influire molto sui risultati.

Le ultime due colonne suggeriscono che parte di questa riduzione è dovuta al minore numero di commenti. In realtà sia commenti che letture dipendono dalla qualità dell'articolo, quindi c'è sicuramente un bias nelle stime, ma lasciamo perdere la questione (non sto scrivendo un paper per JPE). Includendo nella regressione il numero di commenti detrendizzato (con HP nella terza colonna, e con una quadratica nell'ultima) l'effetto "Nuovo articolo" si riduce, ma rimane significativo. L'effetto derivato dal residuo del numero dei commenti rispetto al trend è importante, circa 40 visite per commento. Se l'omitted variable bias di cui parlavo prima non è rilevante, ne deduciamo che parte dell'effetto negativo della pubblicazione frequente di articoli deriva anche dalla riduzione del numero dei commenti.

Quali articoli leggono di più i nostri lettori? I risultati, dalla seguente tabella, sono confortanti. Gli articoli più visitati sono gli Ex-kathedra, con circa 3206 visite in più rispetto a Biblioteka, in media, metà delle quali dovute al numero di commenti sopra il trend in questi articoli, come indica la seconda colonna. Le recensioni di Biblioteka e gli articoli "meta" dove ci guardiamo sull'ombelico sono i meno visitati.

Visite
(Residuo H-P)
Biblioteka (omessa)
ExK 3206.24** 1596.38**
(290.38) (204.10)
Davinci 2247.22** 985.03**
(329.91) (229.55)
Avvelenata 2337.21** 840.75**
(286.85) (201.18)
Markopolo 2003.89** 757.56**
(329.30) (229.09)
Passaparola 1483.76** 461.49*
(280.37) (194.92)
FLG 2429.20** 856.05**
(288.08) (202.37)
Meta 1038.53* 589.38*
(415.25) (286.47)
N. commenti (residuo) 40.23**
(1.00)
Costante -2116.91** -835.97**
(257.76) (180.49)

I risultati non sono granché diversi se mettiamo assieme tutte le variabili della prima con quelle della seconda tabella. Il messaggio a me sembra abbastanza chiaro, e supportato da una evidenza abbastanza solida: gli articoli vanno cadenzati, per quanto possibile. A noi redattori inoltre, l'invito a pubblicare un maggior numero di ex-kathedra, particolarmente apprezzati dai lettori.

39 commenti (espandi tutti)

Troppo complicato. Dovreste dirci come sono distribuiti i redattori tra le due fazioni così decidiamo chi ha ragione a simpatia. ;-)

A naso, presumo che il maggior numero di visite per gli ex-kathedra possa derivare anche dal maggior numero di commenti che quel tipo di articoli stimola. Per cui è vero che sono particolarmente graditi ai lettori (io li gradisco assai, e mi unisco all'appello per farne di più) ma non è detto che contribuiscano significativamente ad ingrandire la platea dei lettori.

Casomai un suggerimento: se è probabilmente vero che i post vanno dosati per non creare buchi come quelli che si sono formati recentemente nella programmazione, è vero anche che questi buchi non possono essere riempiti con qualsiasi materiale si abbia per le mani. In qualche caso ho avuto l'impressione che nFA avesse abbandonato gli articoli sostanziosi per darsi più alla polemica politica spicciola (interessante e spesso divertente, comunque, ma meno sostanziosa). Allora, se il centro del vostro lavoro sono gli ex-kathedra, dosate quelli, per cominciare, magari uno a settimana, a prescindere dalla frequenza di pubblicazione degli altri pezzi

Ho eliminato tutti gli articoli con più di 18mila visite, si tratta di una ventina di articoli speciali che vengono visitati in continuazione. Il campione risultante è di 1485 articoli.

 

Ripropongo un suggerimento già fatto a suo tempo a Michele.

Oramai nFA ha un archivio di quasi 1500 articoli, il che vuol dire che il nuovo lettore "medio",  se non si mette alla ricerca degli articoli vecchi, cercando magari attraverso la nuvola di parole, si perde un bel po' di materiale interessante, cosa tra l'altro probabile, dato che hai appena detto che il lettore medio è "pigro"

D'altra parte, pare che ci siano venti articoli "speciali" con un numero di lettori oltre la media.

A questo punto, perchè non prevedere una sezione che contenga una sorta di "best of" o "nFA Hall of Fame", vale a dire articoli, scelti a insidacabile giudizio degli editors,  rapidamente consultabili  e che rappresentino una specie di biglietto da visita del sito, della sua storia e del suo spirito.

Non necessariamente i più letti, ma semplicemente quelli che per voi rappresentano meglio nFA.

 

A questo punto, perchè non prevedere una sezione che contenga una sorta di "best of" o "nFA Hall of Fame"

Sono d'accordo. 

Sono anche favorevole a non pubblicare più di un pezzo al giorno, io personalmente non ce la farei a seguirne due.

A questo punto, perchè non prevedere una sezione che contenga una sorta di "best of" o "nFA Hall of Fame"

 

Concordo. Il modo migliore per aumentare la voce di nfA è quello di rendere facilmente accessibili le sue idee di fondo.

E' ovvio che il successo di una idea o di un programma venga deciso dall'esposizione mediatica che viene loro concesso da tv e giornali "mainstream". Per sbarcare sui media, nfA deve prima convincere del proprio valore il giornalista che per curiosità apra il sito. Se dovrà navigare tra 1.500 articoli, si spazientirà e vi rifilerà sotto qualche etichetta banale. Se invece vedrà un elenco sistematico e ordinato di idee di facile consultazione, non potrà che rimanerne colpito e decidere di parlar di voi. D'altronde i giornalisti sono di bocca buona e non ci mettono molto a creare un nuovo guru: Vendola ha ottenuto un'esposizione mostruosa con quattro cazzate sulla "narrazione" e la "poesia"!

nfA è un mezzo di divulgazione straordinario e non ha pari quanto a qualità di contenuti. Credo che abbia un potenziale di crescita gigantesco e che il botto potrebbe arrivare da un momento all'altro. Infatti quando sua Emittenza lascerà il suo ingombrante posto sulla scena, ci sarà molta confusione sul da farsi e si apriranno nuovi spazi per idee e proposte.

A volte leggo commenti poco fiduciosi da parte dei redattori. E' comprensibile: dopo 5 anni di attività, da una parte il sito si riempe di commentatori inutili e boriosi, dall'altra il dibattito politico sembra sempre più impermeabile a ragionevolezza e serietà. Però dovete solo avere pazienza. I vosti lettori stanno diffondendo il sito, lentamente ma inesorabilemente. E dato che Facebook ha reso possibile le rivolte arabe, volete che non riesca a attirare l'attenzione di un Travaglio o di una Gruber?

---

ps. Ecco quali articoli dovrebbero avere maggior esposizione secondo me:

-Sulla crisi dei debiti sovrani europei (1; 2; 3; 4)

-Sulla Crisi dei mutui subprime del 2008 (1; 2; 3; 4)

-Sulla tassa sulle transazioni finanziarie (1)

-Su destra/sinistra e le diverse nozioni di uguaglianza (1; 2)

-Sul mercato del lavoro (1; 2)

-Sul federalismo fiscale (1; 2; 3)

-Sull'evasione fiscale al Nord e al Sud (1; 2)

-Sulla riforma sanitaria di Obama (1; 2)

-Sull'università (1; 2; 3)

-Sulle liberalizzazioni da fare (1)

-Sulla Lega Nord (1)

-Sul Pd (1)

-Sulla questione palestinese (1)

-Sulle strampalate idee di Ratzinger (1)

 

...volete che non riesca a attirare l'attenzione di un Travaglio o di una Gruber?

Credi veramente che la loro attenzione abbia bisogno di essere attirata? Che abbiano bisogno di "scoprire" nfA?

Sanno già benissimo di che si tratta (es: Boldrin e Bisin scrivono su "Il Fatto" fondato da Travaglio) semplicemente non interessa. "Non interessa" perchè non porta avanti le idee che interessa loro diffondere.

Un conto è sapere che nfA esiste, un altro è convincersi che ci sia qualcosa di buono in pentola....
A parer mio i giornalisti non sono così schizzinosi e devono ancora inquadrare nfA.

D'altronde quando Futuro e Libertà si staccò dal Pdl, Travaglio disse che un movimento di destra e antiberlusconiano (sic) era una novità assoluta! E per tutta l'estate scorsa ci siamo sorbiti le dichiarazioni di Bocchino...

Quindi sono ottimista.

Time will tell.

troppo ottimista! Per me li hanno inquadrati benissimo.

Non saprei dire se la Gruber ci legge, ma nella Redazone del FQ conoscono molto bene NfA, ne hanno un'ottima opinione e alcuni articoli vengono anche pubblicati sul Fatto on line. Sono ancora troppo pochi, ma non per cattiva volonta' del FQ, piuttosto perche' non viene utilizzato appieno quel canale (che adesso utilizza anche LaVoce). 

Mi sono attivato io stesso per fa ottenere a NfA il codice di accesso alla piattaforma blog del FQ, quindi il mio invito e' ad utilizzarla piu' spesso. 

 

 

Se posso permettermi, suggerirei di introdurre una sezione FAQ, in buona evidenza su una colonna laterale. Un buon modello da copiare potrebbe essere quello di questo sito. Su SkepticalScience questo modello è portato alle estreme conseguenze: abbiamo dei bottoni che permettono di rileggersi degli articoli tematici, e una bella lista numerata con tutti i miti pseudoscientifici smontati uno per uno.

Io mi comporto esattamente come ipotizzato all'inizio dell'articolo

In base al mio comportamento, posso dire che la "teoria" di Andrea Moro e' quella che piu' mi piace. Due articoli interessanti nello stesso giorno generano un numero di commenti che non ho il tempo di seguire. Uno al giorno e-, per me, piu- "gestibile" (e pure piu' "digeribile", visto che spesso faccio parecchia fatica a capire il contenuto, data la mia totale ignoranza di tanti argomenti che vengono trattati).

Poi, NFA e' casa vostra, decidete quale sia il modo migliore per prendere una decisione, sono a disposizione tanti modi per decidere, dalle votazioni pure e semplici (una testa, un voto), alle votazioni "pesate" (chi pesa di piu' ha un voto piu' pesante, oppure chi e' piu' alto, o chi ce l'ha piu' lungo, il curriculum, ovviamente), al  duello dietro alle carmelitane scalze, per me va bene tutto. Basta che continuiate a cercare di famri capire. Se poi fate una sezione tipo "economia spiegata ai zucconi e ignoranti", mi fate un grosso regalo (dai, che tra poco e- il mio compleanno). No, non posso laurearmi in economia, non sono abbastanza ricco da fare lo studente e sono ormai troppo zuccone per affrontare un argomento cosi- diverso da quelli che tratto abitualmente.

Sarebbe un'ottima cosa che vi fosse una sezione così, con gli articoli "intramontabili". Non dovrebbe essere complicato confezionarla. Grazie

GD

Questa analisi non considera per nulla i lettori via feed RSS, non sono quanti sono su NfA ma in generale tendono a essere una parte molto importante del totale dei lettori.

Personalmente ho notato che sul mio blog il meglio era un articolo ogni due giorni, ma purtroppo non riuscivo a sostenere il ritmo, alla fine ora non pubblico da qualche mese e quindi non sono un buon parametro di controllo... :P

Propongo due sezioni: la prima il the best of di cui ha parlato chi mi precede: Patruno e Delfiol e la seconda del tipo: "ve lo avevamo detto..." in questo modo per chi ricerca senza essere sempre stato un vostro lettore ci sarà la possibilità di trovare un certo numero di articoli di una certa rilevanza che vi rappresentano.

p.s. OT oggi con explorer riesco a postare commenti:-)

Molto interessante. Mi permetto una proposta: perché non organizzare un'indagine survey sui lettori di nfa? Il volume di visite garantirebbe una numerosita' campionaria decente; gli editors potrebbero ottenere indicazioni interessanti non solo sul profilo dei lettori ma anche su come consumano i contenuti del blog; selezionare un campione rappresentativo dei visitatori, seppur operazione non immediata ed intuitiva, non sarebbe troppo complicato con un buon servizio di tracking.

forse per selezionare un campione sarebbe utile dare la possibilità da parte di chi scrive un articolo, che si suppone legga una gran parte dei commenti di dare un voto ai commentatori, nel corso del tempo la media di questi voti "peserebbe" i commentatori e discriminerebbe la fuffa dai commenti utili....

Insomma un troll che fa 300 commenti dovrebbe pesare molto di chi fa pochi commenti argomentati.

Un post al giorno può anche andar ben, dipende da quello che hai da dire. Se commenti l'attualità politica ed economica (e in Little Italy la sera quello che hanno detto/fatto la mattina già non è più vero) ci puoi stare, forse sarebbe da pensare una sezione Off Topic, in cui accedere se vuoi cazzeggiare, mentre post di stretta economia uno al giorno è impossibile/impensabile, conoscendo le risorse (scarse), ma anche la difficoltà di seguire poi il thread dei  commenti.

Personalmente seguo i thread dove sono coinvolte persone che so che dicono qualcosa di interessante, o quelli dei redattori (quelli sempre, ma se vi sentite la faccia umida sappiate che non sempre è umida per le leccate -)), da questo punto di vista vorrei il tasto "mi piace", perchè dato l'elevato numero di commentatori molte volte trovo che qualcuno ha già espresso il mio pensiero (se ne ho).

Per il resto va bene così, nFA è un piacevole luogo di discussione, mai banale, mai volgare soprattutto. E in cui il cervello va in moto, sempre.

forse sarebbe da pensare una sezione Off Topic, in cui accedere se vuoi cazzeggiare,

Dai, per questo c'e' facebook. Se mi "dai la molla" qui sopra, il livello crolla terribilmente.

Right. Ma c'erano tempi in cui su nFA si poteva fare anche sana ironia, adesso sembra demodè.

Molto interessante, per me, visto che mi occupo professionalmente di siti web e considero imperdibile ogni aggiornamento del vostro sito.

Devo segnalare però che questa analisi è assai difforme dalle metriche che ci sia aspetta normalmente di trovare nell'analisi del comportamento dell'utenza dei siti web. Nonostante la metodologia rigorosa, infatti, è l'impostazione generale che mi suscita parecchi dubbi.

Ad esempio mi convince poco l'ipotesi di ricostruzione del comportamento dell'utente medio che non scrolla la pagina. Questi comportamenti in genere sono molto eterogenei ( ci saranno utenti del genere, ma quanto significativi nel totale? ). Oppure individuano problemi specifici dell'interfaccia del sito che si risolvono modificando l'interfaccia e non l'articolazione temporale dei contenuti.

Non capisco come sono stimati gli utenti. In genere si combinano grandi guai nella stima delle sessioni di navigazione di un singolo utente, nel calcolare nuovi utenti gli utenti che invece sono di ritorno, nel confondere gli utenti umani con programmi che indicizzano ( non mi stupirebbe se metà del traffico fosse di motori di ricerca o spider ). Da quanto intuisco si sono utilizzati metodi a posteriori partendo dai log, consiglierei di combinare queste stime con metodi basati sul page tagging e di sperimentare poi le ipotesi con test reali sul sito ( se si vuole un riferimento, io consiglio sempre Avinash Kaushik, Web Analytics 2.0 ).

Manca completamente un'analisi dei traffico entrante ( visite ricorrenti dirette, da motori di ricerca, da altri blog o da social networl, da feed e notifiche? ). La destagionalizzazione poi, è calcolata anche sulla base di un ciclo ricorrente settimanale? Questo sembra fondamentale nell'analisi e che potrebbe essere estremamente diverso a seconda della provenienza del traffico. O si tiene conto del trend stagionale mensile, in genere molto forte? ( d'estate, se avete un pubblico italiano c'è il deserto e la disparità fra giorni della stessa settimana è meno rilevante essendo in parte dipendente dall'uso di internet con accesso dal lavoro )

A naso, le ipotesi che fate sono plausibili, solo che il livello di analisi statistica mi sembra poco provante per il tipo di errori di misurazione che ritengo possibili o per la selezione delle variabili significative che si ritengono operare.

Felicissimo di aver contribuito in modo, spero, utile. Visto che normalmente non partecipo attivamente: passo troppo tempo a riflettere e cercare di capire, prima di commentare a sproposito sui temi propriamente economici.

 


Ad esempio mi convince poco l'ipotesi di ricostruzione del comportamento dell'utente medio che non scrolla la pagina. Questi comportamenti in genere sono molto eterogenei ( ci saranno utenti del genere, ma quanto significativi nel totale? ). Oppure individuano problemi specifici dell'interfaccia del sito che si risolvono modificando l'interfaccia e non l'articolazione temporale dei contenuti.

E' un'ipotesi che spiega i dati, che potrebbero certamente essere avere altra causa. L'effetto "articolo pubblicato entro 24 ore" pero' e' statisticamente significativo. Sono d'accordo che un'altra soluzione potrebbe essere la modifica dell'interfaccia. Se dovessimo "provare" che la gente non scrolla, basta mettere due articoli a fianco, per esempio. 

 

Capisco i tuoi dubbi ma non ho le aspettative che hai tu, tempo e risorse per fare un'analisi seria non le ho, quindi ho preso semplicemente gli hits ad ogni singola pagina (salvati dal software xaraya, non dal server log) per fare un'analisi rozza ma interessante. 

Come ho tenuto conto del trend e' spiegato nell'articolo: hodrick-prescott e quadratico. Il primo dovrebbe tener conto della frequenza annuale delle stagioni. Del ciclo settimanale ne tiene conto il fatto che ho messo le dummies dei giorni settimanali. 

 

Ho poco tempo, la discussione è interessante, cmq velocemente:
- concordo con la pubblicazione regolare dei post, fidelizza meglio il lettore.
- per le statistiche consiglio vivamente google analytics ( http://www.google.com/intl/it/analytics/ ), facile da implementare e con reports molto dettagliati

per le statistiche consiglio vivamente google analytics ( http://www.google.com/intl/it/analytics/ ), facile da implementare e con reports molto dettagliati

Sicuramente è l'opzione più popolare ed è uno strumento piuttosto potente anche meglio di alcune alternative commerciali, anche se a certe condizioni che non tutti trovano soddisfacenti, per motivi di privacy in primis. Rientra nella cateogria di strumenti che utilizzano il page tagging che suggerivo anch'io per ottenere misure più utili. Rimane però la difficoltà per i gestori del sito di inserire il codice di tracciamento nelle pagine ( credo si debba operare a mano sul template in xaraya, il cms in uso attualmente ).

In alternativa, se si dispone dell'infrastruttura adatta, io di recente suggerisco anche l'uso di Piwik : open source e quindi customizzabile, free as in beer, e installabile sui propri server senza memorizzare i dati degli utenti del sito presso terzi. Se si vogliono fare analisi statistiche raffinate si ha il vantaggio di disporre dei dati tramite un database mysql direttamente accessibile, e un API ben documentata e potente. Una manna per chi vuole giocare un po' coi numeri.

che non tutti trovano soddisfacenti, per motivi di privacy in primis.

Facciamoci una ragione: con google tool bar o google chrome la privacy sta quasi a zero cmq.

Capisco i tuoi dubbi ma non ho le aspettative che hai tu, tempo e risorse per fare un'analisi seria non le ho, quindi ho preso semplicemente gli hits ad ogni singola pagina (salvati dal software xaraya, non dal server log) per fare un'analisi rozza ma interessante.

Da quanto ho letto nella documentazione di Xaraya si tratta di "page view" non de-duplicate per utente, né filtrate per gli accessi del traffico non visualizzato (dovrei vedere il codice per essere sicuro al 100%), quindi i miei dubbi aumentano, per quanto riguarda l'incertezza.

Incertezza che genera curiosità ulteriori, non intendo dire che le tue conclusioni siano da buttare. Ad esempio, con una congettura spannometrica, togliendo gli accessi degli spider dei motori di ricerca, è probabile che si tolga tanto "rumore di fondo" e le conclusioni cui giungi siano addirittura più significative. Anche se col page tagging io imposterei il problema in modo diverso grazie alle misure di engagement come il tempo passato sul sito e le visite per utente comprendenti uno o più articoli ( Ipotesi: c'è un ammontare di tempo da dedicare al sito per utente, quindi un effetto di sostituzione se si affolla di articoli per unità di tempo sopra a una certa soglia. Probabilmente tale soglia varia oltre che per utente, anche a seconda del contenuto del singolo pezzo e a seconda del contesto fuori dal sito, e potrebbe essere sensibile a modifiche strutturali del sito ).

Ho visto che ora, fra l'altro, in questa stessa pagina ci sono sia Clicky che Google Analytics, ma i dati raccolti si potranno elaborare solo d'ora in avanti. Se si riescono a recuperare i log si potrebbero comunque fare analisi più raffinate sul passato con altri strumenti, migliori del conteggio hits di Xaraya.

Ovviamente capisco che ci siano problemi di tempo a disposizione... mi candiderei volentieri a fornire il mio aiuto in versione "contributo volontario per sostenere noisefromamerika.org", ma ho un periodaccio per quanto riguarda il tempo riallocabile.

 

 

Benche la scienza sia molto apprezzata e l'articolo molto stimato, esso e' troppo erudito. In breve non lo si e' capito. :-)

una curiosità

castaldi 5/11/2011 - 15:03

perché in tabella viene omessa la biblioteka?

Perche' in una regressione con N categorie devi sempre omettere una delle categorie, in modo che gli indicatori delle categorie siano N-1. Se le metti tutte, la regressione non funziona piu' perche' gli indicatori delle varie categorie diventano indistinguibili dalla costante (il livello "base" di visite).

Il termine tecnico e' collinearita'.

La scelta di quale categoria omettere e' assolutamente arbitraria: Andrea ha scelto bibliotheka (immagino) perche' e' quella con visite minori. I parametri associati alle altre categorie vanno interpretati come "rispetto a Bibliotheka". Ad esempio, gli articoli Ex-K generano in media 3.206 visite in piu' rispetto a quelli Bibliotheka.

grazie per risposta, tempo e spiegazione.

Io non capisco tanto bene... mi rendo conto che in campi di studio diversi si usano nomi diversi per le stesse cose, o si usano standard diversi. Da biologo sono un po' confuso e vorrei capire.

In questo esempio, la biblioteca e' l'intercetta? Perche' la chiamate regressione se il fattore 'tipo di articolo' e' una variabile categorica? Cosa rappresenta l'ultima riga 'Costante'?

Grazie per le delucidazioni!

Andrea ha fatto non una "semplice" regressione lineare ma una multinomial logistic regression, che spiega perche' biblioteca e' considerata come referenza. Il motivo e' che le variabili dipendenti che guarda nella regressione (numero di visite e numero di commenti) non possono essere  considerate statisticamente independenti l'una dall'altra (al contrario, credo che sia ragionevole assumere che siano ben correlate, il che toglie statistical power)

No no e' una regressione lineare, non c'e' bisogno di fare logistic. Non ho usato la variabile categorica "tipo di pubbicazione" ma ho creato dummies (variabili con valore zero o uno) per ogni tipo, omettendone ovviamente uno (che si', diventa la costante).

Non so quanto io sia un lettore tipico. 

Ma vi leggo principalmente tramite i feed RSS, perciò raramente visito il sito. Ci vengo solo per i commenti: quando voglio lasciarne uno,  come ora, o più spesso quando voglio leggerne sull'articolo.

p.s.

Per quanto possibile leggo tutti gli articoli, tranne le poesie forse. ;)

 

Diceva tal Guccini da Modena:

"Vedi cara: è difficile spiegare, è difficile capire...se non hai capito già"

Per quanto riguarda l'ultima tabella, i coefficienti su certi tipi di articolo forse cambierebbero se uno includesse nella regressione anche gli autori dell'articolo, come di fatto sembri suggerire nell'interpretazione che dai della tabella.

In ogni caso, sono d'accordo sul fatto che sia bene cadenzare gli articoli anche se, come dici all'inizio, "sono da evitare il più possibile ritardi nella pubblicazione di articoli di più di un paio di giorni". Questo ultimo requisito ovviamente puo' essere a volte oneroso in termini di tempo. A questo proposito, io suggerirei a volte di postare anche articoli aperti. Per fare un esempio recente, e' da una settimana che Matteo Renzi appare nelle notizie. Voi magari non avete nulla da dire al riguardo o non avete tempo di leggervi le notizie rilevanti. Ma uno di voi potrebbe aprire un post dicendo: "Ma di questo Renzi, sapete qualcosa?". Cosi', con uno sforzo relativo, fate comunita' e vi tenete al passo con quello che succede.

ogni giorno (con due esclusioni), non uso RSS e la mia modestissima opinione e'c eh di imporre un limite di 101 commenti per "entita'". Toccata quella barriera, chi vuol dire di piu' si impegni a a scrivere un articolo che riassume, chiarifica, formalizza il problema rimasto aperto.

Due vantaggi: si riduce lo sforzo cogntiivo (io, almeno, non sono in grado di seguire uan discussione con duecento punti di vista, modulo ripetizione, scemenze etc.), secondo si mobilita piu' genet a scrievr di piu'

Svantaggio (serio) si da un incentivo a qualche cretinoa s crivere 100 volte la stessa cosa (se questo giustifichi una forma di censura, dicono nelle forze armate is above my pay grade.)

 

Penso che il valore di nFA sia nel livello di approfondimento e nella qualità dei commenti. Di conseguenza è meglio se gli articoli sono pochi. Anche sulla base dell'analisi svolta in questo post, mi pare che un articolo ogni due giorni sia già un buon ritmo.

Si potrebbe poi cercare di limitare il numero di commenti per partecipante, se non altro invitando a postare un solo commento di primo livello (dopo avere ragionato con calma sui contenuti).

Mi associo a chi suggerisce un collegamento diretto agli "intramontabili".

Inizia una nuova discussione

Login o registrati per inviare commenti