SEOMantica: TF/IDF (Term Frequency / Inverse Document Frequency) ecco cos’è!
Del parametro TF/IDF ne aveva già parlato molto approfonditamente anche Franco in un post proprio qui sul blog.
Personalmente ho cercato, durante lo speak, di sintetizzare e semplificare al massimo questi concetti al fine di comprenderli velocemente e iniziare a studiarli sempre più approfonditamente e tenendone in considerazione per l’ottimizzazione SEO.
TF/IDF (Term Frequency / Inverse Document Frequency) ecco cos’è! (Slide 35-39)
Come spesso ci succede per imparare cose nuove dobbiamo fare affidamento a concetti già assimilati e utilizzati in passato, quindi parliamo di:
- Keyword Frequency = Nr. di ripetizioni di una keywords all’interno di un testo | Formula matematica: Conteggio delle ripetizioni
- Keyword Density = Ripetizioni della Keywords rapportate al numero totale di parole presenti nel documento | Formula matematica: Keyword Frenquency * 100 / Totale Keywords
- 
TF/IDF = Indica la frequenza del termine ponderata in quanto è inversamente proporzionale alla frequenza del documento e misura quanto importate è una determinata parola in un documento e nel corpus di analisi totale, cioè in tutti i documenti nell’ambiente analizzato. | Formula matematica: Frequenza del termine * Frequenza inversa del documento
- Frequenza del termine = Nr. ripetizioni della keywords / Totale Parole Documento
- Frequenza inversa = log(totale documenti del corpus / totale documenti che contengono la keyword)
Quindi ecco la formula matematica completa:
Facciamo un esempio per capirci meglio:
- Testo = parole totali 1.000
- Keyword osservata = marketing
- Occorrenze Keyword = 9
Calcolo TF (term frequency: Frequenza del termine) = 9/1.000 = 0,009
- Totale documenti del corpus = 10 Miliardi (totale delle pagine indicizzate da Google)
- Documenti con “Marketing” = 535 Milioni (basta fare una ricerca su Google per la parola chiave da controllare. Clicca qui per l’esempio)
Calcolo IDF (Frequenza inversa del termine) = log(10.000.000.000/535.000.000) = 1,27
Quindi il calcolo definitivo è: TF/IDF = TF * IDF = 0,009 * 1,27 = 0,01143
Per facilitarti la vita, anche la mia, ho creato un semplicissimo tool/foglio di calcolo di MS Excel che effettua in autonomia tutti questi calcoli (basta inserire i dati):
TF/IDF Calculator Ver. 1.0
Il mio tool per velocizzare il calcolo del TF/IDF

Scaricalo gratis qui: http://lab.prima-posizione.it/seo-tools/tf-idf.zip
Qui le slide:
Un abbraccio,
Michele
 
										 
                                    
