EVCP

Content Spinner

Clés de lecture du logiciel

Démarrage

Choix du mode d'analyse

Avant de lancer une analyse, vous aurez à choisir le niveau de précision de celle-ci. Vous le verrez, la différence entre chaque est relativement faible, mais il reste important de choisir un mode d'analyse cohérent avec la finalité du projet.

EVCP n'est pas conçu pour les masterpsins de très petite taille (générant des textes de moins de 50 mots à la sortie).  Il fonctionne, mais les résultats ne seront pas toujours cohérent. A l'inverse, plus le masterspin est long et travaillé, plus le niveau de précision sera élevé.

Avant de démarrer une analyse de masterspin, veillez donc à ce que la taille moyenne des textes générés soit au moins égale à 50 mots.

Analyse

Score d'unicité

En content spinning, la seule "unicité" d'un texte n'est pas vraiment pertinente et varie selon la méthode utilisée. Nous avons donc développé notre propre score d'unicité qui dépend de plusieurs facteurs dont les plus importants sont le nombre de mots total en commun, le nombre de mots "majeurs" en commun, le nombre de chaînes de 2 et 3 mots majeurs en commun et la variation de taille entre les différents spuns. 

Il est important de noter que plus un score est élevé, plus il sera difficile à améliorer. Autrement dit, passer de 10 à 50 est très simple, mais passer de 50 à 75 l'est beaucoup moins, et de 80 à 85 encore moins. 

Score de qualité

 

Le score de qualité évalue la syntaxe d'un masterspin. Plus la qualité est élevée, plus le nombre de spuns que l'on peut générer sans risques augmente rapidement (ce n'est évidemment pas le seul facteur.) Un masterspin avec une rédaction qui n'est pas particulièrement travaillée peut tout à fait obtenir un score d'unicité élevé, mais ce dernier demandera plus de travail.

En d'autres mots, il est plus simple et moins laborieux d'atteindre un score d'unicité haut en travaillant attentivement la rédaction qu'en misant sur la quantité. Si vous utilisez EVCP pour déterminer la rémunération d'un rédacteur de masterspin, la seule unicité n'est pas suffisante. 

Graphique

Le graphique représente la proportion des textes par niveau d'unicité par rapport au reste du corpus généré (ce nombre dépendant de la taille du masterspin et du niveau de précision choisi au lancement). Dans notre exemple, 40.83 % des textes ont un taux d'unicité de moins de 18 % par rapport au reste du corpus (ou moins de 82% de similarité). 

Génération max

 

Cette mesure est encore en phase de test. Elle vise à donner une approximation du nombre de spuns qu'il est possible de générer sans risque en se basant sur différents critères (nombre de possibilités, niveaux de profondeur, score d'unicité, qualité…).

Cela est à contextualiser, vis-à-vis d'un moteur de recherche, le texte d'une page n'est pas le seul facteur pris en compte. Pour diminuer ces risques, nous vous recommandons de faire changer les images, la position du texte sur la page, certains éléments comme les diaporamas, les boutons, les citations… 

Tailles

 

Rien de plus simple. Pour ne pas perdre trop de temps, nous comparons 1000 textes générés aléatoirement pour en trouver la taille moyenne, la médiane, le delta entre le texte le plus long et le plus court… 

Unicité simple

 

L'unicité simple est la mesure de l'unicité la plus basique que l'on puisse avoir. Imaginons un corpus de 1000 textes, nous comparons alors chaque texte aux 999. Pour effectuer cette comparaison, nous supprimons les mots en double puis relevons le nombre de mots en commun entre deux textes.

Unicité des mots majeurs (MM)

 

Cette mesure de l'unicité est une amélioration de l'unicité simple. Ici, seuls les mots considérés comme majeurs (MM = mots majeurs) sont sélectionnés pour comparer un texte avec un autre. Par la suite la méthode reste la même, chaque spin est comparés à chaque autre spin individuellement, puis un taux de similarité moyen (TUM) est calculé (et par déduction un taux d'unicité). 

Unicité des mots majeurs doubles

Il s'agit du niveau encore au-dessus. Ici, ce ne sont plus les mots majeurs individuels qui sont comparés, mais les chaînes de 2 mots.

Cela permet de saisir davantage le sens d'un texte. 

 

Par exemple : 

- La nuit les chats sont gris. 

- Les arbres sont gris.

 

Taux d'unicité simple : 70%

Taux d'unicité des MM : 20%

Taux d'unicité des MM (double) : 0%

 

Le taux d'unicité des MM (double) ou TUMD est plus pertinent quand l'on sait qu'un moteur de recherche comme Google se base bien plus sur le contexte que sur les mots pris individuels. Ici, les deux phrases n'ont rien à voir, et le TUMMD le montre bien. 

Unicité des mots majeurs triples

 

Le taux d'unicité des MM (triple) ou TUMT suit le même principe que le TUMD, mais sur des chaines des 3 mots majeurs pour augmenter encore l'impact du contexte sur le score final.

Delta du nombre de mots par phrase (ADWS) 

L'ADWS (Average Delta of Words within Wentences) est la différence moyenne du nombre de mots par phrase dans chaque spun. Cela influence légèrement la qualité d'un masterspin et le score d'unicité. Plus le delta est important, plus les notes de qualité et d'unicité seront élevées. Cet indice, comme l'ADW, est ramené à la taille moyenne des textes générés. Cela évite d'obtenir un indice biaisé par la taille plus importante d'un masterspin par rapport à un autre.

Delta moyen du nombre de phrases (ADS)

L'ADS est plus important dans l'analyse de l'unicité et de la qualité que le delta du nombre de mots par phrase. Il s'agit de la différence moyenne du nombre de phrases dans les spins d'un corpus. Plus l'Average Delta of Sentences est grand, plus un texte semblera varié aux yeux de Google. Comme pour toutes les métriques, son importance dans le score d'unicité et de qualité est remise à jour régulièrement en s'appuyant sur nos tests réguliers.

Delta moyen du nombre de mots par spuns (ADL)

Dernier delta important, l'Average Delta of Length mesure la différence du nombre de mots entre les spins. Plus les textes générés seront de taille variés, plus l'ADL et le score d'unicité seront élevés. Logiquement, même c'est loin d'être suffisant, un bon ADL réduit les risques de se faire repérer par le crawler d'un moteur de recherche.

Profondeur moyenne

 

Très résumée, la profondeur moyenne, ou niveau moyen, représente le potentiel d'un masterspin. Nous allons l'illustrer, car cette dernière est plus facile à représenter qu'à expliquer en une phrase. En peu de mots, plus une variation contient d'autres variations, plus la profondeur moyenne est importante. Cette métrique est grandement liée au nombre de textes souches utilisés lors de la rédaction. Les textes souches sont les textes de base qui seront spinnés. Chez EVCP par exemple, pour générer 5000 spins de 100 mots, nous commençons par rédiger 3 à 6 textes souches très différents de 100 mots avant de commencer à spinner ces textes. 

 

Quelques exemples, mais ce ne sont pas les seuls moyens d'atteindre ces taux :

 

Profondeur moyenne de 1 : {Phrase 1|Phrase 2|Phrase3} 

 

Profondeur de moyenne de 2 : {{Phrase 1|Phrase 2|Phrase 3} |{Phrase A|Phrase B|Phrase C}}

 

Profondeur de moyenne de 3 : {{{Phrase 1|Phrase 2|Phrase3}|{Phrase 4|Phrase 5|Phrase 6}|{Phrase 7|Phrase 8|Phrase 9}}|{{Phrase A|Phrase B|Phrase C}|{Phrase D|Phrase E|Phrase F}|{Phrase G|Phrase H|Phrase I}}}

 

Ici encore, l'augmentation n'est absolument pas linéaire. Il est bien plus complexe de faire passer l'indice de profondeur moyenne de 4 à 5 que de 2 à 3. 

Générateur

intégrer des liens

Pour votre maillage interne ou celui de vos clients, le content spinning se couple bien à une stratégie de cocon sémantique. Vous pouvez choisir d'intégrer les liens au format html directement lors de la génération des textes.

Actuellement, EVCP n'intègre qu'un seul lien, lors de la première apparition de l'ancre choisie. Si vous désirez de nouvelles options d'intégration des liens, n'hésitez pas à nous le faire savoir.

Intégration de variables

EVCP vous permet d'intégrer jusqu'à 4 variables directement lors de la génération. Choisissez l'ancre à remplacer, et le logiciel se chargera de générer des textes avec toutes les combinaisons possibles (seconde option, à droite sur l'image) ou de les intégrer aléatoirement à un nombre de spun que vous définissez. Si vous souhaitez d'autres options, faites-le nous savoir et nous les intégrerons au plus vite !

Taux d'unicité maximal

Dernière option, et pas des moindre, vous pouvez choisir un taux de similarité maximal entre textes du corpus généré. Cela nécessite un peu plus de temps car il faut non seulement généré les textes, mais également les tester les uns par rapport à tous les autres.

Pour de nouvelles options de génération (uniquement les plus unique, statistiques sur les textes générés...) contactez-nous et décrivez-nous votre besoin.