C’est la variable la plus basique de l’outreach et pourtant, c’est un casse tête pour l’utiliser en outbound.
Le nom d’entreprise est une donnée tellement complexe à fiabiliser que j’avais personnellement décidé d’arrêter de l’utiliser dans nos campagnes.
On ne sait jamais si on doit utiliser le nom légal, celui de la page Linkedin ou encore celui du domaine pour trouver le nom avec lequel votre prospect souhaite que l’on nomme son entreprise.
La plupart du temps, on doit repasser à la main pour nettoyer nos listes et enlever les formes juridiques dans les noms, vérifier que les majuscules sont aux bons endroits pour éviter ce type de retour :
Bref, c’était très fastidieux et non scalable.
Mais désormais dans Pharow, on nettoie et on fait de l'algorithmie pour calculer ce champ, savoir quelle source utiliser en fonction du contexte et par conséquent vous éviter de perdre des heures sur cette tâche.
Dans cet article, on va discuter des différentes sources de données que l’on peut utiliser pour calculer ce Company name, des avantages et limites de chacune et enfin vous présenter des exemples concrets du nettoyage que l'on effectue sur cette variable.
1. Les sources de données utilisées par Pharow pour nommer une entreprise et les avantages
Tout d’abord, ayez en tête que le nom d’entreprise est une entrée manuelle.
Quelle que soit la source de données utilisée, cela reste du déclaratif humain avec le lot d’incohérences que cela entraîne.
Pour nommer une entreprise, on possède différentes sources de données, on va les passer en revue pour comprendre les avantages et les limites de chacune.
La donnée légale
Au travers de cette base, on obtient l'information sur la dénomination légale qui correspond à la donnée fournie par le(s) mandataire(s) à L'INPI pour nommer leur entreprise
👍 Point fort de la dénomination légale :
- Indiscutablement, cela correspond au nom de l’entreprise et c’est d’ailleurs le plus souvent sous ce nom que vous retrouverez l’entreprise dans tous les documents officiels (mentions légales, factures, devis, etc.).
👎 Limites de la dénomination légale :
- Rarement utilisable dans l’état parce que cette dénomination légale peut avoir des erreurs d’écritures, ne pas correspondre au nom usuel de la société
- Beaucoup de retraitement à prévoir pour nettoyer les formes juridiques, les majuscules, les espaces, les noms à rallonge.
La donnée web
C’est aussi une donnée déclarative. On la retrouve dans la construction d’une URL située entre le protocole et l’extension.
👍 Côté avantage :
- C’est une donnée dynamique. Cela correspond à la manière avec laquelle un client nomme son entreprise pour le grand public
=> Exemple : le nom de domaine de https://thekeepers.io/ est Thekeepers alors que la dénomination légale est “Mains lib”
👎 Côté limites de la donnée web :
- Dans un monde simple où chaque site web équivaudrait à une société unique, cela serait parfait mais, malheureusement pour tous les data engineers et les growth de cette terre, ce monde n’existe pas.
- Il y a de nombreux cas où ce nom de domaine correspond plutôt à un nom de marque qu’à un nom d’entreprise
Exemple avec la société Benda Bili qui exploite les domaines
https://www.octobre-editions.com/ et https://www.sezane.com/fr
- Elle nécessite beaucoup de retraitements difficiles à scaler. En prenant toujours l’exemple de The Keepers, il faut être capable de décomposer le nom après “The”. Cela nécessite un volume de règles de gestion très compliqués à implémenter
- Cette source de données n’apporte pas plus d’informations que la prochaine source de données : LinkedIn
La données issues des pages LinkedIn
Encore une donnée déclarative, on va s’intéresser cette fois au nom issu des données LinkedIn des pages sociétés. On ne parle pas ici des pages auto-générées mais bien de celles officielles.
👍 Les avantages :
C’est une donnée pertinente parce qu’elle permet d’accéder directement au nom avec lequel la société souhaite être connue sans entraîner la complexité de retraitement présente pour le nom de domaine.
👎 Les limites :
LinkedIn présente des limites lorsque l’on s’intéresse aux sociétés qui sont des groupes, des ensembles de sociétés :
- plusieurs pages Linkedin officielles sont créées
- les salariés s’associent à l’une de ces pages officielles de manière assez aléatoire donc difficile de savoir le nom avec lequel vous devez contacter votre prospect
Je vous invite à regarder le volume de pages LinkedIn associées à Renault et vous percevrez immédiatement le problème.
=> Pour résumer, aucune source de donnée n’est magique pour déterminer le nom d’entreprise. C’est pour cette raison que l’on a besoin d’algorithmie pour pondérer les cas où chaque source de données doit prendre le dessus sur les autres et d’un travail de nettoyage de données pour accéder au nom que le client veut que l’on utilise pour nommer son entreprise.
3. Le nettoyage de la variable Company name
Pour l’algorithmie, je ne peux évidemment pas la dévoiler dans cet article. Cela fait partie de nos avantages et de notre différenciation.
Je ne vais vous présenter non plus l’ensemble des retraitements que l’on effectue, cet article serait beaucoup trop long mais plutôt vous présenter les essentiels.
Une fois que l’on a choisi la source de donnée à utiliser, on nettoie donc cette donnée pour s’assurer qu’elle soit utilisable automatiquement dans vos campagnes outbound.
Suppression des acronymes juridiques
Grâce à cela, on éviterait les formats SAS, SARL, etc. présent au début ou en fin de nom. Cela sent moins l'automatisation en retirant ces formes juridiques.
Exemple : 'Initia Food sas' => 'Initia Food'
Diminutifs connus
A l'intérieur des noms d'entreprises, on retrouve beaucoup d'accronymes de type "ctre" pour désigner "centre" ou encore "sciété" pour désigner "société". Ce sont des termes que vous ne pouvez vous permttre d'insérer à l'intérieur de vos campagnes et qui sont extrêmement longs à nettoyer à chaque campagnes.
Exemple : ''Ctre Int langues & int language center' => 'Centre International Langues & International Language Center',
Séparation de points
Cela arrive notamment dans le cadre des noms de sociétés qui sont en réalité des accroynymes. Chaque lettre a été séparée par un point mais dans le cadre de l'outbound, la présence de ces points n'a pas de sens. On en profite également pour éviter les majuscules à la suite de ces points.
Exemple : 'A.r.c.t.i.a' =>'ARCTIA',
Séparation d’espaces
Même travail que précédemment avec les espaces. C'est plus propre tout de même ;).
Exemple : 'A T p' =>'ATP',
Mots de liaisons connus
Iici, c'est la présence de mots de liaison que l'on va remarquer et qui comporte des majuscules. On va donc passer en minuscule la première lettre de ce mot de liaison.
Exemple : 'Ecurie La ruere' => 'Ecurie la Ruere',
Apostrophes manquantes
Si vous recevez un email avec les apostrophes manquantes, je parie que vous archivez ou basculez automatiquement le contenu en spam.
Exemple : 'Controle Technique automobile de la zone d activite de comines'=>'Controle Technique Automobile de la Zone d'Activite de Comines',
Acronymes redondants
On supprime les acronymes qui se répètent dans le nom.
'Savoir bien satisfaire - sbs' =>'Savoir Bien Satisfaire',
Voilà quelques-uns des nombreux retraitements que nous effectuons pour vous apporter une variable de noms d'entreprises propres et actionnables dans vos campagnes outbound. Ce travail de nettoyage et d'algorithmie est effectué sur tous les sujets que nous parcourons chez Pharow pour vous faire gagner du temps.