Data : la particule élémentaire de l’information

J’ai participé le 04 février à la conférence La Révolution des données numériques organisée par la Fondation Internet Nouvelle Génération (Fing) et l’association Fréquence Ecoles. Mon objectif était double : en tant que chargé de projet de Fréquence Ecoles en charge du cursus Dataviz, il était important que je me familiarise avec les concepts et, surtout, avec les attentes formulées par les collectivités territoriales et les professionnels de la médiation culturelle et numérique. En tant que consultant et formateur en veille stratégique et communication écrite, il me semblait important d’accumuler de la matière pour nourrir ma réflexion, et mon offre, sur des sujets tels que le big data ou l’open data.

Simon Chignard et Charles Nepote ont donc présenté leurs approches devant un auditoire disparate : néophytes sceptiques, néophytes curieux, amateurs éclairés et enthousiastes, spécialistes impatients, etc. Les presque trois heures de causeries ont permis d’aborder la question sous différents angles, avec des exemples et des applications potentielles qui m’ont permis de mieux cerner les possibilités, et les limites, de l’approche « Data ».

La particule informationnelle élémentaire

particule elementairePour commencer, et c’est sans doute cette définition qui me permettra d’intégrer harmonieusement les savoirs accumulés dans mes offres, la Data est la particule élémentaire de l’information. Les données ne constituent pas des informations en tant que telles, mais elles sont la matière première d’informations très diverses. Elles permettent la construction d’informations utiles. Par exemple, un tableur compilant le montant des contrats remportés sur plusieurs années auprès de clients de différentes tailles et évoluant dans différents secteurs d’activités n’est pas une information. Par contre, un ratio ou une représentation graphique illustrant le poids relatif de tel secteur d’activité et l’évolution de la part du CA dans le temps est une information, puisqu’elle permet de prendre des décisions stratégiques (renforcer les efforts commerciaux ou au contraire tenter de rééquilibrer ses débouchés pour réduire l’exposition aux retournements conjoncturels). Le même tableur peut permettre de produire un graphique montrant le poids comparé des segments PME et ETI, pour, là encore, prendre des décisions.

Cette définition permet d’ores et déjà d’avancer deux principes fondamentaux : les data n’ont de valeur que par les informations qu’elles permettent de construire, et les informations qui en sont tirées dépendent directement de l’angle d’étude choisi (activité ou taille d’entreprise dans mon exemple) et de la variété des données collectées et saisies. L’angle choisi découle à son tour directement de la problématique que l’analyste souhaite adresser.

Comme je l’ai écrit précédemment, pour être utile, l’information doit circuler et être partagée. En conséquence de quoi il semble évident que la circulation des data doit également être la plus fluide possible pour potentialiser les chances d’en tirer des informations valorisables. Malheureusement, à l’instar de l’information en entreprise, la prise de conscience de la valeur potentielle des données s’accompagne généralement d’une volonté de les thésauriser et de les stocker là où personne d’autres que l’entreprise qui les détient ne pourra en tirer profit. Or, la valeur des données, l’information, ne surgit que du traitement qui leur est appliqué. Et la qualité de l’information est directement corrélée à l’exhaustivité des données rassemblées, lesquelles doivent donc être perpétuellement mises à Opendatajour, augmentées, etc. Si la majeure partie des activités des professionnels génère aujourd’hui des données (horaires, distances, coûts, valeurs…), c’est souvent en croisant des données hétérogènes, quand elles ne sont pas hétéroclites, que des informations peuvent générer une véritable rupture génératrice d’avantage concurrentiel et de valeur ajoutée. Or, une même structure ne dispose que rarement de l’intégralité des données qui pourraient lui être utiles. C’est donc une évidence que les entreprises ont tout intérêt à collecter les données, mais également à en partager certaines avec des structures qui peuvent en augmenter la valeur, valeur dont elles pourront à terme également bénéficier. C’est, à grand trait, le principe de l’open data, les données ouvertes et accessibles à tous. Bien sur, toutes les données de l’entreprise ne peuvent ainsi être mises à disposition de tout un chacun, parmi lesquels se glisseraient inévitablement concurrents, clients et partenaires prompts à en exploiter certaines au détriment de l’émetteur.

Données à partager, données à protéger

Il n’est ainsi pas question de mettre en libre accès un catalogue clients, des données financières ou comptables ou un listing relatif aux collaborateurs.
Il est par contre question de collecter et de partager en vue de valorisation des taux d’utilisation de divers équipements, des fréquences de déplacements, des relevés de consommation d’énergie, des périodes d’activités plus ou moins intenses… toutes données qui ne donnent pas d’éléments cruciaux à des observateurs extérieurs, mais qui peuvent être porteuses d’optimisation ou de diversification des pratiques.

données sécuriséesQue les informations valorisables qui peuvent être extraites de ces données soient ou non construites et exploitées par l’entreprise qui les a collectées, les améliorations qui en découleront lui bénéficieront au final, puisqu’une réponse sera spécifiquement étudiée pour répondre à ses besoins. Si l’entreprise qui collecte les données souhaite se donner les moyens d’en tirer elle-même des bénéfices, elle devra mobiliser des investissements et des moyens technologiques et humains, pour des résultats aléatoires. Si elle laisse un tiers effectuer le travail, elle dégagera certes un avantage concurrentiel moindre, mais elle aura également économisé les coûts de développement de la solution innovante dont elle bénéficiera tout de même.

Pour résumer, certaines données doivent être protégées si l’entreprise prévoit d’en faire quelque chose elle-même, mais elles devraient être mises à disposition si ce n’est pas le cas.

Une démarche qui demande minutie, patience et imagination

Si une entreprise envisage de valoriser les données qu’elle produit quotidiennement, il apparaît qu’il y a quelques précautions à prendre pour faciliter leur exploitation future :

  • formaliser une terminologie facilitant l’identification de différents angles d’analyse ;
  • réaliser une collecte exhaustive et régulière des données ;
  • créer et renseigner autant de catégories de données que possible, pour faciliter le filtrage multi-critères ;
  • éviter les champs de saisie libre ;
  • choisir des formats (de fichiers informatiques) courants et compatibles entre eux ;
  • choisir des formats libres et ouverts ;
  • choisir des formats facilitant la manipulation (tri, croisement, hiérarchisation) et l’illustration graphique des données ;
  • réaliser des sauvegardes régulières en adoptant une nomenclature dédiée ;
  • vérifier régulièrement que des données nouvellement rendues publiques ne font pas émerger une nouvelle information valorisable ;
  • laisser libre cours à son imagination.

Avec une telle définition, l’open data semble porteur de nombreuses innovations et d’améliorations qui pourraient profiter au plus grand nombre, entreprises ou particuliers. Mais ce sont, comme toujours, la curiosité, l’ingéniosité, la motivation et le travail de ceux qui les transformeront qui permettront d’en tirer réellement profit.

C’est ce qui différencie l’open data du big data, du moins si j’ai bien compris les concepts et les usages qui en découlent.

Big (Data) Brother is profiling you

Le big data repose sur le même principe fondamental : extraire une information de données. Le terme big s’applique ici à la fois aux volumes et à la variété des données collectées et traitées. L’objectif est toutefois sensiblement différent, puisqu’il ne s’agit plus uniquement de construire des informations qui pourront permettre une prise de décision éclairée, mais de prévoir les comportements de personnes ou de groupes de personnes.

CC by Paterm

CC by Paterm

Le rapprochement d’un important volume de données hétéroclites permettrait en effet de réaliser des prédictions de comportements, et ainsi de peser en faveur du déclenchement de l’acte d’achat au moment où celui-ci est le plus susceptible d’intervenir.
Ainsi présentés, le principe et les buts d’une approche big data s’apparentent à un déterminisme commercial à la fois effrayant et peu attirant, du moins en tant que sujet potentiel de telles pratiques.
De l’aveu même de certains professionnels, que j’ai promis de ne pas nommer ici, il semblerait, qu’au moins à l’heure actuelle, les coûts d’acquisition et de traitement des données permettant ainsi de traquer et prévoir les habitudes des clients visés soient supérieurs au panier moyen qu’ils permettent de vendre. Le bénéfice semble donc assez limité au stade de développement des technologies où nous en sommes.
Limité pour les clients des fournisseurs de solutions big data, bien sûr.

Il n’en reste pas moins qu’il convient de s’interroger sur les applications connexes du big data. Est-il possible de détourner les technologies de profilage du consommateur (car c’est bien ce dont il s’agit) au profit de professionnels BtoB ou BtoC visant un public restreint ? Si j’ai bien compris les principes sur lesquels reposent le big data, mais je suis loin d’être un data scientist, la réponse est NON. Les méthodes reposent sur le traitement de très importantes masses de données, qui ne sont évidemment disponibles que pour les productions grand public distribuées via de multiples canaux identifiés et normés. Les entreprises n’étant pas monolithiques, il semble difficile de les profiler efficacement. Et les professionnels qui vendent une petite quantité de produits à quelques catégories de clients ne sauraient non plus en tirer profit, ou en tout cas pas à des coûts susceptibles de rendre l’opération intéressante.

Big Data ? Big Business !

Est-il alors possible d’utiliser les méthodes et technologies du big data pour développer une analyse prédictive d’informations éparses ?
Manifestement, pas encore. Comme Simon Chignard l’a en effet précisé, le big data permettrait éventuellement de répondre à la question du quoi ? mais en aucun cas au pourquoi ?
Ainsi, si l’analyse et le recoupement de grandes masses de données semblent pouvoir permettre d’établir une prédiction plus ou moins juste d’un état, il est impossible de décrire les scénarios à privilégier pour atteindre ou éviter l’état décrit. Ce qui est somme toute assez logique et plutôt rassurant. Concrètement, il semble donc possible de prévoir une demande à un moment donné, mais il est impossible de prévoir le cheminement qui permettra d’être la première entreprise à bénéficier de l’émergence d’un nouveau besoin.
L’approche d’un marché étant notamment régi chez l’entrepreneur « moyen » par l’intuition, le big data aurait donc comme application BtoC la possibilité de confirmer / infirmer / étayer une intuition. Avec évidemment la marge d’erreur de toutes machines mesurant les comportements humains. Et à un coût qui me semble (à l’heure actuelle) incompatible avec les moyens de l’écrasante majorité des entreprises françaises.

Jusqu’à plus amples précisions et sans plus en saisir les ressorts technologiques, je resterai donc dubitatif, bien que curieux, vis à vis des promesses du big data pour les entreprises à taille humaine.
A l’inverse de l’open data, qui me semble propre à générer de réels avancées en termes de rationalisation, d’optimisation et d’innovation.

Advertisements

À propos Christophe Doré
Consultant et formateur en veille stratégique et communication écrite, j'accompagne les entreprises, associations et collectivités dans la résolution de leurs problématiques d'émission et de réception d'informations : rédaction, recherche, analyse, diffusion de données utiles à leur fonctionnement.

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :