Cet article a pour (humble) objectif de revenir sur l’historique des moteurs de recherche qui ont existé en France depuis la création du Web (Lokace, Ecila, Deepindex, Exalead, Orange, Xaphir, Qwant…), une période que j’ai eu la chance de vivre dès ses origines puisque je travaille sur le Web et que je me passionne pour les outils de recherche depuis 1993. L’idée sera également de tenter ici de tirer les leçons du passé et de comprendre pourquoi tous ces projets ont été des échecs et d’identifier ce qui a toujours manqué à ces outils pour réellement percer, au fil des ans…
Petit préambule : dans cet article,
- Je ne parlerai que des moteurs ayant développé leur propre technologie de recherche (algorithme/index), excluant donc une myriade de métamoteurs, d’outils utilisant des technologies existantes (la plupart du temps celles de Google ou de Bing à l’heure actuelle) ou créateurs de surcouche logicielle, aussi intéressante soit-elle (Kartoo…). Même si j’y reviendrai à la fin de cet article…
- Je ne parlerai que des moteurs d’origine française, donc exit les Lycos, Inktomi, Hotbot et autres AltaVista (même si, pour ce dernier, plusieurs français faisaient partie de l’équipe, mais le moteur avait avant tout une vocation US et a clairement été créé outre-Atlantique, pour Digital à l’époque).
- Je ne parlerai que des moteurs de recherche généralistes (tout le Web), et pas de ceux (très nombreux), se limitant à une seule approche ou une seule thématique.
- Je ne parlerai pas des annuaires (Nomade, le guide de Voilà, etc.), dont le fonctionnement était très différent de celui des moteurs proprement dit.
Autre point important : notez bien qu’on peut ne pas être d’accord avec moi par rapport à ce que j’écris dans cet article, je le conçois aisément, mais j’expose ici mon avis personnel que je partage avec moi-même… ?
La préhistoire : les années 1990
Ceci étant établi, commençons donc avec les débuts du Web et les années 90. La France a, à cette époque, peu de sites et les sites web, peu de pages (pour l’anecdote, mon premier livre, « Internet guide de connexion », paru en 1994, proposait en annexe la liste exhaustive des sites web français en quelques pages qui n’étaient pas écrites en petits caractères ? ). A cette époque, on trouve tout d’abord Lokace (1994-2002), un moteur qui ne s’est hélas jamais montré très pertinent dans ses résultats, ce qui a certainement entraîné rapidement sa chute. Apparaît dans la foulée Ecila (1996-2001), un peu plus pertinent, mais qui n’a jamais trouvé son public, lui non plus.
Sur cette première décennie, ces deux moteurs n’ont jamais percé pour une raison simple : les autres (la plupart du temps américains : Altavista, Lycos, Webcrawler, Infoseek, Excite, etc.) étaient meilleurs, même sur le Web francophone ! Et les annuaires étaient souvent préférés pour rechercher des sources d’information françaises. Ceci dit, ces « ancêtres » étaient des pionniers du domaine et ont participé au défrichage du Web francophone à leur manière.
Page d’accueil du moteur Ecila. Source : Internet Archive
Les années 2000 : Deepindex et Dir.com
En 2002 débarque DeepIndex, projet mis en place par Gilbert Wayenborgh, première « vraie » tentative de moteur de recherche français. Dans sa foulée, Dir.com, créé en 2003 par deux employé d’Iliad/Free, tente sa chance. Je dois bien dire que ce dernier moteur m’a toujours laissé un excellent souvenir. Tout d’abord, ses concepteurs étaient très sympas et nous avons même mené quelques projets en commun à l’époque. De plus, leur moteur était vraiment de bonne qualité, alors qu’ils n’avaient que très peu de moyens (pour ne pas dire quasiment aucun moyen), Dir.com ayant été créé « à l’arrache » au sein de Free, un peu au vu et au su de tout le monde. Ils n’ont hélas pas été suivis ensuite par leur « maison mère », laissant la technologie à l’abandon au bout de quelques années alors que celle-ci me semblait pourtant vraiment « bien née ».
Deepindex, pour sa part, tiendra bon un peu plus longtemps, mais ce projet courageux abandonnera également la partie quelques années plus tard, au vu des importants investissements nécessaires pour continuer l’aventure à une époque où les modèles économiques pour un moteur de recherche étaient encore très flous (les réseaux publicitaires Espotting/Miva et Mirago ont également connu de nombreux problèmes à cette époque, entraînant le moteur dans leur charrette).
La page d’accueil du moteur Dir.com. Source : Internet Archive
Le temps des regrets : Orange et Exalead
Parmi les acteurs qui vont devenir majeurs par la suite, on peut bien sûr citer KE, technologie de « search » issue d’Echo et qui va équiper de nombreux moteurs de France Telecom puis d’Orange, et notamment Voilà et LeMoteur. Ce couple algorithme+index, développé par une équipe enthousiaste, sympathique et motivée à Sophia Antipolis, était vraiment de bonne qualité et souvent en avance sur son temps (parfois trop peut-être, d’ailleurs). Avec une « team » hélas réduite au fil du temps et très peu de moyens, l’équipe « Search » d’Orange a souvent fait des miracles alors que l’outil était avant tout vu par ses dirigeants comme une possibilité pour l’entreprise d’insérer des liens (naturels et publicitaires) « maison » dans les résultats de recherche, procédés interdits par Google. Et puis, un jour (2017), Orange a coupé le cordon et passé son moteur sur la technologie de Google. Le moteur KE reste un grand regret pour moi, car il avait vraiment sa place sur le marché français et il aurait certainement pu devenir rentable s’il avait été aidé par sa hiérarchie à cette époque. Les actionnaires en ont pourtant décidé autrement…
On ne peut bien sûr pas passer sous silence Exalead, créé en 2000 par François Bourdoncle (auteur notamment de l’outil « Cow 9 / Refine » sur Altavista à l’époque) et Patrice Bertin. Un beau moteur, une belle histoire. On y croyait dur comme fer… Jusqu’à leur rachat par Dassault Systèmes en 2010, qui sonnera le glas du moteur. Celui-ci tournicote désormais dans un coin du Web (le cimetière des éléphants du « search » ?). Pour Exalead aussi, j’ai un gros regret car c’était un vrai beau moteur, qui aurait réellement pu avoir un bel avenir. Mais peut-être ses concepteurs n’ont-ils jamais su (ou pu) faire un choix entre leur activité de développement de moteurs intra-site et de moteur de recherche Web proprement dit. Mais, là aussi, les investissements pour « tenir la route » en temps que moteur – obligatoirement mondial – ont également pu être considérés comme très (trop) importants, avec une rentabilité hasardeuse sans régie publicitaire propre.
Résultats pour ces deux belles technologies (Orange et Exalead) : RIP, tout simplement. Mais ils constituaient à mon avis avec Dir.com les 3 plus belles technologies de recherche « made in France » qui auraient pu avoir un rôle à jouer dans l’Hexagone en particulier et sur le Web en général. Dans les 3 cas, ce sont les actionnaires, les acquéreurs ou les « N+1 » qui n’ont pas suivi. Un manque de vision à long terme ?
Le moteur Exalead est toujours en ligne. Source : Exalead
Les ratés de Xaphir et Qwant
Ces dernières années, on a également vu apparaître Xaphir, moteur conçu à Epinal en 2013 par la société Xilopix, et hélas victime du « syndrome Cuill » (du nom de ce moteur, notamment lancé par Louis Monier, ex-Altavista, ebay, Google, etc. et qui a raté le coche en 2008 en sortant trop vite sous la pression des actionnaires). Des résultats de recherche catastrophiques à son lancement ont hélas scellé le sort de la technologie de Xaphir, rachetée en 2017 par Qwant. A vouloir sortir trop vite un moteur mal fini et pas assez rodé, ils se sont ainsi exposés à quelques déboires, hélas… Mais avaient-ils vraiment le choix ?
Résultat de recherche sur Xaphir pour la requête « abondance » à l’époque. Source : Abondance
Quant à Qwant, j’en ai parlé plusieurs fois sur Abondance par le passé, alors qu’en dire de plus ? Né en 2013, après une communication de départ absolument catastrophique, le moteur a multiplié les erreurs stratégiques pour en arriver finalement à une « annus horribilis » en 2019, conclue par le départ forcé de son PDG Eric Léandri début 2020. Résultat : ce moteur représente aujourd’hui un gros caillou dans la chaussure du gouvernement, à tel point que la question n’est pas (plus) réellement pour nos dirigeants politiques de trouver une alternative à Google, mais plutôt de trouver une alternative à Qwant… Et là, les choses sont clairement beaucoup plus difficiles… Et le fait d’installer le moteur sur les postes des fonctionnaires français ne changera globalement rien (ceux-là retourneront sur Google dès le lendemain). De plus, s’il faut forcer les gens à choisir tel ou tel moteur plutôt que leur choix personnel pour tenter d’obtenir un quelconque et hypothétique succès, c’est qu’il y a vraiment un problème… Bref, Qwant est aujourd’hui en état de mort cérébrale (et son concours SEO Qwanturank n’a hélas rien fait pour améliorer les choses) avec comme résultat, 7 ans après son lancement, des parts de trafic ne dépassant pas 1% en France. On peut le regretter, car il y a certainement en interne de cette entreprise des gens très valables, qui doivent parfois se demander ce qu’ils sont venus faire dans cette galère…
Aujourd’hui, où en est-on ?
Finalement, si on fait un retour en arrière sur les différents moteurs de recherche français qui ont vu le jour depuis près de trente ans, on s’aperçoit qu’ils ont tous été des échecs. Pourquoi ? Plusieurs raisons à cela, selon moi. En vrac :
- Parfois, ils n’étaient pas bons et pas pertinents dans leurs résultats. C’était clairement le cas de certains, ne nous le cachons pas. Mais ceux-la reste finalement des exceptions, car d’autres étaient très bons, ou en tout cas, ils faisaient le job plutôt bien par rapport au Web tel qu’il existait à leur époque.
- Ils ont été tués par des actionnaires ou des dirigeants qui n’y ont pas cru (le syndrome du « ça ne marchera jamais ! »). Et c’était bien dommage car certains auraient de façon évidente mérité un meilleur avenir.
- Ils ont été conçus trop tôt, à une époque où les modèles économiques pour les moteurs de recherche étaient loin d’être évidents (c’est d’ailleurs l’une des raisons du succès de Google – mais pas la seule – : il est arrivé après tout le monde, à une époque bien plus propice au développement économique d’un tel outil).
- Les investissements nécessaires pour évoluer avec la taille et la complexité du Web ont eu raison des bonnes volontés pourtant évidentes au départ.
- Ils ont été victimes d’erreurs stratégiques et/ou d’une communication catastrophique parfois.
On pourrait certainement trouver d’autres raisons, mais à mon avis, les principales sont là. Et puis, passé le début des années 2000, le succès fulgurant de Google n’a plus laissé beaucoup de place à grand monde. 20 ans plus tard, il est trop tard…
En effet, le paysage actuel du « Search » mondial est devenu assez simple : au niveau planétaire, il ne reste plus que deux technologies de recherche disponibles : celles de Google et de Bing. Plus quelques miettes locales pour des Yandex (Russie), Seznam (République tchèque), Baidu (Chine) ou Naver (Corée du sud). Point barre.
Que manque-t-il aujourd’hui pour bâtir un moteur de recherche français ?
Pourtant, on comprend la motivation qu’ont de nombreuses personnes de combattre l’hégémonie américaine dans ce domaine. Qui traite et diffuse les résultats de recherche sur le Web aujourd’hui noyaute l’information, voire les opinions. Le risque géopolitique est énorme. Il ne serait donc pas illogique que le gouvernement français, ou tout simplement les citoyens français, appellent de leurs vœux un moteur « made in France ». Mais il faut aujourd’hui et pour cela partir de quelques postulats qui me semblent évidents :
- Créer en 2020 (et a fortiori plus tard) un moteur de recherche (ou a minima la partie « crawl+index ») « from scratch », en France ou ailleurs, est une totale utopie. Une hérésie. Un fantasme. Le Web est devenu trop énorme, trop complexe, et les investissements humains et techniques pour y arriver sont absolument colossaux. Même Amazon (avec A9) s’y est cassé les dents. Même Microsoft, avec Bing, a du mal à grignoter des parts de trafic à Google depuis des années. Même Facebook et Apple, pourtant souvent tentés, ne s’y sont jamais risqué.
- Si une start-up se lançait sur ce marché, elle partirait de toutes façons avec un handicap de plus de 20 ans de retard par rapport à ses concurrents. C’était peut-être un avantage pour Google en 1998 de partir après les autres en évitant leurs erreurs à une époque plus favorable, mais en 2020, la donne a considérablement changé. 20 ans de retard en termes de data : le handicap est désormais trop énorme.
- Et si, par miracle, cette start-up réussissait son coup, elle passerait immédiatement au statut de BBBBG (Born to Be Bought By Google) ou BBBBB (Born to Be Bought By Bing). Il ne faut pas rêver : qui dit non à quelques centaines de millions (voire plus) de dollars ?…
Soyons clair : la création d’une nouvelle technologie de « search » à notre époque est impossible, inimaginable, irréalisable, au moins pour la partie qui consiste à maintenir un index mondial à jour. Point. On peut le regretter pendant des jours et des mois, il en est pourtant ainsi. Un moteur, pour se développer, doit s’appuyer sur une technologie existante et, sur cette base, proposer, bâtir « autre chose ». Et, plus clairement, si le but est de se battre contre Google, il n’existe qu’une solution : utiliser son concurrent, Bing !
Et donc, si on veut « briser le mauvais sort » qui envoie systématiquement à la poubelle les moteurs de recherche issus du cortex « made in France » depuis des décennies, il faudra se résoudre à travailler avec « le Grand Satan » Microsoft pour combattre « le grand Lucifer » Google. Ou ne rien faire. Ou voir mourir une expérimentation à court terme. Ou peut-être gagner un peu d’argent à court terme via un rachat. Ceci dit, le choix et l’axiome de départ restent assez drastiques et limités…
Notons que c’est ici l’approche d’outils comme Ecosia, Lilo, DuckDuckGo et d’autres, qui s’appuient sur des technologies existantes, et qui tirent finalement pas si mal que cela leur épingle du jeu. Mais il faut aller plus loin !
La vérité sera dans l’interface utilisateur…
Autre question, capitale : si on utilise une autre technologie (Bing en l’occurrence), que peut-on proposer de plus, ou plutôt de différent, que Google (et Bing, pour le coup) ? C’est là, à mon avis, que se situe le nerf de la Guerre. Je suis pourtant persuadé qu’il reste énormément de choses à faire au niveau de l’interface utilisateur. Depuis près de 30 ans, un moteur de recherche, c’est un formulaire de recherche (où on tape des mots clés) et une SERP, ou page de résultats du moteur, avec un certain nombre de liens naturels (« liens bleus ») et publicitaires.
Alors, bien sûr, on ne peut pas bousculer les habitudes des internautes du jour au lendemain (ce serait un échec assuré), mais on pourrait tout à fait leur laisser le choix : soit un affichage des résultats « à la Google » (classique : formulaire + 10 liens bleus + pub), soit une autre façon (ou d’autres façons), plus originale(s), voire un peu folle(s), plus ou moins raisonnable(s) d’afficher les résultats. Cuill, notamment, avait montré la voie à l’époque et, s’il avait fourni des résultats pertinents, il serait certainement aujourd’hui un acteur majeur du « search ». Car ses SERP avaient du chien et proposaient une autre voie de lecture assez innovante tout en restant finalement assez académiques. Cuill avait tout juste. Il a juste été lancé trop tôt, mais son approche de base était bonne (selon moi) au niveau de l’interface utilisateur… Xaphir avait également lancé quelques idées intéressantes à son époque. Mais lui aussi est sorti trop vite et n’a pas eu le temps de les développer.
Résultat de recherche sur Cuil à l’époque (2008). Source : Abondance
Il est donc tout à fait possible, à mon avis, de proposer un bon moteur de recherche, avec une « surcouche UX », basée sur la technologie de recherche de Bing (avec un accord garantissant la protection des données personnelles, bien sûr, bien que cela ne soit pas un critère réellement différentiant) mais proposant suffisamment d’innovations dans les aspects d’interface utilisateur pour être agréable à utiliser, au-delà de la pertinence indispensable.
Je continue donc à croire dur comme fer, qu’un moteur, ou en tout cas, un outil de recherche conçu en France (même s’il se base sur une technologie étrangère, ce dont l’internaute se contrefiche totalement – notons que ce dernier utilise déjà un ordinateur et un système d’exploitation américains, voire un téléphone d’origine asiatique – bref, la plomberie ce n’est pas son truc tant que l’eau est potable…) pour gagner des parts de marché et même, soyons fou, devenir rentable ! Et pour moi, le nœud de l’histoire se trouve sur ce que l’on peut proposer à l’internaute comme innovations dans l’interface utilisateur.
L’approche sera également essentielle : ce que veut avant tout l’internaute, c’est de l’honnêteté, de la franchise, de la loyauté et de la transparence. S’il a l’impression qu’on lui ment, qu’on lui cache des choses, il n’adhérera pas au projet. Un point à ne jamais oublier… Certains s’y sont peut-être brûlé les ailes dans le passé !
Il parait qu’en France, on n’a pas de pétrole, mais qu’on a des idées. Alors, prenons le pétrole (index, algorithmes) où il se trouve (Bing) et amenons des idées innovantes (interface, UX) ! Faisons travailler nos méninges et construisons un beau moteur qui parle la langue de Molière ! Ça vous dit ? Alors, à vos synapses ! ?