dimanche 19 mai 2019

Qwant, Microsoft et Vivatech

J’ai passé 3 jours sur le stand Qwant à Vivatech, et les questions ont fusé suite aux annonces. Je fais donc à l’arrache un article qui j’espère répondra aux questions fréquemment posées sans révéler de choses confidentielles. Je pense que mes collègues publieront la semaine prochaine un billet de blog officiel plus technique sur ce sujet.

Pourquoi ce partenariat avec Microsoft ?

Qwant connaît une très forte croissance (en gros le nombre de requêtes double chaque année[1]), ce qui veut dire qu’il faut augmenter notre capacité serveurs en conséquence. Par ailleurs, nous travaillons à améliorer sans cesse la qualité de nos résultats, ce qui implique de disposer de plus de puissance de calcul pour mieux indexer le Web (lequel est lui aussi en croissance). Tout cela fait que nous devons investir massivement dans l’infrastructure de la façon la plus efficace possible compte tenu des finances dont nous disposons (qui sont infiniment moindre que celle de nos concurrents américains).

Par ailleurs, les utilisateurs de Qwant ont bien remarqué que Microsoft est un partenaire de longue date de Qwant, puisque ce sont eux qui font office de régie publicitaire et contribuent à compléter les résultats de recherche là où Qwant en a besoin comme sur les images comme expliqué dans ce billet. Autrement dit, quand vous voyez une publicité dans les pages de résultats suite à une recherche sur Qwant, vous avez une publicité fournie par Microsoft, c’est d’ailleurs marqué en toutes lettres en bas à droite du bloc publicitaire.

Pub Microsoft sur Qwant.png

Pour en revenir au besoin de puissance supplémentaire, deux possibilités se présentent : acheter des serveurs (ce qu’on a fait jusqu’à présent) ou en louer à des professionnels du Cloud. Maintenant, nous allons faire les deux : acheter des serveurs pour mettre dans nos baies de Datacenter et aussi en louer. Ça va nous permettre d’avoir un Qwant encore plus performant et de meilleur qualité alors qu’il reçoit de plus en plus de demandes.

La vie privée est elle menacée par cet accord ?

Non. C’était bien sûr un point fondamental pour nous et Microsoft l’a bien compris. Pour ceux que la technique intéressent, voici comment nous avons fait pour nous en assurer.

Un moteur de recherche, c’est en gros 4 étapes (j’espère que les spécialistes me pardonneront les simplifications que je fais ci-dessous et que les autre tolèreront mon franglais technique) :

  1. Crawling : parcourir le Web pour lire les pages Web. Evidemment, il y a ici un gros besoin de bande passante ;
  2. Ranking : calculer l’importance de chaque page, leur donner un rang : quelles sont celles qui sont populaires (par exemples parce qu’elles ont plein de liens entrants), quelle est leur qualité (est-ce du spam ou du contenu légitime ?) de façon à savoir lesquelles seront proposées en premier aux utilisateurs ;
  3. Indexation : calculer l’index des pages. Comme un index dans un livre, qui recense à quelle page on trouve quel mot ou quel concept. Super gourmand en calcul, vu qu’on travaille sur des dizaines de milliards de pages Web ! On notera que les données manipulées ne sont pas liées à l’utilisateur vu que ce sont des pages Web qui sont publiques. C’est cette partie-là qui tournera avec des algorithmes Qwant sur des machines qui seront louées à Microsoft.
  4. Front : c’est l’interaction avec l’utilisateur et donc la partie sensible au niveau vie privée, car c’est là qu’on a à la fois la requête de l’utilisateur (sa demande) et son adresse IP[2]. Cette partie reste bien sûr sur les serveurs Qwant (ça va sans dire mais ça va mieux en le disant).

Donc, pour résumer : seules des données issues du Web (et donc publiques) seront traitées par les algorithmes de Qwant qui tourneront sur les serveurs loués à Microsoft.

Pourquoi avoir choisi Microsoft ?

Nous avons tout d’abord essayé de travailler avec d’autres acteurs français et européens, mais Microsoft, avec son Cloud Azure, nous permet de faire des calculs de type FPGA et supporte aussi Kubernetes, ce qui est important pour nous et n’est pas encore suffisamment au point chez d’autres acteurs. Ils disposent aussi de machines équipées de SSD, (donc très performantes en terme d’entrées/sorties, ce qui est important pour l’index).

Signer avec Microsoft ne veut pas non plus dire que nous faisons toute l’indexation sur des machines Azure : nous indexons déjà 20 milliards de pages sur notre infrastructure, et donc nous voulons en indexer 80 milliards de plus sur des machines Azure. Nous conserverons de la capacité d’indexation sur notre infra et nous la ferons même grandir car il est essentiel de ne pas être trop dépendant d’un fournisseur, quel qu’il soit.

Quand même, Microsoft, c’est pas le diable ?

J’avoue que quand je suis allé au Campus Microsoft à Issy les Moulineaux, j’ai un peu eu l’impression de visiter l’Étoile Noire :-D . Mais bon, la guerre des navigateurs et “Linux c’est le cancer” c’était au siècle dernier et depuis Microsoft a bien changé. Ils ont racheté GitHub, ils intègrent un noyau Linux dans Windows 10. Microsoft n’est jamais aussi bon et fréquentable que quand il est challenger. Assurons-nous que cela reste ainsi ;-)

Notes

[1] Et de nombreuses entreprises et administrations annoncent mettre Qwant par défaut sur leurs postes comme BNP Paribas ou l’administration qui va faire une circulaire visant le basculement vers Qwant de 4 millions de postes, ou le lancement de nouveaux produits comme Qwant Causes.

[2] Je rappelle que l’adresse IP est hachée et saltée aussitôt que possible pour empêcher tout rapprochement ultérieur de la requête et de l’IP.

lundi 6 mai 2019

Réinventer la citoyenneté à l'heure d'Internet

banniere 5juin.jpg

Le 5 juin 2019 de 18 h à 20 h, avec plein de gens qui ont toute la considération et avec qui je partage mon éditeur, C & F Éditions, je vais participer à une table ronde qui se tiendra à Bagnolet (Métro Gallieni). Plus de détails sur https://cfeditions.com/5juin/

mercredi 20 mars 2019

Bonjour les enfants !

Ce billet est à l’intention des enfants de Paris, plus particulièrement ceux qui seront présent à l’événement sur la Francophonie à la mairie du XVe arrondissement, à qui je présente le Web. (Pour les autres, je mets une photo de votre serviteur avec son vélo pour que vous ne soyez pas venus pour rien ;-) )

Tristan Tour Eiffel Moustache.jpg

mardi 12 mars 2019

Le Web a 30 ans

Il y a 30 ans aujourd’hui, naissait le Web. Je ne l’ai découvert que quelques années plus tard, et j’ai été ébahi par son potentiel. Soudain, l’Internet devenait utilisable par beaucoup plus de gens : il suffisait d’avoir un navigateur et de cliquer sur les liens bleus soulignés. C’était à la portée de tous !

Fin 1996, je postule chez Netscape, pour faire partie de l’aventure. Rapidement, j’ai vu une entreprise essayer de prendre le contrôle du Web en diffusant un navigateur avec son système d’exploitation, dont elle avait le monopole. C’était illégal, un abus de position dominante. C’était aussi toxique pour le Web, et cela m’a mis en colère. Coup de bol, au même moment (début 1998), mes collègues californiens lançaient le projet Mozilla, que j’ai rejoint. Vous connaissez peut-être la suite : AOL/Netscape essaye longuement de faire marcher le projet Mozilla jusqu’en 2003 avant de l’abandonner. Mozilla Foundation est créée, je monte Mozilla Europe avec Peter, Pascal,Axel et d’autres. Nous savions que Firefox était dans les tuyaux, et qu’il pouvait jouer un rôle décisif. Son succès a dépassé toutes nos attentes : il est massivement adopté en Europe et dans une moindre mesure aux USA et au Japon. Exit Internet Explorer, le monopole est renversé, la diversité des navigateurs est rétablie.

Février 2015 : je quitte Mozilla après 17 ans d’implication dans le projet. Pour moi, il est toujours très important de proposer un navigateur au service des utilisateurs. Le problème s’est même étendu aux téléphones mobiles, depuis l’avènement des smartphones en 2007. Mais le faire n’est pas suffisant si cela revient à pousser les utilisateurs dans les bras des géants de l’Internet qui collectent les données personnelles de chacun pour mieux servir leurs vrais clients : les annonceurs, à qui est vendue de la publicité ciblée. L’une de ces plateformes est sur le point d’obtenir le monopole des navigateurs… L’histoire est un éternel recommencement !

Juin 2018 : j’arrive chez Qwant. Mon objectif : aider le projet Qwant dans son adoption par les utilisateurs et aussi l’accompagner dans l’open-source / logiciel libre. Qwant a deux particularités :

  1. c’est un projet français et donc européen.
  2. c’est un moteur de recherche qui ne piste pas ses utilisateurs.

C’est la combinaison de ces deux qualités qui m’a séduit, en plus de la volonté d’aller vers plus de Libre.

Car en fait, je pense que le modèle des Google et de Facebook est toxique pour la démocratie. Tout savoir sur tout le monde, c’est une responsabilité que personne ne devrait avoir à porter, pas même un État. Car inévitablement, ça attise les convoitise, ça pousse à la manipulation. Les révélations Snowden (surveiller tous les internautes pour assoir l’hégémonie d’un pays) ou plus récemment Cambridge Analytica (utiliser les données d’un réseau social pour faire basculer des élections démocratiques) démontrent que ces dangers sont réels.

Évidemment, vouloir changer le Web, ça peut sembler naïf. Effectivement, il serait bien prétentieux d’affirmer qu’on est sûrs d’y arriver. Mais faut-il être certain du succès pour s’engager dans un projet ?

Heureusement, Tim Berners-Lee nous le rappelle :

Le Web est fait pour tous, et nous avons collectivement la capacité de le changer. Ça ne sera pas facile. Mais si nous rêvons un peu et travaillons beaucoup, nous pouvons obtenir le Web que nous voulons.

Le rêve, nous l’avons, chez Qwant. Et mon expérience avec Mozilla me laisse croire qu’effectivement, avec beaucoup de travail, c’est possible de changer le Web pour le meilleur. Je sais : j’ai déjà eu la chance de participer à un tel effort chez Mozilla. Vingt et un ans après, je continue de croire qu’il est possible de remporter cette bataille. Et je sais de façon certaine que la cause est juste : le monde a besoin d’un Web où nous, utilisateurs, ne sommes pas considérés comme du bétail. Alors au boulot !

mercredi 30 janvier 2019

Scandale Facebook de la semaine : Onavo, le VPN espion

Voilà, c’est le (principal[1]) scandale Facebook de la semaine : Facebook paye des jeunes 20 dollars pour espionner leur smartphone.

En fait, c’est un scandale à ramifications. Il faut revenir en arrière, car c’est peu ou prou un truc qu’ils faisaient déjà plus ou moins l’année dernière, que c’est contraire aux guidelines d’Apple, donc ils ont arrêté, avant de recommencer et de se faire choper à nouveau. Petit récapitulatif :

  1. Février 2018 : Facebook propose une option “Protect” dans son Appli, qui est en fait l’application de VPN Onavo. Un VPN, c’est un système de chiffrement pour protéger son trafic Internet des gens mal intentionnés. Seulement voilà, en croyant se protéger, on refile tout son trafic Internet… à Facebook ! C’était — ironiquement — juste après que Zuckerberg ait promis de “réparer Facebook”. À l’époque, ça avait fait pas mal de bruit :
    1. Blog du Modérateur : quand on passe par un VPN proposé par Facebook, il faut dire adieu à la confidentialité de ses données ;
    2. BusinessInsider : People are furious about Onavo, a Facebook-owned VPN app that sends your app usage habits back to Facebook,
    3. Gizmodo : Do Not, I Repeat, Do Not Download Onavo, Facebook’s Vampiric VPN Service,
    4. CNBC : Facebook is suggesting mobile users ‘Protect’ themselves…by downloading a Facebook-owned app that tracks their mobile usage (without disclosing it’s a Facebook-owned company),
    5. Wired : Don’t Trust the VPN Facebook Wants You to Use) ;
    6. Daring Fireball : This is spyware.
  2. Mars 2018 : On comprend mieux comment Onavo fonctionne ;
  3. Aout 2018 : Apple met à jour les règles de son Appstore et quelques jours plus tard, demande à Facebook de retirer l’application de l’AppStore car contraire aux nouvelles règles. On note que Google ne bouge pas sur le sujet : l’application espion est toujours disponible sur Google Play Store !
  4. Janvier 2019 : On constate que Facebook l’a réintroduite en douce sur l’Appstore en faisant croire que c’est une application pour les employés de Facebook. Elle porte un nouveau nom : Facebook Research App. Là aussi, c’est contraire aux règles. Apple prend la mouche et fait empêche le téléchargement de Facebook Protect.

Face à cela, on[2] pourrait souhaiter qu’Apple sanctionne Facebook pour avoir violé deux fois les règles, mais Facebook est bien trop populaire pour que l’iPhone puisse être vendu sans cette application.

Pour quelles raisons Facebook fait cela ? Surveiller le trafic réseau d’utilisateurs permet de repérer avant tout le monde les services qui fonctionnent bien, explique le Wall Street Journal. Cela permet de les racheter ou de produire une copie conforme de leur produit. C’est ainsi que WhatsApp a été racheté 19 milliards de dollars alors que la startup Houseparty, pour sa part, a été délaissée car Facebook a décidé de lancer Bonfire, une copie conforme.

Au final, ce qui arrive pour les utilisateurs est bien expliqué par mon collègue Guillaume Champeau :

Quelque part c’est exactement à ça qu’aboutirait l’idée que poussent certains de faire qu’on puisse vendre nos données personnelles. Vendront toute leur vie privée ceux pour qui 20 dollars c’est pas rien. Pourront préserver leur vie privée ceux qui pourront refuser ce chèque.

Souvenez-vous, si vous continuez à utiliser Facebook et ses services annexes (Instagram, WhatsApp, Messenger, etc.) c’est que vous tolérez les mensonges et scandales que nous sert Zuckerberg. Et si, comme moi, vous quittiez Facebook ?

Mise à jour

  • Sheryl Sandberg continue d’affirmer que les mineurs ont effectivement consenti à installer l’application Facebook Research qui pompe encor eplus de données. Pourtant, d’après cet article, il est extremement probable que ça n’est pas le cas (un mineur ne peut donner son consentement que si ses parents sont d’accord et ça ne semble pas prévu par le processus de validation de l’app).
  • Amusant : quand Apple a révoqué le certificat de Facebook pour bloquer l’appli en question, cela a aussi bloqué toutes les applications internes de Facebook dont certaines sont très importantes : le Workplace interne (messagerie instantanée d’entreprise), Ride (appli pour prendre les navettes de Facebook) ou Mobile Home, leur intranet. Quelques réactions d’employés : “We can’t aspire for good press while continuing to not play by the rules”. “Self-inflicted wound. When are we gonna learn?” Indeed !
  • Les résultats financiers de Facebook sont excellents. Comme le titre Gizmodo, Il se trouve que détruire la société est extrêmement profitable, et ça prouve bien qu’on a un sérieux problème.
  • Et Google dans tout ça ? NextINpact nous renseigne : “les applications « d’espionnage volontaire » de Facebook et Google ont été supprimées de l’App Store, des certificats ont été révoqués puis restaurés, et deux des plus importants géants du Net ont présenté leurs excuses. Les versions Android restent cependant disponibles. Il sera difficile à Google de le reprocher à Facebook puisqu’elle-même pratique ce type de collecte. À la différence toutefois que les finalités de l’application sont mieux expliquées chez Google que chez Facebook.”

- page 1 de 102