Qu’est-ce qui vient après Zoom ?

Nous avions les appels vidéo dans la science-fiction, et nous avions la vidéoconférence dans les années 1990, au moment où le web prenait son essor, comme un outil très coûteux et peu pratique pour les grandes entreprises. Elle a été proposée comme un cas d’utilisation pour la 3G, ce qui n’a pas eu lieu du tout, et avec la croissance du haut débit grand public, nous avons eu toutes sortes d’outils qui pouvaient le faire, mais cela n’est jamais vraiment devenu un comportement de consommation de masse. Aujourd’hui, tout d’un coup, nous sommes tous enfermés et nous passons tout le temps des appels vidéo, nous faisons des stand-up en équipe, nous jouons et nous organisons des fêtes d’anniversaire en famille, et tout d’un coup, Zoom est devenu un gros sujet. À un moment donné, beaucoup de ces réunions se transformeront à nouveau en café, nous l’espérons, mais la vidéo restera.

Mais est-ce que ce sera toujours Zoom ?

En tant que produit révolutionnaire, Benedict Evans pense qu’il est utile de comparer Zoom avec deux produits précédents – Dropbox et Skype.

Une partie de la légende fondatrice de Dropbox est que Drew Houston a dit aux gens ce qu’il voulait faire, et tout le monde a dit « il y en a déjà des centaines » et il a répondu « oui, mais lequel utilisez-vous ? C’est ce que Zoom a fait – les appels vidéo ne sont pas nouveaux, mais Zoom a résolu beaucoup de petits problèmes qui rendaient difficile l’accès à un appel.

L’autre comparaison, cependant, est celle de Skype. Tout comme pour la vidéo, la VOIP existait depuis longtemps, mais Skype a résolu de nombreux problèmes, tant au niveau de l’ingénierie que de l’expérience utilisateur, et a ainsi fait de la VOIP un produit de consommation.

Deux choses sont arrivées à Skype par la suite, cependant. La première est que le produit a dérivé pendant longtemps, et que la qualité de l’expérience utilisateur a décliné. Mais la seconde est que tout a une voix maintenant. Imaginez que vous essayiez aujourd’hui de dresser une carte du marché pour savoir quelles applications d’un smartphone, d’un Mac ou d’un PC pourraient avoir une voix – ce serait absurde. Tout peut avoir une voix. Et bien qu’il y ait encore beaucoup d’ingénierie sous le capot, c’est devenu une marchandise. Que vous l’achetiez chez Twilio ou chez quelqu’un d’autre, dire que « notre application est dotée d’une voix informatique gratuite » n’a pas de sens – ce qui compte, c’est la façon dont vous l’emballez. Pourquoi avez-vous la voix ? C’est pourquoi le Clubhouse est construit sur des idées de psychologie et de comportement, et non sur la voix sur IP, et il n’essaie pas de gagner de la « voix ». De même, Pindrop examine chaque appel entrant dans un centre d’appel et essaie de déterminer s’il s’agit d’un appel frauduleux. Si vous aviez regardé Skype en 2004 et que vous disiez qu’il possédait une « voix » sur les « ordinateurs », cela n’aurait pas été le bon modèle mental.

Evans pense que c’est là que nous irons avec la vidéo – il y aura toujours de l’ingénierie dure, mais la vidéo elle-même sera une marchandise et la question sera de savoir comment l’emballer. Il y aura de la vidéo dans tout, tout comme il y a de la voix dans tout, et il y aura une grande prolifération dans les secteurs verticaux de l’industrie d’une part et dans les éléments de dégroupage de la stack technologique d’autre part. D’une part, la vidéo dans le domaine de la santé, de l’éducation ou de l’assurance concerne le flux de travail, le modèle de données et la voie d’accès au marché, et beaucoup d’autres entreprises intéressantes seront créées, et d’autre part, Slack déploie la vidéo sur les éléments constitutifs d’Amazon, et beaucoup d’entreprises intéressantes seront créées ici aussi. Il y a beaucoup de regroupement et de dégroupement à venir, comme toujours. Tout sera « vidéo » et disparaîtra à l’intérieur.

Une partie importante de ce phénomène est qu’il semble y avoir peu d’effets de réseau réels dans un appel vidéo en soi. Vous n’avez pas nécessairement besoin d’un compte pour participer à un appel, et vous n’avez généralement pas non plus besoin d’une application, surtout sur le bureau – il vous suffit de cliquer sur un lien dans votre calendrier et l’appel s’ouvre dans le navigateur. En effet, le calendrier est souvent la couche d’agrégation – vous n’avez pas besoin de savoir quel service le prochain appel utilise, juste quand il l’est. Skype avait besoin à la fois d’un compte et d’une application, ce qui a eu un effet de réseau (et l’a même perdu). WhatsApp utilise le système de numérotation téléphonique comme une adresse et se superpose donc à la liste de contacts de votre téléphone – en fait, elle utilise le RTPC comme graphique social plutôt que de devoir construire son propre graphique. Mais un appel vidéo de groupe est une URL et une invitation à un calendrier – il n’a pas de graphique propre.

Soit dit en passant, l’une des raisons pour lesquelles tout cela semble très 1.0 est la distinction plutôt artificielle entre les appels basés sur une « salle », où le système d’adressage est une URL et où tout le monde peut se joindre sans compte, et les appels basés sur des « personnes », où chacun doit avoir sa propre adresse, qu’il s’agisse d’un numéro de téléphone, d’un compte ou d’autre chose. C’est pourquoi Google propose à la fois Meet (URL) et Duo (personnes) – le système FaceTime d’Apple n’est constitué que de personnes (pas d’URL).

Pour aller plus loin, une grande partie des frictions que Zoom a supprimées est que vous n’avez pas besoin d’un compte, d’une application ou d’un graphique social pour l’utiliser : Zoom a rendu les effets de réseau sans importance. Mais, cela signifie que Zoom n’a pas non plus ces effets de réseau. Il s’est développé en supprimant la défensibilité.

Il a comparé Zoom avec Dropbox et Skype, mais une autre comparaison utile est avec le partage de photos. Il y a toujours eu des centaines de choses qui ont fait cela, mais nous avons vu une succession d’entreprises qui ont élaboré quelque chose de nouveau autour de l’expérience et de la psychologie de l’utilisateur, qui les a amenées au-delà des « photos » et les a rendues plus perspicaces – d’abord Flickr, puis Facebook et Instagram, et enfin Snap.

Lorsque Snap a été lancé, il y avait une infinité de façons de partager des images, mais Snap posait un tas de questions bizarres que personne n’avait vraiment posées auparavant. Pourquoi faut-il appuyer sur le bouton de l’appareil photo – pourquoi l’application ne s’ouvre-t-elle pas dans l’appareil ? Pourquoi enregistrez-vous vos messages – n’est-ce pas comme si vous enregistriez tous vos appels téléphoniques ? Fondamentalement, Snap a demandé « pourquoi, exactement, envoyez-vous une photo ? Quel est l’objectif social sous-jacent ? Vous n’envoyez pas vraiment une feuille de pixels à quelqu’un, vous communiquez.

C’est la question que Zoom et tous ses concurrents n’ont pas vraiment posée. Zoom a fait un bon travail en demandant pourquoi il était difficile d’entrer dans un appel, mais n’a pas vraiment demandé pourquoi vous êtes dans l’appel en premier lieu. Pourquoi, exactement, envoyez-vous un flux vidéo à quelqu’un et en regardez-vous un autre ? Pourquoi est-ce que je regarde une grille de petites vignettes de visages ? Est-ce le but de ce moment ? À quoi sert le bouton « mute » – un bruit de fond, ou pour que je puisse parler à quelqu’un d’autre, ou pour que je puisse l’éteindre pour lever la main ? Quel est l’objectif social de la mise en sourdine ? À quoi sert le partage d’écran ? Quelles autres questions pourrait-on se poser ? Et donc si Zoom est la boîte de dépôt ou Skype de la vidéo, nous attendons le Snap, le Clubhouse et le Yo.

Via Benedict Evans

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.