Visual Intelligence macht Online-Shopping menschlicher

Visual Intelligence kann dazu beitragen, Produktsuche und Produktempfehlungen in Onlineshops intuitiver zu machen. Denn bildbasierte Suchtreffer entsprechen ziemlich genau dem Bild, das die Kunden tatsächlich im Kopf haben. Ein Gespräch mit Philipp Derksen, Gründer und Owner von vviinn.

Herr Derksen, Sie sind mit Ihrem Unternehmen dabei, den Begriff „Visual Intelligence“ zu besetzen. Was können wir darunter verstehen?

Philipp Derksen: Im Prinzip verfügt jeder Mensch über „Visual Intelligence“. Denn im Alltag orientieren wir uns ganz selbstverständlich visuell und intuitiv. Gleichzeitig wird die Art und Weise, wie wir uns in digitalen Umfeldern bewegen, immer visueller. Das zuletzt heiß diskutierte Metaverse steht letztlich auch für die Transformation vom textbasierten hin zu einem audiovisuellen Internet. Der Begriff Visual Intelligence bedeutet im Kern: Nutzung von Künstlicher Intelligenz für die Analyse und Erschließung visuellen Contents. Konkret heißt das in unserem Fall: Wir verwenden KI, um Produktsuche und Produktempfehlungen in Onlineshops visueller und damit intuitiver zu machen.

Was bedeutet das genau?

Derksen: In dem Moment, in dem ein Nutzer sich zum Beispiel das Bild eines Sofas in einem Online-Möbelshop ansieht, analysiert unsere Software in weniger als 100 Millisekunden dieses Bild und schlägt stilistisch passende Produkte vor. Die andere Einsatzmöglichkeit ist die Produktsuche: Menschen suchen selbst aktiv mit Bildern, indem sie abfotografierte Produkte oder zum Beispiel ein Instagram-Bild hochladen. Visual Intelligence macht so das Online-Shopping menschlicher. Das funktioniert auch einfacher als herkömmliche textbasierte Suche oder Empfehlungen. Bildbasierte Suchtreffer und Vorschläge treffen viel mehr das Bild, das die Kunden im Kopf haben.

Unternehmen wie Ebay oder Zalando arbeiten bereits mit Visual Intelligence. Ist diese Technologie vor allem ein Fall für Big Player?

Derksen: Überhaupt nicht. Obwohl es auf den ersten Blick vielleicht so aussieht. Die großen Plattformen investieren tatsächlich bereits in Visual-Intelligence-Lösungen. Bei mittelständischen Online-Pureplayern oder traditionellen Marken sieht man diese Technologie dagegen noch selten. Dabei läge gerade für diese Shops darin eine immense Chance. Bislang nutzen sie text- und behavior-basierte Technologie für das Empfehlungsmanagement – aber das funktioniert oft nur schlecht.

Wo stößt denn textbasierte Suche an ihre Grenzen?

Derksen: Oft hakt es an unpräzisen Begriffen und fehlenden Synonymen: Ist das gesuchte Kleid rosa oder pink? Wird ein Sideboard oder eine Kommode gesucht? Bei den Empfehlungen scheitert es oft an nicht ausreichend großen Datenpools, die notwendig wären, um wirklich sinnvolle Produktempfehlungen zu generieren. So schlagen Shops auf Basis ihrer schmaler Datenbasis ihren Kunden lediglich Produkte vor, die ohnehin viele Menschen gekauft haben. Damit stecken dann alle fest in der Bestseller-Bubble – die Shops wie ihre Kunden.

Und eine auf Visual Intelligence basierende Suche hat diese Probleme nicht?

Derksen: Gerade schnell wachsende Shops, die weder über die nötige Datenmenge und -tiefe verfügen, können mit einer bildbasierten Such- und Recommendation-Technologie auf einfache und schnelle Weise die Qualität ihrer Produktvorschläge und damit auch ihren Umsatz weiter erhöhen. Unsere Software eignet sich für Shops ab ein paar tausend Produkten und ist nach oben offen. Sie lässt sich schnell und ohne viel Aufwand integrieren. Das geht innerhalb von zwei Tagen und blockiert nicht die Kapazitäten der Entwicklungsabteilung. Technisch sind es Web-Komponenten, die einfach ins Frontend des Shops integriert werden und die direkt mit unserer API kommunizieren. Die Shops können noch das Design anpassen und dann sofort loslegen.

Website des Onlineshops Ostermann
Der Onlineshop Ostermann arbeitet mit bildbasierten Empfehlungen

 

Gibt es Zahlen, die die Effizienz von Visual Search und Visual Recommendations belegen?

Derksen: Zum Thema Produktempfehlungen haben wir umfassende Tests gemacht. Dabei stieg die Conversion Rate mit Produktempfehlungen in einem Online-Shop auf der Basis unserer Software vviinn um 258 Prozent. Die Klickquote erhöhte sich durchschnittlich um 153 Prozent. Ähnlich dürfte auch der Erfolgseffekt bei der Suche sein. Diese Zahlen bestätigen, was wir und unsere Kund:innen schon immer gewusst haben: Ein Bild sagt über ein Produkt nicht nur mehr als 1000 Worte, es verkauft auch besser als 1000 Worte.

Worin besteht der Unterschied zu Produktempfehlungen, die auf dem Surfverhalten der User beruhen?

Derksen: Die herkömmliche digitale Customer Journey geht so: User:innen werden über eine Kampagne angesprochen. Sagen wir, eine Kundin landet in einem Onlineshop eines Möbelhändlers.  Sie interessiert sich für einen Cocktail-Sessel und bekommt als Vorschlag unter anderem einen Duschvorhang angezeigt. Das ist ein reales Beispiel. Das liegt an dem bereits angesprochenen Mangel an Daten.

Mit Visual Intelligence läuft die Customer Journey dagegen so: Die besagte Kundin klickt auf das Produktbild mit dem Sessel und teilt uns damit ganz genau mit, was sie kaufen möchte. Aus diesem Bild kann unsere Software viel mehr Informationen ziehen als viele andere aus verrauschten Click-Daten. Sie analysiert ein Produktbild anhand von mehr als 1.000 Merkmalen und schlägt auf dieser Grundlage wirklich stilistisch passende Produkte vor. So bekommt diese Kundin einen Überblick über alle ähnlichen Sessel – und das beschleunigt die Kaufentscheidung enorm.

Hat sich das in der E-Commerce-Branche schon herumgesprochen? Wer arbeitet bereits damit?

Derksen: Nicht jeder will sich die Vorteile nach der Investition in ein Personalisierungs-Tool sofort eingestehen. Also könnten es die Händler für meinen Geschmack etwas schneller annehmen (lacht). Aber ich bin sehr zuversichtlich. Die Technologie und unser Ansatz sind noch relativ neu und unbekannt, treffen aber bei den Innovatoren der Branche auf offene Türen. Und die Kunden, die mit uns zusammenarbeiten, sind von unserer Vision, den Onlinehandel intuitiver zu machen, überzeugt. Selbst Traditionsunternehmen wie die große nordrhein-westfälische Einrichtungs-Kette Ostermann nutzen sowohl unsere Visual Recommendations wie auch die visuelle Suche in ihrem Online-Shop.

Website des Onlineshops Ostermann
Ostermann hat auch eine visuelle Produktsuche eingeführt: User können BIlder hochladen, die KI sucht nach ähnlichen Produkten

 

Wir bewegen uns derzeit auf die cookielose Zeit zu. Kommt das Ihrem Geschäftsmodell eigentlich entgegen?

Derksen: Das ist tatsächlich ein ganz entscheidender USP von uns. Wir kommen gänzlich ohne Cookies aus. KI-gestützte Komponenten wie die Visuelle Intelligenz von vviinn funktionieren ohne jegliche Vorkenntnisse und Daten über Kund:innen. Es ist eh’ keine besonders gute Idee, User:innen, für die ich als Online-Shop Geld bezahlt habe, erst einmal einen Cookie-Layer vor die Nase zu halten, bevor sie auch nur ein einziges Produkt gesehen haben. Aber spätestens, wenn die Zeit der Third-Party-Cookies endgültig abgelaufen ist, werden die Merchants umdenken – und dann werden wohl noch ein paar mehr die Vorteile von visuellen Produktempfehlungen und visueller Suche erkennen.

Ist der Anwenderkreis auf Mode und ähnliche Branchen beschränkt? Oder anders gefragt: Könnten Visual Recommendations auch bei komplexeren Produkten oder dem B2B-Bereich zum Einsatz kommen? 

Derksen: Unsere Kund:innen kommen bislang tatsächlich vor allem aus Branchen mit Produkten, bei denen Visualität eine wichtige Rolle spielt. Aber die Technologie ist darauf nicht beschränkt. Lebensmittel oder Ersatzteile lassen sich damit ebenfalls erfolgreicher verkaufen. Auch bei technischen Produkten wie etwa Fernsehern sehen wir einen Einsatzbereich. Denn auch da ist das Design nicht unwichtig. Eine große Stärke ist das zuverlässige Erkennen von Materialoberflächen. Wir haben kürzlich Tests für einen Katalog für Baumaterialien gemacht. Da hat die Software ohne weiteres eine Fliese mit Holzmuster als Keramik erkannt und richtige Alternativen empfohlen. Visual Intelligence hat also unbegrenzte Einsatzmöglichkeiten.

Welche weiteren Pläne haben Sie mit vviinn? Könnte man unter dem Begriff Visual Intelligence noch weitere Services anbieten?

Derksen: Wir forschen zusammen mit einem Lehrstuhl für Visual Computing stetig an neuen neuronalen Netzen. Und außerdem haben wir eine sechsstellige öffentliche Förderung zur Entwicklung einer visuellen Produktnavigation für den digitalen Handel erhalten. Die Wege, auf dem in Onlineshops Menschen Produkte suchen und finden, kommen noch sehr aus der Zeit des Web 1.0. Man klickt auf Kategorien und Listen. Das haben wir auf dem Desktop über die Jahre gelernt. Auf einem Mobil-Gerät ist es aber eigentlich inakzeptabel, weil viel zu mühselig und umständlich. Auch hier geht es darum, für den intuitive Einkaufsprozess aus dem realen Leben eine digitale Entsprechung zu finden. Also werden wir mit KI und Visual Intelligence weiterhelfen und suchen aktuell noch Online-Shops, die ihre Anforderungen und Ideen mit uns teilen und dann direkt von unseren Lösungen profitieren.

Das Interview führte Helmut van Rinsum

Philipp Derksen ist Gründer und Product Owner von vviinn, einer KI-basierten Softwarelösung für visuelle Produktsuche und Produktempfehlungen für Onlineshops. Der Berliner Unternehmer und Diplomingenieur arbeitet seit über 20 Jahren im Online-Business und seit 15 Jahren im E-Commerce. Sein Unternehmen Mediaopt entwickelt seit 2009 Software-Lösungen für die E-Commerce-Branche und berät Unternehmen bei ihrer digitalen Vertriebsstrategie. 

Weitere Interviews:

Felix Schirl: Clever Personalisierung fällt den Nutzern nicht auf
Bernd Korz: „Standardstimmen sind keine Herausforderung mehr“
Jennifer Dorman: Warum Machine Learning verzerrte Rollenbilder begünstigt