Gebruikerstests, met echte gebruikers, is een van de belangrijkste gebieden die te veel webontwerpers overslaan. Vaak is er weinig geld in de begroting voor tests, maar testen op bruikbaarheid op afstand kan relatief goedkoop zijn om te presteren, en de resultaten kunnen een groot verschil maken voor de conversies van een site.
Om de kracht van usability-testen in design te demonstreren, werkten we samen UserTesting en Optimale workshop om een aantal tests uit te voeren op Yelp als onderdeel van een herontwerpoefening.
We hebben specifiek gekozen voor tests op bruikbaarheid op afstand, omdat ze vrij snel en redelijk betaalbaar zijn om te gebruiken, in vergelijking met focusgroepen en andere op het laboratorium gebaseerde ontwerptoetsen. Deze tests waren allemaal niet-gemodereerd, zodat de gebruikers met de Yelp-website in het comfort van hun eigen huis konden communiceren voor de meest natuurlijke resultaten. We moedigden hen aan om hardop te denken en vervolgens hun reacties vast te leggen.
Gebruikersonderzoek gaat niet over het schrijven van complexe rapporten - het gaat om het stellen van de juiste vragen en het gebruiken van het bewijsmateriaal om ontwerpbeslissingen te ondersteunen. In dit stuk zullen we bekijken hoe we onze gebruikers hebben gekozen, hoe we de taken hebben opgezet en wat de resultaten waren ...
Een van de eerste stappen is uitzoeken wie uw ontwerpen test. In onze ervaring hebben we geconstateerd dat demografische gegevens niet zo belangrijk zijn als gedrag en bekendheid met technologie. Hoe vaak gebruiken ze vergelijkbare platforms en hoe comfortabel zijn ze?
demografische gegevens zijn niet zo belangrijk als gedrag en bekendheid met technologie
Yelp heeft een enorme gebruikersbasis (138 miljoen unieke maandelijkse bezoekers, volgens Yelp's Q2 2014-nummers ) zodat onze opnieuw ontworpen site nog steeds bekend moest zijn bij de gemiddelde huidige gebruiker - het zou niet logisch zijn bestaande gebruikers te vervreemden ten gunste van first-time gebruikers.
We hebben ons niet gericht op leeftijd, geslacht, inkomensniveau of ervaring met het web, omdat Yelp-gebruikers van alle achtergronden komen. Omdat we kwalitatieve gegevens verwerken, hoefden we ons geen zorgen te maken over statistische significantie. We volgden beste praktijken uit de sector en voerde onze studie uit met in totaal 5 gebruikers die zouden helpen bij het onthullen van ongeveer 85% van de bruikbaarheidsproblemen (goed genoeg voor de oefening).
Een van de taken vereiste gebruikers om in te loggen op een account. Dit betekende dat we twee segmenten moesten creëren voor onze testbasis: een met Yelp-accounts (3 gebruikers) en een zonder (2 gebruikers). Voor het segment met Yelp-accounts hebben we alleen deelnemers geselecteerd die minder dan zes maanden gebruikers van Yelp waren geweest om de kans te verminderen dat ze gebruikers van de macht zouden zijn.
Ten slotte hebben we omwille van de eenvoud de website van Yelp alleen op desktops getest, niet op mobiele apparaten. (Als dit meer was dan alleen een oefening, hadden we de ervaring getest op zoveel mogelijk apparaten.)
Elke gebruikerstest zou moeten beginnen met de vraag: "Wat willen we leren?"
Voor ons wilden we leren hoe semi-frequente Yelp-gebruikers heel algemene taken uitvoeren (om te bepalen welke functies het belangrijkst waren) en ten minste één minder algemene taak (om de intuïtie van geavanceerde functies te testen).
We hebben aan alle gebruikers dit soort veelvoorkomende taken gegeven:
We wilden leren wanneer beide gebruikersgroepen kozen om te zoeken of bladeren, hoe ze op filters reageerden en hoe ze een beslissing namen over welk bedrijf ze moesten bezoeken.
Wat de minder gebruikelijke taken betreft, hebben we voor elke gebruikersgroep een andere taak opgegeven.
Omdat we verschillende klachten van geregistreerde Yelp-gebruikers over de kenmerken Bookmark en Lijsten hadden gehoord, vroegen we geregistreerde gebruikers (Groep 1) om bedrijven te bewaren voor latere referentie. Voor niet-geregistreerde gebruikers (Groep 2) hebben we hen gevraagd een evenement te vinden.
Hieronder staan alle taken die we aan beide groepen hebben toegewezen. Na elke test vroegen we gebruikers of ze de taak met succes konden voltooien en hoe gemakkelijk of moeilijk het was (ook wel bekend als de Single Ease Question ).
Gedeelde taken (toegewezen aan beide groepen)
Groep 1-taken (Yelp-accounthouders)
Groep 2-taken (geen rekeninghouders)
Toen dit allemaal klaar was, was het tijd om te beginnen met testen. Het duurde ongeveer een uur om de resultaten te krijgen voordat we de gebruikersreacties konden bekijken en de gegevens konden analyseren.
Om te vergelijken met de kwalitatieve gegevens die we nu hadden, hebben we een kwantitatieve test uitgevoerd met 35 gebruikers met een gesloten kaartsortering en een eerste-klik-test. U kunt meer leren over de kwantitatieve gebruikerstaken , maar we vatten de belangrijkste inzichten kort samen:
Om te zien hoe deze inzichten tot uiting komen in het nieuwe ontwerp, kun je spelen met de low fidelity Yelp-prototype , en bekijk de laatste high-fidelity-prototype .