V minulém článku jsme testovali, jak si vyhledávání produktových kódů poradí s různými způsoby zápisu - s mezerami místo pomlček, bez oddělovačů, malými písmeny. Výsledky na 40 produktech vypadaly dobře. Ale sami jsme napsali:
Se 40 produkty v indexu má hledaný kód minimální konkurenci. Se 40 000 produkty by stejný dotaz mohl odpovídat desítkám jiných kódů.
To je fér námitka. Proto jsme vzali reálný katalog - 35 000 produktů z B2B e-shopu s leteckými díly - a pustili na něj stejný typ testů. Ne na pár vybraných kódech, ale na stovkách náhodně vybraných z celého katalogu.
Jak test probíhal
Z katalogu jsme náhodně vybrali 807 produktových kódů a SKU. Výběr pokrýval všechny formáty, se kterými se v praxi setkáváme - čistě číselné kódy, alfanumerické s pomlčkami, s tečkami, lomítky, závorkami i mezerami. Pro vzácné formáty (kódy se závorkami, s plusem) jsme vzali všechny, které v katalogu byly.
Pro každý kód jsme algoritmicky vygenerovali varianty dotazů simulující typické chování zákazníků - od přesného zadání přes vynechání oddělovačů až po hledání jen podle části kódu. Celkem 6 085 dotazů. Každý dotaz jsme odeslali na dvě verze našeho systému - Původní Search Ready a Nové Search Ready - a zaznamenali, zda se správný produkt objevil a na jaké pozici.
Žádný dotaz nebyl ručně vybraný tak, aby „vypadal dobře". Žádný výsledek nebyl vyřazen, protože se nehodil.
Celkové výsledky
Porovnání, jak si obě verze stály na celém vzorku 6 085 dotazů:
- Produkt nalezen na 1. pozici: Původní 41 % ➔ Nové 71 %
- Produkt nalezen v TOP 3: Původní 46 % ➔ Nové 76 %
- Produkt nalezen v TOP 10: Původní 51 % ➔ Nové 80 %
Na první pohled mohou čísla vypadat nižší, než byste čekali. V tom je ale pointa testu na reálných datech - zahrnuje i záměrně obtížné scénáře, jako hledání podle části kódu nebo jen jeho číslic. Tyto parciální dotazy úspěšnost přirozeně snižují, protože na katalogu s 35 000 produkty může krátký fragment odpovídat desítkám kódů současně.
Zajímavější je podívat se na jednotlivé scénáře. Tam se ukáže, kde se objednávky skutečně ztrácejí.
Přesný kód: základ, který musí fungovat
Zákazník má kód přesně - z katalogu, z faktury, ze systému. Zadá ho a očekává okamžitý výsledek.
- Zadání přesného kódu: Původní 99 % ➔ Nové 100 %
- Kód zadán malými písmeny: Původní 99 % ➔ Nové 100 %
Tady si obě verze vedou dobře. Nové Search Ready je ale o něco přesnější v řazení výsledků - správný produkt je téměř vždy na absolutně první pozici, ne až na druhé nebo třetí.
Tohle by měl zvládnout každý vyhledávač na e-shopu. Rozdíly se ukáží v momentě, kdy zákazník kód trochu změní.
Kde e-shopy ztrácejí objednávky: zákazník kód upraví
V praxi zákazník často kód nepřepíše přesně. Oddělovače vynechá, zamění, napíše po svém. Právě tady se ukazuje propastný rozdíl mezi původním přístupem a naším novým specializovaným algoritmem.
Zákazník vynechá oddělovače
Kód v systému je 010-01074-00. Zákazník napíše 01001107400 - prostě oddělovače přeskočí. Přepisuje z papíru, z chatu, z PDF.
- Úspěšnost nalezení: Původní 4 % ➔ Nové 89 %
Závěr: Z 96 % nenalezených na 89 % nalezených. Původní Search Ready (podobně jako běžné e-shopy) v tomto scénáři prakticky nefungovalo. Na reálném katalogu sice dosáhlo 4 %, ale výsledek je stejný: bez specializované analýzy kódů tento scénář zkrátka nefunguje.
Zákazník zamění oddělovače
Kód je 0622.834-923. Zákazník napíše 0622-834.923 - prohodí tečky a pomlčky, protože si nepamatuje, co kde bylo.
- Úspěšnost nalezení: Původní 33 % ➔ Nové 100 %
Závěr: U původního řešení dva ze tří zákazníků produkt nenajdou. Přitom stačí prohodit tečku za pomlčku. Nové Search Ready toleruje záměny oddělovačů a najde správný produkt pokaždé.
Zákazník vloží pomlčku mezi písmena a čísla
Kód je T1210444. Zákazník intuitivně napíše T-1210444 - oddělí písmeno od číslic pomlčkou. Nebo XC100095 napíše jako XC-100-095.
- Úspěšnost nalezení: Původní 10 % ➔ Nové 89 %
Závěr: U původního řešení devět z deseti zákazníků odejde s prázdnou. A přitom zadali správný kód - jen přidali jednu logickou pomlčku navíc.
Zákazník nahradí oddělovače mezerami
Kód je 010-01074-00. Zákazník napíše 010 01074 00 - místo pomlček dá mezery.
- Úspěšnost nalezení: Původní 90 % ➔ Nové 100 %
Původní Search Ready si s mezerami poradilo poměrně dobře (90 %). Ale pro B2B e-shop s vysokou hodnotou objednávky je těch zbylých 10 % nenalezených zbytečná finanční ztráta.
Zákazník vloží mezery na hranice písmen a číslic
Kód je W31X2M1G50. Zákazník napíše W 31 X 2 M 1 G 50 - intuitivně oddělí každou skupinu písmen a číslic.
- Úspěšnost nalezení: Původní 10 % ➔ Nové 72 %
Zákazník má jen část kódu
Ne vždy má zákazník celý kód. Pamatuje si začátek, nebo jen čísla. Tyto scénáře jsme testovali také, i když očekáváme nižší úspěšnost - na katalogu s 35 000 produkty je krátký fragment přirozeně nejednoznačný.
- Začátek kódu (prefix): Původní 46 % ➔ Nové 64 %
- Jen číselná část: Původní 41 % ➔ Nové 55 %
- Jen písmenná část: Původní 19 % ➔ Nové 20 %
U prefixu a číselných segmentů Nové Search Ready viditelně pomáhá. Samotná písmenná část kódu (například MOT z kódu MOT-51410404) je na katalogu této velikosti příliš vágní - a obě verze si s ní vedou podobně. To je očekávané chování.
Zhoršilo se něco? Ano - a řekneme kde
Každá změna v systému přináší riziko, že se něco, co fungovalo, rozbije. Testovali jsme na to explicitně.
Z 6 085 dotazů se v 86 případech (1,4 %) stalo, že Původní Search Ready produkt našlo, ale nové ne. Oproti tomu Nové Search Ready našlo produkt v 1 870 případech (31 %), kde původní algoritmus selhal.
Poměr zlepšení k regresím je tedy propastných 22 : 1 ve prospěch Nového Search Ready.
Regrese se týkají převážně parciálních dotazů - zákazník zadal jen část kódu a Původní Search Ready ho náhodou trefilo na nižších pozicích (7.–10. místo). Žádná regrese se neobjevila u přesných nebo mírně upravených kódů. Přesné shody, malá písmena, záměny oddělovačů - tady je Nové Search Ready stejně dobré nebo lepší ve 100 % případů.
Úvodní nuly - vědomé rozhodnutí
Jeden scénář jsme vědomě netestovali: odstranění úvodních nul. Kód 010-01074-00 a dotaz 10-1074-0. U technických identifikátorů je úvodní nula součástí kódu - 010 a 10 mohou být různé díly. Vyhledávání by nemělo hádat, jestli zákazník nulu zapomněl, nebo hledá jiný produkt. Toto chování je záměrné. Pokud by se ukázalo, že v konkrétním katalogu je tolerance úvodních nul žádoucí, je technicky řešitelná úpravou konfigurace indexace.
Kde se obě verze chovají stejně
Pro úplnost - existují formáty kódů, kde rozdíl mezi Původním a Novým Search Ready je minimální:
- Čistě číselné kódy (např. 76575): Zlepšení jen o 2,5 procentního bodu. Čísla bez oddělovačů zkrátka nemají co transformovat.
- Kódy s mezerami (např. 1U149-006-1 PMA): Zlepšení o 2 procentní body. Původní Search Ready si s mezerami v kódech radilo relativně dobře.
Co to znamená pro konverzi vašeho e-shopu
Tento test proběhl na jednom B2B katalogu - 35 000 leteckých dílů. Vaše produkty, vaše kódy a vaši zákazníci se mohou chovat jinak. Ale vzorce chování - záměna oddělovačů, vynechání speciálních znaků, přepsání kódu z papíru bez pomlček - jsou univerzální. Vidíme je u e-shopů s autosoučástkami, elektronikou, průmyslovými díly i spotřebním zbožím.
Zákazník, který hledá podle produktového kódu, je ten nejhodnotnější. Ví přesně, co chce. Nepotřebuje doporučení, filtrování ani inspiraci. Potřebuje zadat kód a dostat výsledek.
Pokud ho nedostane, nezkouší to jinak. Odejde. A vy se to z analytiky nedozvíte - uvidíte jen „vyhledávání bez výsledků" a nevíte, že šlo o zákazníka připraveného nakoupit.
Zkuste si to na vlastním e-shopu
Vezměte pět svých nejprodávanějších produktů. Zkopírujte jejich kód a zadejte ho do vyhledávání. Pak z něj smažte pomlčku. Nahraďte tečku mezerou. Vynechejte oddělovače úplně.
Objeví se správný produkt na první pozici?
Pokud ne, přicházíte přesně o ty zákazníky, kteří jsou připraveni okamžitě nakoupit - a kteří odejdou, protože vaše vyhledávání nerozumí jejich způsobu zápisu.
Chcete vidět, jak by Nové Search Ready fungovalo na vašich datech? Domluvte si demo - ukážeme vám výsledky na vašem vlastním katalogu.
Často kladené otázky (FAQ)
Proč e-shop nenajde produkt, když zákazník zadá kód bez pomlčky?
Standardní vyhledávání pracuje s kódem jako s textem a rozloží ho na části podle oddělovačů. Když oddělovače chybí, vyhledávač dostane úplně jiný „text" a nenajde shodu. Nové Search Ready tento problém řeší tím, že kód při indexaci i vyhledávání zpracovává více způsoby současně.
Funguje vylepšené hledání kódů i na velkých katalozích s tisíci produkty?
Ano. Tento test proběhl na katalogu s 35 000 produkty - a právě na velkých katalozích je specializované hledání kódů důležitější, protože krátké fragmenty kódů mohou odpovídat více produktům současně.
Nezhorší se tím vyhledávání běžného textu (názvy, popisy)?
Ne. Vyhledávání produktových kódů v Novém Search Ready používá samostatnou analýzu, oddělenou od textového vyhledávání. Každý typ dat - název, popis, kód, SKU - se zpracovává způsobem, který mu sedí.
Co když zákazník odstraní úvodní nulu z kódu?
Toto je vědomá limitace. U technických identifikátorů je nula součástí kódu a 010 může být jiný díl než 10. Pokud je u vašeho katalogu tolerance úvodních nul žádoucí, je technicky řešitelná úpravou naší konfigurace.
