RankBrain

Google prowadzi nieustające działania, mające na celu poprawę wyników wyszukiwania. Czasy, kiedy wyniki wyszukiwania opierały się tylko na linkach prowadzących do serwisu oraz nasyceniu strony słowami kluczowymi minęły bezpowrotnie.

Jak działa RankBrain?

RankBrain jest obecnie jednym z elementów składowych algorytmu Google. Jest to algorytm wykorzystujący uczenie maszynowe, a jednym z jego celów jest określenie kontekstu zapytania.

System ten analizuje słowa w danym zapytaniu, i ustalana dla niego kontekst i intencje wyszukującego. Dobiera również odpowiednie elementy rankingowe. Dla jednego zapytania może liczyć się najbardziej aktualna wiadomość („nowości kinowe”), dla innych autorytet domen lub powiązania tematyczne (artykuły naukowe).

Kontekst ten jest ustalany na podstawie wielu przesłanek. Załóżmy, że wyszukujemy frazę „mistrzostwa świata w piłce nożnej”. Jaki wynik powinno wyświetlić Google? Powinno wyświetlić informacje na temat poprzednich mistrzostw, następnych mistrzostw, statystyk? Okazuje się, że Google użyje części algorytmu RankBrain do określenia wyników. Na podstawie danych historycznych, zainteresowania użytkowników, lokalizacji pochodzenia zapytania i innych Google ustali kontekst i wyświetli najbardziej optymalne wyniki. Np. dla użytkownika będącego w mieście finałowym na 3 dni przed meczem, najważniejszą informacją może być lokalizacja stadionu i godzina rozpoczęcia meczu.

Jak przyznaje Google, około 15% wszystkich wyników zapytań jest generowanych przy zastosowaniu RankBrain. Algorytm ten jest nieustannie rozwijany i jak się wydaje, jego znaczenie będzie rosło z czasem i ilością przeanalizowanych zapytań. W jednym z badań przeprowadzonych przez Stone Temple pokazano, że poprawiła się jakość dla niemal 55% zapytań, które wcześniej były źle interpretowane przez algorytm.

Inne wykorzystanie uczenia maszynowego w Google.

Google wykorzystuje uczenie maszynowe również w swoich inny produktach. Np. w angielskojęzyczna wersja Gmaila jest w stanie automatycznie wygenerować odpowiedź na przychodzącego maila. My musimy go tylko zatwierdzić. Oczywiście nie we wszystkich przypadkach odpowiedź jest idealna. Jednak uczące się algorytmy analizując nasze maile, są w stanie z dużym prawdopodobieństwem napisać maila, który "trafi" w naszą potencjalną odpowiedź. Np. jeśli dostaniemy ofertą z dziedziny, która nas nie dotyczy, z dużym prawdopodobieństwem odpiszemy, że nie jesteśmy zainteresowani. Już teraz większość użytkowników jest zaskoczona skutecznością tego narzędzia.

Greg Corrado czyli jedna z głównych osób odpowiedzialnych za uczenie maszynowe w Google, pokazuje zasadę działania na przykładzie filtra antyspamowego. Wcześniejsze podejście opierało się na AI (sztucznej inteligenci). Projektowano zasady mówiące że np.  maile zawierają określony rodzaj tekstu, są prawdopodobnie spamem. Niestety, było to w miarę łatwe do obejścia przez człowieka zabezpieczenie. Trzeba było po prostu uważnie redagować treść.

Obecne podejście wygląda zgoła inaczej. Oprogramowanie antyspamowe uczy się na podstawie danych historycznych maili, które były określone jako spam lub nie. Na tej podstawie maszyna uczy się, jak naśladować to, co miało miejsce w analizowanych przypadkach. Dzięki temu algorytm dostosowuje się do zmieniających strategii „spamerów”.

Jak widać, RankBrain jest tylko jednym z elementów polityki Googla w wykorzystaniu uczenia maszynowego. Obserwując trendy w branży należy się liczyć ze wzrostem znaczenia tej technologi. Prawdopodobnie sprawi ona, że wiele decyzji podejmowanych obecnie przez ludzi stanie się domeną maszyn.

Zobacz projekt