Na nedavnom Google Search Central Deep Dive događaju, Gary Illyes iz Google-a detaljno je objasnio kako funkcioniše tehnički proces indeksiranja sadržaja i koji su faktori najvažniji za uspešno rangiranje web stranice. Poseban akcenat stavljen je na takozvani “glavni sadržaj” stranice (main content), kao i na greške tipa soft 404, koje mogu značajno poremetiti indeksiranje.
Šta Google smatra glavnim sadržajem
Glavni sadržaj (main content) je deo stranice koji direktno doprinosi ispunjavanju njene svrhe. To mogu biti tekstovi, slike, video snimci, interaktivni alati, pa čak i komentari korisnika. Naslov stranice takođe se smatra delom glavnog sadržaja, jer pomaže korisnicima da donesu odluku o tome koju stranicu da posete.
Illyes je koristio termin “centerpiece content” da označi ovaj ključni deo sajta, naglašavajući da upravo on ima najveći uticaj na rangiranje i preuzimanje sadržaja u rezultatima pretrage, za razliku od elemenata kao što su zaglavlje, fusnote ili navigacioni meni.
Kako Google locira glavni sadržaj
Google koristi takozvanu „analizu pozicije sadržaja“ kako bi razumeo gde se na prikazanoj web stranici nalazi njen najvažniji sadržaj. Iako se ne radi o poziciji ključnih reči, premeštanjem teksta iz sidebar-a u centralni deo stranice, njegova važnost i potencijal za rangiranje direktno rastu.
Korišćenje semantičkog HTML-a (npr. <main>
, <header>
, <footer>
, <article>
) olakšava Google-u da tačno identifikuje koje sekcije sajta sadrže glavni sadržaj, a koje su od manje važnosti.
Indeksiranje kroz tokenizaciju
Google ne indeksira originalni HTML već koristi tokenizaciju, tehniku koja razbija tekst na delove (tokene) koje algoritam može efikasno obraditi. Ovaj proces omogućava bolje razumevanje značenja sadržaja, što je ključna osnova za napredne algoritme poput BERT-a. To znači da „tačno poklapanje ključnih reči“ više nije presudno jer je od sada važniji kontekst i korisnost teme za posetioce.
Soft 404: tiha greška koja pravi veliku štetu
Jedna od najvažnijih poruka Illyesovog izlaganja tiče se soft 404 grešaka, stranica koje zapravo ne postoje, ali vraćaju status 200 OK umesto ispravnog 404 odgovora. Ove greške se često prave kada se nedostupne stranice preusmere na početnu ili na stranicu bez relevantnog sadržaja.
Google smatra soft 404 ozbiljnom greškom jer troši “crawl budget”, količinu vremena i resursa koje Google posvećuje indeksiranju vašeg sajta. Pravilna praksa je: ako stranica ne postoji i nema adekvatnu zamenu, treba da vraća status 404. Preusmeravanje je opravdano samo ako postoji sadržaj koji zaista zamenjuje stari.
Google-u je najvažniji sadržaj koji ispunjava svrhu stranice. Taj sadržaj mora biti jasno izdvojen, tehnički precizno strukturiran i ne sme biti zamenjen nepostojećim ili loše preusmerenim stranicama. Umesto opsesije ključnim rečima, fokus bi trebalo da bude na relevantnosti, jasnoći i korisnosti sadržaja i, naravno, izbegavanju tehničkih grešaka koje remete indeksiranje, prenosi SEJ.
Nema komentara 😞
Trenutno nema komentara vezanih za ovu vest. Priključi se diskusiji na Benchmark forumu i budi prvi koje će ostaviti komentar na ovaj članak!
Pridruži se diskusiji