- Vaša košarica je trenutno prazna
Kako deluje LiteSpeed Cache Crawler za WordPress?
Vsi, ki ste se odločili za naročilo spletnega gostovanja pri NEOSERV, obenem pa vaša spletna stran deluje na sistemu WordPress, lahko izkoristite vse prednosti vtičnika LiteSpeed Cache. Vtičnik deluje v povezavi z visoko odzivnim spletnim strežnikom LiteSpeed, ki ga odlikujejo hitrost, skalabilnost in varnost. In prav ta spletni strežnik pri NEOSERV uporabljamo na vseh paketih gostovanja.
Veliko informacij o uporabi WordPress vtičnika LiteSpeed Cache si lahko preberete v tem prispevku. Danes pa si bomo podrobneje ogledali eno izmed zanimivejših funkcionalnosti vtičnika – Crawler (slo. pajek, spletni pajek), ki je na ravni strežnika omogočena na vseh naših okoljih.
Kazalo
- Kaj je crawler in kako deluje?
- Kako upravljati s crawler nastavitvami?
- Koliko časa crawler pregleduje spletno stran?
Kaj je crawler in kako deluje?
Naloga spletnega pajka je, da “pleza” po spletni strani in jo pregleduje. V angleščini ta postopek imenujemo crawling. Pajek vtičnika LiteSpeed Cache potuje po zaledju spletne strani in obiskuje podstrani, ki so v predpomnilniku že potekle.
Bistvo torej je, da crawler ves čas vzdržuje v predpomnilniku shranjene aktualne verzije podstrani, obenem pa zmanjša možnost, da bi obiskovalec naletel na podstran, ki v predpomnilniku še ni shranjena.
Zakaj je to pomembno?
Najprej si poglejmo, kako deluje proces predpomnjenja brez uporabe crawlerja. Postopek se prične ob obisku spletne strani. Ko prvi obiskovalec, ki ni prijavljen v WordPress administracijo, obišče določeno podstran, zahteva uporabnika pride do zaledja spletne strani, v ozadju se izvede PHP koda in WordPress obiskovalcu prikaže podstran. Ob tem se podstran tudi shrani v predpomnilnik, kar pomeni, da bo ob naslednjem obisku naložena hitreje.
Za strežnik je to dokaj časovno zahteven proces, ki zahteva tudi precej pasovne širine (ang. bandwidth).
Kaj pa se dogaja v ozadju, ko za predpomnjenje skrbi LiteSpeedov crawler? Ko določeno podstran obišče pajek, se zahteva pošlje v zaledje strani, izvede se WordPressova PHP koda, ki generira podstran s posebnim zapisom v glavi kode. Ta spletnemu strežniku LiteSpeed sporoči, da je zahtevo sprožil pajek, zato se podstran ne naloži, vendar se le shrani v predpomnilnik.
Opisan postopek prihrani precej pasovne širine in razbremeni strežnik.
Dodatna prednost pa je tudi ta, da crawler v rednih časovnih intervalih osvežuje potekle strani, zato se možnost, da bi uporabnik naletel na stran, ki ni shranjena v predpomnilniku, bistveno zmanjša. Posledično spletna stran deluje hitreje.
Kako upravljati s crawler nastavitvami?
Če ste na spletno stran namestili vtičnik LiteSpeed Cache, ste v stranskem meniju WordPress administracije verjetno že opazili element Crawler, kjer lahko upravljate z nastavitvami spletnega pajka.
Da bo njegovo delovanje za vaše spletno mesto kar se da optimalno, si v nadaljevanju oglejte, kaj pomeni posamezna nastavitev oz. funkcija.
Zanimiva sta predvsem zavihka:
- General Settings (osnovne nastavitve)
- Sitemap Settings (nastavitve zemljevida spletnega mesta)
General Settings
Delay
Medtem ko crawler potuje po spletni strani, zaledju spletišča pošilja zahtevke – enega za drugim. Če med posameznimi zahtevki ni premora, to lahko močno obremeni strežnik. Zato obstaja nastavitev, s katero določite, kako pogosto naj LSCache pošilja zahtevke.
Privzeta vrednost znaša 500 μs (= 0,0005 s). Z vnosom višje vrednosti v polje Delay lahko zmanjšate obremenjenost strežnika, vendar morate vedeti, da bo s tem proces crawlanja trajal dlje.
Run Duration
Vtičnik omogoča tudi omejitev trajanja crawlanja. Na ta način lahko preprečite, da bi prišlo do preobremenitve strežnika, medtem ko pajek preiskuje podstrani vašega spletnega mesta.
Če denimo trajanje procesa nastavite na 60 sekund, bo pajek pregledoval spletišče 1 minuto, nato pa si bo vzel premor. Ko bo premor končan, bo nadaljeval od tam, kjer je prej zaključil, spletišče pa bo zopet pregledoval 1 minuto. Ta proces bo ponavljal, dokler ne bo pregledano celotno spletno mesto.
Interval Between Runs
V prejšnjem odstavku smo omenili premor, ki si ga vzame crawler, medtem ko pregleduje podstrani spletnega mesta. Dolžino premora torej določite s to nastavitvijo.
Privzeta vrednost vtičnika je nastavljena na 600 sekund, kar pomeni, da si pajek vsako minuto “dela” vzame 10 minut premora.
Crawl Interval
S to nastavitvijo določite, kako pogosto naj crawler prične s procesom pregledovanja spletnega mesta. Optimalna vrednost je odvisna od tega, koliko časa traja celoten postopek in kako pogosto se spreminja vsebina na vaši spletni strani.
Čas trajanja procesa, torej od začetka pregledovanja in do tega, da pajek doseže še zadnjo podstran spletnega mesta (vključno z vsemi premori), lahko ugotovite povsem preprosto. Pajka nekajkrat poženite in spremljajte, koliko časa bo potekal celoten postopek (več o tem: Koliko časa crawler pregleduje stran?).
Ko pridobite podatek, nastavite nekoliko višjo vrednost. Če bo pajek denimo potreboval 3 ure, da preveri celotno spletno mesto, lahko interval nastavite na 4 ure (14.400 sekund). V primeru, da vsebine na spletni strani ne spreminjate pogosto, pa lahko obdržite privzeto vrednost 84 ur (302.400 sekund).
Threads
Ta nastavitev pomeni, koliko sočasnih crawling procesov se odvija na spletni strani. Privzeta vrednost je nastavljena na 3, kar pomeni, da podstrani spletnega mesta pregledujejo trije pajki naenkrat.
Višja kot bo vnesena številka, hitreje se bo odvijal proces. Seveda pa z vrednostjo ne gre pretiravati, saj lahko previsoka vrednost negativno vpliva na obremenitev strežnika.
Timeout
Privzeta vrednost znaša 30 sekund, kar pomeni, da pajek za odgovor na zahtevek posamezne podstrani čaka pol minute, preden nadaljuje s pregledovanjem naslednje podstrani.
Server Load Limit
Nastavitev preprečuje, da bi pajek lahko preobremenil strežnik in s tem ogrozil njegovo delovanje. Ko doseže nastavljeno mejo, se proces pregledovanja spletnega mesta prekine.
Povprečje obremenitve pri popolnoma neaktivnem računalniku znaša 0. Vsak proces, ki uporablja CPU oziroma čaka na sredstva CPU, povprečju obremenitve doda vrednost 1.
Če povprečna obremenitev strežnika preseže vneseno vrednost, se število pajkov, ki pregledujejo spletno mesto, samodejno zniža. V primeru, da poteka le en crawling proces, pa se le-ta terminira.
Sitemap Settings
Nastavitve zemljevida spletnega mesta (ang. sitemap) boste našli v ločenem zavihku – Sitemap Settings.
Pomembno je predvsem 1. polje (Custom Sitemap) v katerega vnesete pot do XML zemljevida svojega spletišča. Zemljevid spletnega mesta crawlerju pove, katere podstrani mora obiskati.
Za generiranje zemljevida lahko uporabite namenski WordPress vtičnik, na primer XML Sitemaps ali Sitemap by BestWebSoft. Če uporabljate SEO vtičnik, pa večina tovrstnih vtičnikov že podpira generiranje zemljevida, na primer Yoast SEO in Rank Math SEO.
Koliko časa crawler pregleduje spletno stran?
Da boste lahko določili optimalen interval pregledovanja spletnega mesta, morate vedeti, koliko časa traja, da crawler pregleda vse podstrani spletišča. Pri tem si lahko pomagate z ročnim zagonom procesa pregledovanja.
Kot prikazuje zgornja slika, se v WordPress administraciji pomaknite na LiteSpeed Cache -> Crawler. V prvem zavihku (Summary) s klikom na gumb Show crawler status, ki ga najdete na dnu strani, odprite terminal, v katerem boste lahko spremljali, kako pajek “pleza” po vaši spletni strani.
Nato sprožite crawling proces s klikom na gumb [R] Manually run in v terminalu opazujte potek procesa.
Vsebina, izpisana v terminalu, bo pri vas seveda drugačna kot na naši sliki. Zato razložimo še, kaj pomenijo postavke v posamezni vrstici:
- Size: Število URL-jev na zemljevidu spletnega mesta.
- Crawler: Zaporedna številka pajka, ki trenutno pregleduje spletišče.
- Position: Zaporedna številka URL-ja, ki se pridobiva z zemljevida spletnega mesta.
- Threads: Število sočasnih procesov, ki trenutno potekajo za pridobivanje URL-jev.
- Status: Prikazuje trenuten status crawlerja.
Želite prednosti LiteSpeed Cache crawlerja izkoristiti tudi sami? Preizkusite bliskovito hitro gostovanje!
KOMENTARJI
Dodatna vprašanja?
KOMENTIRAJTE OBJAVO
Vaš komentar je bil uspešno oddan
Komentar bo viden na strani, ko ga naši moderatorji potrdijo.