- Vaša košarica je trenutno prazna
Kaj je anti-spam filter Bayes in kako deluje?
Razlogov, zakaj nekatera e-sporočila končajo med nezaželeno e-pošto ali pa sploh niso uspešno dostavljena, je veliko. V prejšnjem blog prispevku smo razložili, zakaj je tako pomembno, da za pošiljanje e-pošte uporabljate protokol SMTP. Če želite izboljšati dostavljivost e-pošte in si omenjenega prispevka še niste prebrali, vam svetujemo, da to čim prej storite.
Uspešnost dostavljivosti e-pošte pa ni odvisna le od dejavnikov, povezanih s strežnikom in spletnimi protokoli. Večina e-poštnih storitev (npr. Gmail) za presojanje o tem, ali naj določeno e-sporočilo konča v mapi Spam ali ne, uporablja tudi tako imenovano Bayesovo točkovanje. Imenuje se po Thomasu Bayesu, angleškem matematiku, teologu in filozofu.
Bayesovo točkovanje temelji na Bayesovem algoritmu oziroma na statističnem izreku, ki napoveduje verjetnost dogodka. Algoritem se pogosto uporablja pri določanju verjetnosti, ali gre za nezaželeno ali legitimno e-poštno sporočilo. Pri tem se upošteva naslednje dele e-pošte:
- besede in besedne zveze v jedru (ang. body) sporočila,
- HTML/CSS kodo (oblikovanje e-sporočila),
- glavo sporočila (Od / Za / Zadeva),
- povezave do spletnih strani,
- drugo (npr. kje v sporočilu se pojavi določena besedna zveza).
Kako v povezavi s spam pošto deluje Bayesov izrek?
Ko govorimo o Bayesovem izreku in nezaželeni e-pošti, moramo vedeti, da princip določanja verjetnosti spam pošte temelji na samodejnem učenju. Tako ponudniki e-poštnih storitev na podlagi preteklih e-sporočil presojajo, ali naj novo sporočilo uvrstijo v mapo Prejeto ali Spam.
Predpostavimo, da ponudnik e-poštne storitve želi presoditi, kam naj uvrsti sporočilo, ki vsebuje besedo “ponaredek”. Z uporabo logičnega sklepanja bi najverjetneje rekli, da gre za nezaželeno e-pošto. Toda to ni nujno, saj bi lahko šlo za povsem verodostojno sporočilo.
Pojdimo še korak dlje. Sporočilo z besedo “ponaredek” je za nekoga lahko spam, za drugega pač ne. Ponudniki e-poštnih storitev namreč za vsak e-poštni predal posebej prilagajajo filter za prepoznavanje nezaželene e-pošte, katerega delovanje je odvisno od preteklih dognanj. Pri tem se poslužujejo naslednje formule (Bayesov izrek).
Pr(S|W) – verjetnost, da gre za spam sporočilo, če je v njem beseda “ponaredek”;
Pr(S) – verjetnost, da je katero koli sporočilo spam;
Pr(W|S) – verjetnost, da se beseda “ponaredek” pojavi v spam sporočilu;
Pr(H) – verjetnost, da katero koli sporočilo ni spam;
Pr(W|H) – verjetnost, da se beseda “ponaredek” pojavi v sporočilu, ki ni spam.
Glavna prednost filtriranja e-pošte z uporabo Bayesovega točkovanja je v tem, da algoritem upošteva vedno nove podatke. To e-poštnim sistemom omogoča, da se na podlagi aktivnosti uporabnikov, ki posamezno sporočilo lahko iz mape Spam prestavijo v Prejeto (in obratno), ves čas izpopolnjujejo. Zato obstaja vedno večja verjetnost, da bo vsak uporabnik sporočilo prejel v mapo, v katero bi ga uvrstil sam – nezaželeno sporočilo v Spam, oglasno v Promocije, legitimno pa v mapo Prejeto.
Kako izboljšati dostavljivost e-sporočil?
Primarni cilj uporabe Bayesovega algoritma je zmanjšanje t. i. lažnih pozitivnih rezultatov (ang. false positives). Če je neprijetno že prejemanje spam pošte, pa je še veliko slabše, če e-sporočilo ostane spregledano samo zato, ker je določena beseda sprožila filter. Kar predstavljajte si, da upravljate s spletno trgovino, v kateri ponujate izdelke za hujšanje, vaše stranke pa večino e-sporočil prejmejo v Spam. Zelo neprijetno, se vam ne zdi?
Kako torej doseči, da bodo e-sporočila zagotovo končala v mapi Prejeto? Upoštevajte naslednja priporočila:
1. E-pošto vedno pošiljajte prek protokola SMTP, če se le da, v kombinaciji s protokolom SSL/TLS. Na ta način bo odhodna pošta šifrirana in deležna preverjanja pristnosti. Več o tem si preberite v prispevku: Pošiljanje e-pošte: PHPMailer ali SMTP?
2. Odhodno e-pošto opremite z DMARC zapisom. V njem so določena pravila, kako naj strežniki prejemnikov e-pošte obravnavajo sporočila, ki ne prestanejo SPF in DKIM preverjanja. Vse podrobnosti in navodila za nastavitev DMARC zapisa boste našli v prispevku: Zakaj in kako nastaviti SPF, DKIM in DMARC?
3. Vsako e-sporočilo, predvsem pa e-novice (ang. newsletter), oblikujte z mislijo na Bayesov anti-spam filter:
- Izogibajte se besedam, ki jih pogosto opazite v nezaželeni e-pošti.
- Ne uporabljajte velikih tiskanih črk, še posebej ne v naslovu sporočila.
- Ne uporabljajte nestandardnih fontov in prevelikega fonta pisave.
- V e-poštna sporočila ne vključujte veliko spletnih povezav.
- Povezave v sporočilih naj vodijo le do zaupanja vrednih spletnih strani.
- Poskrbite za to, da bo HTML/CSS koda sporočil čim bolj preprosta.
- Izogibajte se uporabi posredovalnikov e-pošte, če ti niso nujni.
4. E-pošto pošiljajte postopoma. Ko boste svojim naročnikom na e-novice pošiljali sporočila, nastavite omejitev pošiljanja na 30 sporočil na uro. Prehitro poslana masovna e-pošta namreč lahko hitro privede do tega, da sporočila končajo v mapi Spam. Deljeno gostovanje je namenjeno osnovni komunikaciji z naročniki, medtem ko so za pošiljanje masovne e-pošte primernejše specializirane storitve. Tudi o tem smo na našem blogu že pisali: Učinkovita in varna izvedba e-mail marketinške kampanje.
5. E-novic ne pošiljajte na e-poštne predale z nizkim ugledom. Če je vaš seznam naročnikov na e-novice poln lažnih ali neobstoječih e-poštnih naslovov, bodo vsa vaša poslana sporočila mnogo hitreje končala med nezaželeno e-pošto. Več o omenjeni težavi in možnih rešitvah si preberite v prispevku: Preprečite zlorabo e-novic.
Upoštevajte čim več nasvetov, ki smo vam jih podali v današnji blog objavi, in lahko ste prepričani, da bodo vaša e-sporočila končala v mapi Prejeto. Več kot boste poslali legitimnih sporočil, boljše Bayes ocene boste deležni. Tako bo vaša e-pošta pri ponudnikih e-poštnih storitev deležna večjega ugleda, s tem pa tudi mnogo manjše možnosti za dostavo sporočil med nezaželeno e-pošto.
KOMENTARJI
Dodatna vprašanja?
KOMENTIRAJTE OBJAVO
Vaš komentar je bil uspešno oddan
Komentar bo viden na strani, ko ga naši moderatorji potrdijo.