Kõik kes tihedamalt minu saiti külastavad on avastanud, et kuidagi aeglaseks kipub asi jääma ja teinekord juhtub, et kogu kupatusele ei pääse üldse millegipärast ligi. Kui teiselt poolt serveri protsessori kasutust jälgida, on näha kuidas apache ja mysqld taskid õndsate nägudega midagi internetti topivad. Täna siis Andreiga vaatasime asja üle ning tulemuseks on see, et kurja juur on tõenäoliselt leitud.
Tuleb välja, et eksisteerivad nn referentsispämmerid. Need on tegelased, kes kävitavad selliseid programme, mis künnavad su internetilehe läbi ja kuivähegi saab postitavad igale poole mingit kõntsa (viagra, casino, poker, jne). Ilmselt olete kõik seda näinud. Lisaks püüavad nad endast maha jätta nn refereerimisjälge, puhuks kui süsteemis on mingi asi, mis näitab kust lehel külaline sabunud on.
Kuidas see kõik praktikas välja näeb. Ütleme nii, et minu blogis on hetkel umbes 700 kannet, mis laias laastus tähendab 700-t lehte. Kujutage nüüd ette, kus robot peaaegu korraga neid kõiki külastama asub? Apache-l, MySQL-l ja PHP-l on tegemist korraga umbes sama palju, kui 700 samaaegse külastajaga. Ja oleks, et need süsteemid kuidagi viisakalt järjest neid läbi künnaks .. sittagi! Teine asi on see, et iga sisestatud kommentaar pikendab lehte ja teeb andmebaasi ühe rea juurde. Et seda baasi kirjutada ja seda seal lugeda peab PHP rohkem tööd tegema. Nüüd kujutage ette kui te avastate ühes mu saidis olevas dormantses blogis umbes 5500 kannet, mis on kõige puhtam spämm. Iga kord kui keegi seda vaatab tähendab see lisakoormust masinale ja noh, kes on kõige kõvem selle lehe vaataja? Õige! Seesama spämmirobot.
Selle spämmi mõte on kahekihiline oma olemuselt — esiteks meelitada inimesi sinna lehele ja teiseks saada googlest (ja teistest otsingumootoritest) võimalikult palju viiteid sihtlehele. See loomulikult tõstab selle saidi positsiooni otsingutulemuste hulgas selle konkreetse võtmesõna alt. Äge olge spämmi suhtes tolerantne … mida rohkem võimalusi kuhugi viidata avaneb, seda atraktiivsem selline spämmimine on. Spämmarid ahju!
PS. Apachel on selline asi olemas nagu spamcontrol. Kui keegi on sarnase murega kokku puutunud, siis visake sellele asjale pilk peale. Hetkel on juba terve müriaad viagrapakkumisi lehe kuvamise asemel vastu näppe saanud (oma olemuselt on tegu filtriga, mis saadab pahategija kukemuhvi enne kui ta jõuab Apache, MySQL ja PHP jaoks päringu tekitada). Jee!
Mul kolhoos.ee’ga juba pikemat aega sama häda, vahepeal oli umbes pool traffikust refspam (kuna sama IP peal tuhatkond saiti, siis vanad ikka mässasid eluga).
Ma panin targutajale commentcontroli ja Spam filtri peale nüüd on elu nagu parem aga trackbackidele filtrit panna ei saanud ja neid tekkis ikka jubedalt iga päev lõpuks panin trackpackid ajutiselt kinni. vahepeal oli ca 1/3 liiklust spämm
Nagu ma ütlesin, apache spamcontrol saadab mul tõhusa enamuse asjadest ukselt tagasi. Enamustel pasakottidel on reference aadress küljes, ja 99% on midagi viagra, pokeri, casino, pills või mida iganes keywordiga asi URL-is sees. Kui tahad võin sulle vastava faili saata.
Commentcontrol ja Spam filtrid ei lahenda seda probleemi, et selver läheb aeglaseks nagu kurvis pidurdav tigu. See kuradi robot kondab ikka kõik lehed ilge kiirusega läbi ja tihtipeale mitte üks robot vaid mitu-mitu tükki. Kui sul erikuradi jäme raud on, siis pole see probleem, aga muidu kipub see samaoodi välja nägema nagu mitmende tuhandete kasutajate samaaegne liinil olek. Sellejaoks ongi vaja seda spamcontroli nimelist asja apche serveri juures, mis saadab päringud juba kohe ukselt tagasi ilma päringut täitmata.