Google slår tilbage mod spam
Dette er et gæsteblad af Lior Levin.
Googles øverste spamfighter, Matt Cutts, sendte for nylig en lang blogbog om tilstanden af Googles kamp med spammere.
I posten sagde Cutts, at mens spam i Googles indeks var mindre end halvdelen for 5 år siden, er spam blevet steget i Googles indeks i de seneste måneder, og for visse forespørgsler er det blevet mere mærkbart.
Ifølge Cutts er denne ændring ikke kun på grund af det faktum, at der er flere spammere end nogensinde at forsøge at snyde deres vej til en højere søgemaskine ranking, men fordi Googles seneste koffeinopdatering har søgemaskinen indeksering mere indhold end nogensinde før, herunder spam.
Men han skitserede Googles plan om at bekæmpe denne uptick og forhindre det i at blive et mere alvorligt problem. Nærmere bestemt skitserede han tre ændringer til Google, som han håber vil forbedre kvaliteten af Googles resultater og forbedre søgeoplevelsen for alle.
Den første ændring, som Google for nylig lancerede, er målrettet mod spammere selv og er en " redesignet klassifikator på dokumentniveau ", der gør et bedre job med at registrere spammy indhold på en enkelt side. Dette omfatter ting som gentagne ord i teksten samt visse former for kommentarer spam.
Den anden forbedring, som i øjeblikket vurderes, er en algoritmisk ændring rettet mod websteder, der kopierer indhold fra andre sider, normalt uden tilladelse. Disse websteder kopierer ofte store indholdsblokke med meget lidt originalt materiale, men de tæller nogle gange meget godt, herunder før de websteder, der producerede indholdet oprindeligt.
Det er dog den tredje og sidste ændring, der har skabt mest diskussion. Ifølge Cutts undersøger Google måder at yderligere reducere placeringen af såkaldte "content farms" eller websteder, der producerer store mængder indhold billigt, normalt gennem kontraktarbejde, der ofte er af tvivlsom kvalitet. Dette omfatter virksomheder som Demand Media, som driver eHow, Livestrong samt andre websteder.
Ifølge Cutts lavede Google to ændringer i 2010 for at reducere virkningen af disse indholdsbedrifter, men forstår, at folk beder om endnu stærkere handlinger, der skal tages. Webstedene har imidlertid været kontroversielle, fordi de ikke anses for at være traditionel webspam, selvom de ofte har indhold af lavere kvalitet.
Da Demand Media kun havde en børsnotering, der vurderede den til 1, 5 mia. USD, er det let at se, hvor meget værdi virksomheden har været i stand til at vokse gennem indholdet "landbrug". Det, der stadig er at se, er, hvis Google vil kunne forkæle dens udbredelse i resultaterne, især for lange hale-søgninger, den målretter mod.
Det er selvfølgelig klart, at Google, selv efter et årti i branchen, stadig kæmper med indholdskvalitetsproblemer i sit indeks og kæmper for at holde spammere, skrabere og indholdsbønder i stykker.
Selv om det helt klart har gjort fremskridt i det seneste årti, er der stadig tydeligt en stor del arbejde, der skal gøres, og Google sætter sig på at gøre det.
Alt vi kan gøre er at læne sig tilbage, se hvad der sker, og håber, at legitime websteder af høj kvalitet ikke bliver utilsigtet fanget i blandingen.