Web Scraping: 4 plugin Wordpress per prevenirlo

Sommario:

Anonim

I raschiatori sono la rovina dell'esistenza di qualsiasi blogger. Il web scraping entra, ruba i tuoi contenuti, afferma che è loro, e a volte non c'è modo di dimostrare il contrario. Sorprendentemente, Google non è stata troppo intelligente nell'identificare l'autore del contenuto originale in molti casi. Molto spesso, i miei Google Alerts mi informano dei miei articoli raschiati piuttosto che dei miei post originali (guest) e ho visto gli scrapers superare di molto gli articoli originali per ricerche long tail.

$config[code] not found

Di tanto in tanto c'è una storia di un blogger che è riuscito a ottenere i diritti sui loro contenuti - ma è più come combattere i mulini a vento. Uccidi un blog di raschiamento e dozzine di loro nascono durante la notte. Quindi è molto meglio cercare di prevenire lo scraping (o almeno ottenere l'etichetta dell'autore originale) piuttosto che fare affidamento su uno di quei rari successi.

Plugin per impedire il raschiamento del Web

1. Autorità di Google Plus

Google ha cercato di combattere i raschietti per anni e uno dei suoi brevetti (che fa parte dei brevetti AuthorRank) suggerisce di utilizzare l'authorship per:

“…detificare e proteggere contro la revisione del contenuto dopo che è stato pubblicato da una persona o entità. "

L'implementazione di Google Authorship è molto più semplice al giorno d'oggi (ecco una guida rapida), ma su molti set di blog (dove non c'è alcun autore, ad esempio), può comunque causare confusione. In questi casi, questo plugin ti aiuterà.

Ti consente di aggiungere un'immagine del profilo G + ai risultati della ricerca, confermare la paternità e persino concedere la paternità a più autori. Funziona su un sistema a tre fasi che è molto facile da seguire, e non ci sono bug di cui preoccuparsi.

2. Ritardo di alimentazione

Metà del rischio per un blog di piccole e medie dimensioni è che un bot raschietto raccolga i contenuti, li pubblichi senza attribuzione e quindi indicizzino prima la pagina (stranamente, Google non è stato in grado di escludere questi siti o persino trovare l'originale proprietario del contenuto).

Dal momento che probabilmente ci sono almeno un paio di bot nascosti nei tuoi abbonamenti RSS, la soluzione migliore è quella di ritardare il feed dal ripubblicare. Questo plugin lo farà per te.

3. Messaggio anti-scrap-raschietto

La maggior parte degli scraping viene eseguita da bot, senza alcuna supervisione effettiva da parte degli umani. Quindi non hanno alcun controllo su quale contenuto è pubblicato, o come. Questo è un grande vantaggio per te, dato che puoi aggiungere un link al tuo blog in tutti i contenuti, che verrà mostrato al momento del reposting.

Il messaggio Anti Feed-Scraper esegue questa operazione, mostrando a Google e a tutti i lettori da dove proviene il post. Mantiene inoltre qualsiasi accusa dal messaggio, quindi ti protegge dalle richieste di scandalo da parte degli scraper. Il messaggio riporta: Nome post originariamente apparso in Nome sito in Data di post.

4. Prova del copyright

Insieme a quello sopra, questo plugin può essere usato. Ti consente di certificare digitalmente la tua proprietà al momento della pubblicazione, creando un certificato che puoi mostrare in caso di furto del tuo contenuto. Ha una licenza di copyright, licenza e attribuzione in ogni post, pure. C'è una funzione aggiuntiva per l'antifurto se si sceglie di usarlo.

Conosci un buon plugin per proteggere i contenuti da Scrapers? Che dire al di fuori di WordPress?

Altro in: Content Marketing, WordPress 9 Commenti ▼