Tags Posts tagged with "Conteúdo Duplicado"

Conteúdo Duplicado

Eu acho bem legal a forma que o mundo acompanha as mudanças de algoritmo na engine de busca do Google. Me lembra a final do Super Bowl ou da novela das 9. Começa a pipocar pessoas falando sobre o assunto em blogs, posts em Facebook, podcastsvideocasts, na fila do pão e no meio da rua com cartazes anunciando o fim dos tempos.

Desde 2012 o Google roda de tempos em tempos um algoritmo conhecido como Panda Update, que tem a missão de varrer resultados de busca e melhorar ou remover a importância que o Google dá às páginas baseado na qualidade do conteúdo.

Logo, o Google começou a dar mais autoridade para sites com bom conteúdo e ao mesmo tempo mandar pro saco (baixando relevância ou banindo) sites com conteúdo ruim, o que deixou bastante gente chateada.

hit-by-panda1

Por mais cruel que pareça, o motivo para isso é bem justo: o Google quer dar a você – e às pessoas que visitam seu site/e-commerce – o melhor conteúdo possível.

Como criar o melhor conteúdo possível

Há vários fatores usados para remover a relevância de alguém, mas o pior de todos para quem tem e-commerce são os conteúdos duplicados.

Entendendo melhor

Convenhamos, não seria nada legal você procurar por avaliações sobre aquela Smart TV LG 42″ que você quer dar para sua sogra e todos os resultados do Google, apesar de serem sites diferentes, trazerem o mesmo conteúdo copiado e colado.

“Mas eu não tenho intenção de copiar conteúdo de ninguém, vou criar meu próprio. Vou parar de ler este post.”

Calma lá!

Conteúdo duplicado não é uma prática exclusiva de malfeitores que têm preguiça de escrever seu próprio texto. Você pode ter conteúdo duplicado e nem sabe.

Vou explicar os tipos mais comuns e como resolvê-los.

Cadastro de produtos com variação

Se você tem produtos muito parecidos com uma mínima variação, é provável que a descrição deles sejam iguais.

Captura-de-Tela-2015-09-10-às-12.55.20

Na imagem acima eu mostro o mesmo exemplo que usei neste texto sobre cadastro de produtos.

Preste atenção como se tratam do mesmo produto, com as mesmas características e qualidades, com uma única variação: o peso (poderia ser o sabor também).

A descrição, tabela nutricional, modo de preparo, recomendações de uso, tudo é igual!

Conteúdo Duplicado DETECTED.

Para resolver isso só recadastrando o produto em forma de grade – ou Produto Configurável, ou qualquer outro nome que sua plataforma dê a esse tipo de cadastro. Olha como foi feito em outra loja.

Captura-de-Tela-2015-09-10-às-13.07.53

Múltiplos domínios

Logo quando abrimos a Bleez compramos vários domínios para garantir que o cliente nos encontre independente do domínio que talvez – por motivos ocultos – ele possa imaginar e digitar no navegador sem ir ao Google.

Por causa disso bleez.com.br e agenciableez.com.br existem.

O vacilo que não cometemos (ufa), mas muita gente comete, é de deixar todos os domínios “navegáveis” quando o correto seria escolher um domínio para ser o principal e mandar os demais redirecionarem para ele. No nosso caso agenciableez.com.br redireciona para bleez.com.br.

Um detalhe técnico importante: o redirecionamento deve ser do tipo 301.

www e sem www

Um dos casos mais comuns. Ele é bem parecido com o problema anterior, basicamente teriamos bleez.com.br e www.bleez.com.br. Se ambos forem “navegáveis” teremos os mesmos problemas já discutidos.

Redirecionamento 301 neles!

URL’s diferentes apontando para o mesmo produto

Isso acontece quando temos várias URL’s que apontam para o mesmo produto, por exemplo:

http://adegafree.com/vinho-carmin-de-peumo-carmenere-2009-750ml.html

http://adegafree.com/vinhos/vinho-carmin-de-peumo-carmenere-2009-750ml.html

Aqui no blog tem um post falando sobre URL’s amigáveis e a tags canonical, que é a solução para esse problema.

Por mais fácil que seja de resolver, você precisará contar com o suporte da sua plataforma.

Resultados de busca

Os resultados da busca interna da sua loja (que podem ser indexados) também são considerados como conteúdo duplicado, pois eles estão trazendo os mesmos textos com poucas variações dependendo do filtro utilizado.

Também é comum nas pesquisas que não retornam nada aparecer um texto padrão informando que não houve nenhum resultado. Se várias pessoas começarem a criar links para uma busca no seu site, que um dia trouxe resultados e hoje não traz mais, você terá mais um monte de conteúdo duplicado.

Para não ter problemas, você deve adicionar a tag noindex nas páginas de resultados. Assim o Google pode até ler a página, mas não indexará e nem irá usá-la como fator de relevância.

Meta tags

Captura-de-Tela-2015-09-14-às-13.52.40

Os Rich Snippets são os textos que aparecem nos resultados do Google. Eles são lidos pelo buscador através de duas meta tags chamadas title e description.

Pode ocorrer momentos que essas tags informam ao Google as mesmas informações, por exemplo em uma categoria onde há paginação. Se no title e na description não houver a informação de qual página o usuário está, as meta tags serão exatamente iguais nas páginas 1, 2, 3, etc. O mesmo vale para as ordenações (por preço, por ordem alfabética, por relevância, etc).

Isso é duplamente ruim, pois além de ser considerado conteúdo duplicado as páginas competem entre si pela atenção do Google.

Conclusão

Talvez eu esteja falando grego para você, mas eu tenho certeza que seu desenvolvedor vai entender o que deve ser feito. Dê importância a esses pontos e não se esqueça da fúria do Panda.

panda

Publiquei este texto anteriormente no Blog da Bleez.

Mais sobre conteúdo duplicado:

3 Mitos sobre Conteúdo Duplicado

Eu faço. Sempre defendi e continuarei defendendo em minhas aulas de Marketing de Conteúdo a Curadoria de Conteúdo. Caso você nunca tenha ouvido falar, o termo vem da Arte. O Curador (no caso da Arte) é o profissional responsável pela “concepção, montagem e supervisão de uma exposição de arte”. Aqui a ideia é fazer o mesmo com Conteúdo.

Visto que já derrubamos osmitos do conteúdo duplicado, eu só consigo apontar vantagens na prática desde que ela faça parte da sua estratégia de Marketing de Conteúdo (e não seja a base dela, ter conteúdo original é muito importante). Conteúdo relevante e de qualidade para o seu nicho de mercado pode vir de qualquer lugar, desde um blog pequeno de nicho até um grande jornal de massa, qualquer um pode contribuir.

E por mais que você tenha uma excelente equipe de conteúdo, este conteúdo gerado por outros veículos não deve ser ignorado. De que vantagens eu estou falando?

Você ganha em “boa vizinhança”, amplia o alcance de sites que você considera de qualidade, seus leitores não necessariamente são deles e os deles não necessariamente são os seus. Lembre-se, existe espaço para todos, se você é bom, seus seguidores continuarão com você sempre.

 Tenha em mente que estes sites também podem posteriormente compartilhar seu conteúdo e ampliar seu alcance aos seguidores deles. Não seja possessivo. São links que podem ser úteis para sua relevância de SEO também. Todos ganham. Porém, não faça esperando esta troca. Não se dá um presente apenas porque você espera ganhar outro em troca, ou pelo menos não deveria ser assim.

Você mostra aos seus seguidores que está realmente em busca do que considera a melhor informação para eles. Não podemos ter a arrogância de acreditar que apenas nós desenvolvemos conteúdo de qualidade.

Você dificilmente terá um especialista ou alguém que tenha conhecimento suficiente em todos os assuntos que podem interessar seus seguidores. E mesmo que tenha, outros pontos de vista são importantes.

A prática de curadoria hoje é comum para quem desenvolve conteúdo para a internet, dificilmente alguém vai ficar bravo com você se fizer da maneira correta. Mas sempre… SEMPRE dê o crédito ao autor. Mostre de maneira bem clara quem é o autor da publicação, e inclua um link direto ao post original (nada de mandar para a home do site, seu malandrão!).

Acho que a melhor maneira de enriquecer um tema como este é compartilhar algo que agregue. E o texto do Enrico Cardoso para o The Growth Hacker foi um excelente exemplo que encontrei em meus sites preferidos. Note no link da publicação original, que é um artigo traduzido e adaptado do MarketingProfs.com, outra prática que pode ser valiosa para sua estratégia de conteúdo. Leia o texto na íntegra abaixo:

Por que a curadoria é importante para o conteúdo?

Recentemente, o New York Times anunciou que estava acrescentando curadoria de conteúdo em sua página principal.

Segundo eles, o objetivo da curadoria era dar aos leitores uma razão para navegarem pela sua página mais vezes, e passar mais tempo online.

A curadoria é um passo progressivo para uma editoria tradicional, mas não se trata de um caso isolado. Com o lançamento do FirstFT, o Financial Times também está fazendo seu próprio movimento em direção à curadoria de conteúdo.

A ideia do Financial Times é atuar como um juiz neutro e oferecer as grandes histórias do dia, independente de onde elas estejam vindo. Eles sabem que ninguém tem o monopólio da informação.

Abraçar a curadoria sinaliza uma mudança sísmica nas expectativas dos consumidores de informações. Estamos em uma nova era da informação, onde o público experiente está buscando contexto juntamente com o conteúdo.

Eles querem mais do que uma história, eles querem entender as várias maneiras em que essa história está sendo contada.

Isso significa que mesmo a cobertura editorial mais exemplar só se torna completa quando se está embalada com uma perspectiva adicional.

Ainda assim, existem as empresas com uma reação instintiva para a curadoria de conteúdo que dizem que isso não oferece o mesmo valor do conteúdo.

Produtores e editores de conteúdo, sejam os tradicionais, digitais, ou as muitas marcas que estão aproveitando os benefícios do marketing de conteúdo precisam entender que hoje, a curadoria traz um enorme valor para o crescimento de um negócio.

Curadoria é liderança de pensamento

Um equívoco comum é pensar que a liderança de pensamento é exclusivamente do domínio do conteúdo original.

Como o New York Times e o movimento FirstFT ressaltaram, o processo de contratação de uma perícia para identificar as melhores e mais significativas seleções de informação é uma inegável demonstração de especialização.

E essa oportunidade é executada em todo o espectro de conteúdo. A curadoria oferece a oportunidade não apenas de participar da conversa, mas de moldá-la.

A curadoria é um serviço

Com tantas editoras tradicionais e digitais, um número perpetuamente crescente de canais de distribuição, e tantos escritores especializados, esse é um momento incrível para o conteúdo.

O lado negro desta era é que os consumidores tem plena consciência do que escolher para compartilhar como algo útil ou valioso, e que por isso, vale a pena compartilhar.

Mas isso vale a pena quando sua curadoria se torna um serviço voltado a sua audiência.

A curadoria é eficiência

Pergunte a qualquer um que esteja lutando para estabelecer um relacionamento eficaz com seu público e a pessoa vai dizer que esse é um processo constante.

Vivemos em um ciclo de conteúdo constante, graças, em grande parte, à mídia social e o trabalho de editores e profissionais que não permitem que o conteúdo fique em silêncio.

A curadoria de conteúdo faz com que seja possível sustentar uma cadência mais eficaz, sem que o custo elevado da criação de conteúdos inéditos.

A curadoria é imperativa

Mas apesar de todo o seu valor, talvez o fator mais motriz por trás da curadoria é que a vida e alcance do conteúdo prospera nela.

Nos velhos tempos, o conteúdo era como a maçã que não caiu longe de sua árvore. Mas hoje, o conteúdo opera de forma muito diferente. Ele acontece em torno da internet, a partir das mídias sociais, pelos e-mails e por todos os lados.

Para participar dessa dinâmica e garantir o sucesso do seu próprio conteúdo, editores de marketing necessitam igualmente fazer da curadoria uma operação. Eles precisam garantir que o conteúdo de terceiros seja sempre útil para os consumidores e para o negócio.

As palavras “conteúdo duplicado” normalmente causam calafrios quando pronunciadas na internet. ‘Nunca fale CONTEÚDO DUPLICADO em voz alta‘. Pessoas sem experiência em SEO usam elas o tempo todo. A grande maioria nunca parou para ler simples e claras orientações do próprio Google sobre conteúdo duplicado. Assume-se apenas que, se de alguma forma algo aparecer mais de uma vez, asteróides e gafanhotos virão decretar uma maldição eterna ao seu site.

Diante disso, é bem saudável tentar derrubar alguns mitos que correm no boca a boca de quem trabalha com conteúdo. Vamos à eles:

Mito 1#: Conteúdo não-original vai comprometer o rankeamento de todas as páginas do seu domínio

Alguém conhece alguma evidência de que conteúdo não-original atrapalha a classificação de um site, com exceção de casos extremos? Eis o que acontece:

Um novo site entrou no ar, uma preguiçosa empresa de relações públicas copiou o texto da home page e colou em um comunicado de imprensa. Eles enviam para inúmeros veículos de notícias, criando imediatamente centenas de versões de conteúdos idênticos ao da home page por toda a internet. Alarmes ensurdecedores disparam pelo Google e seu domínio entra manualmente em uma Lista Negra.

Coisa feia. Uma vez que você participa do projeto, tem responsabilidade se isso acontece. Ainda é possível entrar com um pedido de reconsideração e o domínio pode ser re-indexado. Porém, você não vai querer ter este tipo de emoção e incerteza.

Então, qual foi mesmo o problema?

• Volume: Haviam centenas de instâncias do mesmo texto.
• Tempo: Todo o conteúdo apareceu ao mesmo tempo.
• Contexto: Foi a cópia página inicial em um novo domínio.

Não é nada difícil imaginar como isso acabou marcado como SPAM, certo?

Porém, não é exatamente disto que as pessoas estão falando quando sussurram “CONTEÚDO DUPLICADO“. Eles normalmente estão falando sobre alguns parágrafos de um texto simples em um site bem estabelecido. É preciso de bem mais do que isso para fazer os alarmes altos do Google entrarem em alerta.

Muitos sites e blog bastante populares na internet, incluindo este que você lê, muitas vezes repassam artigos que apareceram pela primeira vez em outros lugares. É o que chamamos nas aulas de Marketing de Conteúdo, de Curadoria de Conteúdo. Você mostra o conteúdo que você sabe que é relevante para seu público, mesmo sem tê-lo desenvolvido, amplia o alcance do conteúdo original e direciona para quem escreveu.

Não se espera que este conteúdo seja bem ranqueado, ele normalmente serve como alimento diário aos seus seguidores. O mais importante é que isto, apesar de ser menos relevante do que um conteúdo original, não vai prejudicar a credibilidade do seu domínio.

Mito 2#: Web Scrapers ferirão seu site

Um conteudista que ler atentamente o Google Webmasters Tools, certamente terá medo de robôs Scrapers (que varrem o site e clonam todo o conteúdo) e apontam o link para você em busca de relevância. Na sua reputação, estas páginas de entrada contam, e caso este site que aponta para o seu viole diretrizes do Google, pode jogar seu site para baixo. Para isso é indicado a leitura deste texto sobre conteúdo duplicado, ou este a seguir, sobre como rejeitar links.

Imagine um grande Blog com centenas de milhares de acessos diários. Agora imagine o número de trackbacks recebidos até a hora do almoço de um dia comum. E depois de um final de semana! Você realmente acredita que existe uma equipe focada tempo integral em rejeitar todas estas ligações ao longo do dia? Não. Eles não ligam! E dormem tranquilamente à noite sem temer o conteúdo duplicado.

O web scraping não vai te ajudar, mas também não deve te prejudicar. Eles simplesmente serão menos relevantes do que você. Pessoalmente não me preocuparia com esse tipo de “raspagem”. Eles copiarão normalmente todos os links internos, e ocasionalmente você terá até mesmo mais visitas. Como disse anteriormente, seu alcance também cresce em uma Curadoria.

Dica: Denúncia de Scrapers

Na raríssima possibilidade de o Google confundir a versão copiada e esta superar a versão original, existe salvação. Aqui você pode contar tudo para sua mãe  reportar o equívoco ao Google. Use o Scraper Report.

https://docs.google.com/forms/d/1Pw1KVOVRyr4a7ezj_6SHghnX1Y6bp1SOVmy60QjkF0Y/viewform

Dica: Assine seu conteúdo digitalmente com o Google Autoria (Authorship)

Fazer sua foto aparecer nos resultados de busca não é a única razão para usar o Google Autorship, e se fosse o seu único motivo, seria tarde demais. O Google Authorship é a melhor maneira de provar que você é o autor do conteúdo.

Com isso, cada parte do conteúdo estará ligada somente com UM autor, sem importar quantas vezes aquele conteúdo foi replicado.

Dica: Como agir contra plágio na internet

Existe um abismo de diferença entre conteúdo ‘raspado’ (ou Curado) e violação de Direitos Autorais. Em algumas ocasiões empresas copiam seu conteúdo (quem sabe o site todo) e dizem ser autores.

Plágio é o ato de assinar alguma obra intelectual que contenha algo desenvolvido por outras pessoas. E não é isso que o Scrapers fazem. O plágio é ilegal e é exatamente contra ele que você tem o Copyright em seu rodapé. Se isso acontecer, nem adianta procurar o Google, é melhor acionar seus advogados.

Para lidar com isso, ouça este podcast da Agência Mestre: Plágio na internet: Casos e como combater.

Mito 3#: Republicar seus textos para outros blogs no seu blog penalizarão seu site

Você escreve para diversos sites. É improvável que seu público habitual veja todos os seus textos, por isso é bastante tentador republicá-los em seu próprio site. Caso você tenha como estratégia um site ou blog com conteúdo estritamente original, faça isso pela intenção de agregar valor, não por medo de uma sanção que provavelmente não existirá.

Lembra daquele grande Blog com milhares de acessos? Existe uma boa chance dele te incentivar a republicar seu texto no próprio site algumas semanas depois. Eles têm consciência de que o Google não vai se confundir. É simples, eles apenas pedirão para inserir uma simples tag em HTML no post…

Dica: Use Canonical Tag

A Canonical realmente pode resolver todos os problemas. Se você quer publicar um artigo que saiu anteriormente em outro lugar, basta usar esta linha de código para dizer ao robô do buscados que foi publicada uma versão original àquele texto em outro lugar. Mais uma que o Google Webmasters Tools ensina. Veja um exemplo:

É isso aí! Basta adicionar a tag e republicar sem medo.

Dica: Escreva o “Evil Twin”

Se no texto original era “Como fazer” (How To) olhe pelo espelho e escreva “Como não fazer“. Baseie-se no mesmo conceito e pesquise, mas use diferentes exemplos e agregue valor. Seu texto “Evil Twin” (irmão gêmeo do mal) será semelhante, mas ninguém poderá dizer que não é original.

3 Mitos sobre Conteúdo Duplicado.

Você não vai só evitar uma penalidade, mas pode obter benefícios de SEO. Ambos os textos aparecerão bem ranqueados. Não só você vai evitar uma penalidade, mas você pode obter um benefício SEO.Ambas as mensagens classificar na primeira página de “navegação do site.”

Acalme-se, sem pânico!

Sem exageros, nem pânico desnecessário. Respire fundo e considere:

“Googlebot visita a maioria dos site diariamente. Se ele encontrar uma versão chupinhada de alguma coisa uma semana depois em outro site, ele saberá onde a original apareceu. O Googlebot não vai sentir raiva e te penalizar. Ele simplesmente seguirá em frente. Isto é muito bonito e uma coisa que você precisa saber.”

Lembre-se, o Google tem 2 mil doutores de matemática na equipe. Eles constroem carros que dirigem sozinhos e óculos computadorizados. Eles são muito, muito bons. Você acha que eles vão banir um domínio porque encontraram uma página de texto banal?

Uma enorme porcentagem da internet é conteúdo duplicado. O Google sabe disso. Eles estão separando os originais de cópias desde 1997, muito antes do termo “conteúdo duplicado” tornar-se um chavão em 2005.

3 Mitos sobre Conteúdo Duplicado.
Relatório de interesse ao longo do tempo por “conteúdo duplicado”.

Discorda? Tem qualquer evidência conflitante?

Quando falamos em SEO e principalmente sobre conteúdo duplicado é importante procurar por evidências. Eventualmente se encontra alguém que fez. Andy Crestodina, autor da versão original em inglês deste texto para o blog da Kissmetrics contou este caso: Como experiência foi construído um site com mensagens republicadas por toda parte, literalmente e gradualmente alguns deles começaram a ser indexados. Até que veio nosso amigo Panda e derrubou.

Seria uma penalidade? Ou apenas alguns pontinhos negativos na relevância? Existe diferenças entre uma penalidade (como a temida Lista Negra já mencionada) e uma correção para restaurar a ordem correta das coisas.

Se você tem exemplos reais sobre penalidades relacionadas a conteúdo duplicado, gostaríamos de ouvir. Comente!

Texto traduzido e adaptado do Blog da Kissmetrics.