Tags Posts tagged with "busca"

busca

O Google está usando uma tecnologia de aprendizagem de máquinas chamada RankBrain para ajudar a entregar os resultados das suas pesquisas

Surgiram notícias ontem de que o Google estava usando um sistema de inteligência artificial de aprendizagem da máquina chamado “RankBrain”, que o ajuda a classificar os resultados das suas pesquisas. Quer saber como isto funciona e como ele se encaixa no principal sistema de classificação do Google? Aqui está o que sabemos até o momento sobre o RankBrain.

As informações abordadas abaixo vêm de três fontes. A primeira fonte vem da Bloomberg story, que deu em outubro a notícia sobre o RankBrain. A segunda fonte são as informações adicionais que o Google forneceu diretamente ao Search Engine Land. A terceira fonte é do nosso próprio conhecimento e das melhores hipóteses de onde o Google não está fornecendo as respostas. Quando for necessário deixaremos claro onde cada uma destas fontes são utilizadas, além das informações genéricas.

O que é o RankBrain?

O RankBrain é o nome dado pelo Google para um sistema de inteligência artificial de aprendizagem da máquina, o qual é usado para ajudar a processar os resultados das suas pesquisas, como reportado pela Bloomberg e também confirmado pelo Google.

O que é uma Máquina que Aprende?

Uma Máquina que Aprende (Machine Learning) é identificada quando o computador ensina a si mesmo como fazer alguma coisa, em vez de ser instruído por humanos ou por programação detalhada.

O que é Inteligência Artificial?

A verdadeira Inteligência Artificial, ou IA, está onde o computador pode ser tão inteligente como os humanos são, pelo menos no senso de adquirir conhecimento por aprendizagem e por desenvolver o que já conhece, além de fazer novas conexões.

É claro que a verdadeira inteligência artificial existe apenas na ficção científica. Na prática a IA é utilizada para se referir a sistemas de computador que são desenhados para aprender e fazer conexões.

Qual a diferença entre a IA e a Máquina que Aprende? Nos termos do RankBrain, nos parece que são praticamente sinônimos. Você pode ouvir que ambos são usados sem distinção, ou você pode ouvir que a máquina que aprende é usada para descrever um tipo de método empregado pela inteligência artificial.

Então o RankBrain é a nova maneira do Google classificar os resultados das pesquisas?

Não. O RankBrain é parte do principal algoritmo de pesquisa do Google, um programa de computador que é usado para classificar as bilhões de páginas que ele conhece e de encontrar aquelas consideradas mais relevantes para pesquisas específicas.

Qual é o nome do algoritmo de pesquisa do Google?

faq2

Ele é chamado de Hummingbird, como reportado no passado. Por anos, este principal algoritmo não tinha um nome formal. Mas em meados de 2013 o Google reformulou aquele principal algoritmo e lhe atribuiu um nome, Hummingbird.

Então o RankBrain é parte do Hummingbird, o algoritmo de pesquisas do Google?

Este é o entendimento. O Hummingbird é o principal algoritmo de pesquisa, assim como um carro tem uma mecânica geral. A mecânica em si pode ser composta por várias partes, como o filtro do óleo, a bomba de gasolina, o radiador e por aí vai. Da mesma forma, o Hummingbird engloba várias partes, com o RankBrain sendo uma das suas mais recentes.

Nós sabemos em particular que o RankBrain é parte do algoritmo Hummingbird, porque o artigo da Bloomberg deixa claro que o RankBrain não supre todas as pesquisas, como apenas o algoritmo principal faria.

O Hummingbird também contém outras partes com nomes familiares àqueles da área do SEO, como o Panda, o Penguin e o Payday, que foram desenhados para lutarem contra spams; o Pigeon, que foi desenhado para melhorar as pesquisas locais; o Top Heavy, que foi desenhado para rebaixar as páginas com anúncios pesados; o Mobile Friendly, que foi desenhado para recompensar páginas amigáveis a mobile; e o Pirate, que foi desenhado para combater infrações contra direitos autorais.

Eu pensava que o algoritmo do Google se chamava “PageRank”

O PageRank é mais uma parte do algoritmo Hummingbird, o qual abrange um meio específico de atribuir créditos às páginas baseado nos apontamentos de links que outras páginas fazem a elas.

O PageRank é especial porque é o primeiro nome que o Google deu para uma das partes do seu algoritmo de classificação, de volta ao momento em que o mecanismo de pesquisa começou, em 1998.

E sobre estes ‘’sinais’’ que o Google usa para classificar?

Os sinais são as coisas que o Google usa para ajudar a determinar como classificar as páginas da Web. Por exemplo, ele lerá as palavras em uma página Web, então as palavras são um sinal. Se algumas palavras estiverem em negrito, isto pode ser outro sinal a ser notado. Os cálculos usados como parte do PageRank dão à página um ponto do PageRank que são usados como um sinal. Se uma página é notada como sendo amigável à mobiles, este é um outro sinal a ser registrado.

Todos esses sinais são processados por várias partes dentro do algoritmo Hummingbird para descobrir em análise quais as páginas que o Google mostra em resposta às várias pesquisas.

Quantos sinais existem?

O Google tem constantemente falado em possuir e avaliar mais de “200 sinais majoritários de classificação”, e que, por sua vez, podem ter até 10000 variações ou sub-sinais. É mais comum apenas dizer ‘’centenas’’ de fatores, como foi dito ontem no artigo da Bloomberg.

Se você quer um guia mais visual das classificações dos sinais, veja a Tabela Periódica dos Fatores de Sucesso do SEO:

faq3
Clique para ver ampliada. A Tabela Periódica dos Fatores de Sucesso do SEO. Conteúdo da Search Engine Land e Design da Column Five.

É um guia muito bom para os pontos gerais que os mecanismos de pesquisas como o Google usam para ajudar a classificar as páginas Web.

E o RankBrain é o terceiro sinal mais importante?

Isso mesmo. Do nada, este novo sistema se tornou o que o Google diz ser o terceiro fator mais importante para a classificação das páginas da Web. Do artigo da Bloomberg:

“O RankBrain é uma das “centenas” de sinais que entram em um algoritmo que determina quais resultados aparecerão nas pesquisas das páginas do Google e onde elas serão classificadas, diz Corrado. Isto foi implementado a poucos meses e o RankBrain se tornou o terceiro sinal mais importante, contribuindo para o resultado de uma pesquisa específica, diz ele.”

Quais são o Primeiro e o Segundo sinais mais importantes?

O Google não nos dirá quais são eles. E O Search Engine Land diz ter perguntado duas vezes.

O Google não explicará os dois mais importantes, o que é chato e sem dúvida um pouco ilusório. O artigo da Bloomberg não foi acidente. O Google quer uma certa fofoca sobre o que considera ser o seu avanço da máquina que aprende.

Mas para realmente estimar o seu avanço, seria útil conhecer os outros fatores mais importantes que o Google usa atualmente, assim como foi feito na sequência pelo RankBrain. É por isso que o Google deveria explicá-los.

A propósito, a opinião do Search Engine Land é que os links continuam sendo o sinal de maior importância; é a maneira encontrada pelo Google para contar os links na forma de votos. Isto também é um sistema terrivelmente velho, como foi defendido no artigo anterior do autor: Links: A ultrapassada  “urna de votos” usada pelo Google & Bing

Para o segundo sinal mais importante acredita-se que poderiam ser as “palavras”, onde elas abrangeriam tudo, desde as palavras na página, à como o Google as interpretaria quando as pessoas as introduzissem na caixa de pesquisa que excede o âmbito da análise do RankBrain.

O que exatamente o RankBrain faz?

Trocando e-mails com o Google, o Search Engine Land concluiu que o RankBrain é usado principalmente como uma maneira de interpretar as pesquisas que as pessoas enviam para encontrar páginas que podem não conter as mesmas palavras que foram pesquisadas.

O Google já não tinha maneiras de encontrar páginas além da pesquisa exata?

Sim, há muito que uma pesquisa no Google recupera páginas que excedem o âmbito dos termos usados. Por exemplo, a muitos e muitos anos atrás, se você pesquisasse algo como “sapato”, o Google não poderia encontrar páginas que dissessem “sapatos”, porque tecnicamente elas são duas palavras diferentes. Mas a “decorrência” permitiu que o Google ficasse mais inteligente, entendendo que sapatos é uma variação de sapato, assim como “correndo” é uma variação de “correr”.

O Google também adquiriu sinônimos mais inteligentes, se você procurasse por “tênis”, ele pode entender que você quis dizer “tênis de corrida”. Ele ainda adquiriu alguns conceitos, tal qual para entender que existem páginas sobre a companhia tecnológica “Apple” e sobre a fruta “apple”.

E sobre o Gráfico do Conhecimento?

O Gráfico do Conhecimento, lançado em 2012, foi uma maneira do Google crescer e ficar ainda mais inteligente em relação as conexões entre as palavras. Mais importante é que ele aprendeu a como procurar pelo “o que é pedido e não por sequências de letras”, como o Google descreveu.

Sequências de letras” significa simplesmente procurar por sequências de letras, assim como as páginas que correspondem a ortografia de “Obama”. Já “o que é pedido” quer dizer que o Google entende que quando alguém procura por “Obama” está provavelmente se referindo ao Barack Obama, presidente dos EUA, uma pessoa real que tem conexões com outras pessoas, lugares e pertences.

O Gráfico do Conhecimento é um banco de dados dos fatos sobre “o que é pedido” no mundo e em como elas se relacionam entre si. É por isso que você pode pesquisar “quando foi que a esposa do Obama nasceu” e receber a respostas sobre a Michele Obama como abaixo, sem ao menos usar o nome dela:

faq4

Como o RankBrain ajuda a refinar as pesquisas?

Os métodos que o Google já usa para refinar as pesquisas genéricas são o retorno de algum ser humano fazendo o seu trabalho em algum lugar, mesmo tendo criado listas de decorrências ou listas de sinônimos ou um banco de dados de conexões entre o que é pedido. Claro que tem uma certa automação envolvida. Mas no todo isso depende do trabalho humano.

O problema é que o Google processa três bilhões de pesquisas por dia. Em 2007, o Google disse que as pesquisas que nunca foram vistas estavam entre 20% e 25%. Em 2013, este número abaixou para 15%, o qual foi usado novamente em outubro no artigo da Bloomberg e que o Google confirmou em seguida. Mas ainda sim, 15% de três bilhões é um número gigantesco de pesquisas, o qual nunca antes foram pesquisadas por nenhum pesquisador humano – 450 milhões por dia.

Entre elas podem haver as complexas: pesquisas de palavras múltiplas, também chamadas pesquisas de “cauda longa”. O RankBrain foi desenhado para ajudar a melhorar a interpretação dessas pesquisas e traduzi-las de forma eficaz. Na prática, é uma maneira de encontrar as melhores páginas para o pesquisador.

O Google nos disse que pode ver padrões entre pesquisas complexas e aparentemente sem ligações, para entender como elas são similares umas às outras. Este aprendizado permite um melhor entendimento futuro das pesquisas complexas e se elas estão relacionadas a tópicos particulares. Do que o Google nos disse, o mais importante é que isso pode ser associado a esses grupos de pesquisas com os resultados que ele acredita serem os que os pesquisadores mais gostarão.

O Google não forneceu nem exemplos de grupos de pesquisas e nem detalhes de como o RankBrain adivinha quais são as melhores páginas. Mas o mais recente é que ele provavelmente pode traduzir uma pesquisa ambígua em algo mais específico, trazendo melhores resultados.

Que tal um exemplo?

Embora o Google não tenha fornecido os grupos das pesquisas, o artigo da Bloomberg tinha um exemplo simples de uma pesquisa que o RankBrain estava supostamente ajudando. Aqui está:

Qual o nome do consumidor de maior nível da cadeia alimentar

Para um leigo, como eu, “consumidor” soa como uma referência de alguém que compra algo. Contudo, ele também é um termo científico para algo que consome comida. Também existem níveis de consumidores na cadeia alimentar. Qual é aquele consumidor do topo? O título – o nome – é “predador”.

Inserindo aquela pesquisa no Google, ele providencia boas respostas, mesmo a pesquisa soando estranha:

faq5

Agora considere como os resultados são similares para uma pesquisa como “o maior nível da cadeia alimentar”, como mostrado abaixo:

faq6

Imagine que o RankBrain está conectando àquela longa e complicada pesquisa original para esta bem menor, o que provavelmente é mais comumente feito. Ele entende que elas são bem similares. Como consequência, o Google pode aproveitar tudo o que ele sabe sobre a obtenção de respostas para as pesquisas mais comuns e ajudar a melhorar o fornecimento das respostas menos comuns.

É necessário enfatizar que eu não existe a certeza se o RankBrain está conectando aquelas duas pesquisas. Apenas que o Google deu o primeiro exemplo. Esta é uma simples ilustração de como o RankBrain pode ser usado para conectar uma pesquisa incomum a uma mais comum, como forma de melhorar as coisas.

O Bing também pode fazer isso com o RankNet?

De volta a 2005, a Microsoft começou a usar o seu próprio sistema de aprendizagem da máquina, chamado RankNet, como parte do que se tornou hoje o motor de pesquisa Bing. De fato, o chefe de pesquisas e criador do RankNet foi recentemente premiado. Mas através dos anos a Microsoft quase não falou sobre o RankNet.

Você pode apostar que isto provavelmente mudará. Também é interessante que quando colocamos a pesquisa acima no Bing, a exemplo de como o RankBrain do Google é formidável, o Bing retorna bons resultados, incluindo uma listagem que o Google também retornou:

faq7

Uma pesquisa não significa que o RankNet do Bing é tão bom quanto o RankBrain do Google ou vice e versa. Infelizmente é realmente difícil chegar a uma lista dessas para fazer este tipo de comparação.

Mais algum exemplo?

O Google nos deu um exemplo fresco: “Quantas colheres de sopa vai em um copo?” O Google disse que o RankBrain recomendou resultados diferentes na Austrália em relação aos Estados Unidos para aquela pesquisa porque as medidas são diferentes em cada país, apesar do nome similar.

Ao testar pesquisando pelo Google.com e pelo Google Austrália. Não vimos muita diferença. Mesmo sem o RankBrain, os resultados seriam diferentes nessa pesquisa por causa do meio “antiquado” de favorecimento de conhecidas páginas australianas para os pesquisadores que usam o Google Austrália.

O RankBrain realmente ajuda?

Apesar dos dois exemplos acima serem nada menos do que o testemunho convincente da grandeza do RankBrain, ele provavelmente está ocasionando um grande impacto, como o Google alegou. A companhia é bastante conservadora com o que acontece dentro do algoritmo de classificação. Ela faz pequenos testes a todo o momento. Mas ela apenas faz grandes mudanças quando tem um grande nível de confiança.

Integrar o RankBrain ao nível que é supostamente o sinal de terceira maior importância é uma grande mudança. Acredita-se que o Google não faria isso sem que ele realmente acreditasse que isto estivesse ajudando.

Quando o RankBrain começou?

O Google diz que houve um lançamento gradual do RankBrain no início de 2015 e que ele tem sido totalmente ativo e global de alguns meses para cá.

Quais são as pesquisas impactadas?

O Google disse a Bloomberg que uma “fração muito grande” de pesquisas estão sendo processadas pelo RankBrain. O Search Engine Land pediu por uma descrição mais específica, mas nos foi dada a mesma afirmação da grande fração.

O RankBrain está sempre aprendendo?

O Google diz que tudo o que o RankBrain aprende é offline. São lhe dados lotes de pesquisas do histórico e ele aprende a fazer predições a partir delas.

Essas predições são testadas e se se provarem boas, então ativas na interpretação mais recente do RankBrain. Então o ciclo de aprender-e-testar-offline se repete.

O RankBrain faz mais que refinar pesquisas?

Normalmente, uma pesquisa é refinada como – estar entre decorrência, sinônimo ou agora o RankBrain – não sendo considerada um fator ou sinal de classificação.

Sinais são fatores típicos que estão amarrados ao conteúdo, como as palavras em uma página, os links que apontam à uma página, se a página está em um servidor seguro e por aí vai. Eles também podem estar amarrados a um usuário, como o local que o pesquisador está ou o seu histórico de pesquisa e navegação.

Então quando o Google diz que o RankBrain é o terceiro sinal de maior importância, isso significa que ele é um sinal de classificação? Sim. O Google confirmou que existe um componente onde o RankBrain está de alguma forma contribuindo para decidir a classificação de uma página.

Exatamente como? Existe algum tipo de “pontuação do RankBrain” que pode avaliar a qualidade? Talvez, mas parece que o RankBrain é muito mais algo que ajuda o Google a classificar melhor as páginas baseadas no conteúdo que elas têm. O RankBrain pode estar capacitado a resumir melhor uma página do que os sistemas já existentes do Google têm feito até então.

Ou não. O Google não diz nada além de que existe um componente de classificação envolvido.

Como aprender mais sobre o RankBrain?

O Google disse ao Search Engine Land quem quiser aprender mais sobre palavras “em vetor” – a forma em que as palavras e frases podem ser matematicamente conectadas – deveria checar este post do Google Open Source Blog – Learning the meaning behind words, que fala sobre como o sistema (que não é chamado de RankBrain no post) aprendeu o conceito de capitais de países apenas explorando as notícias dos artigos:

faq8

Existe um longo trabalho de pesquisa sobre isso aqui neste material em PDF: Distributed Representations of Words and Phrases and their Compositionality.

Você ainda pode brincar com seu próprio projeto de Máquina que Aprende usando a ferramenta do Google word2vec. Em adição o Google tem uma área inteira de documentos sobre a IA e a Máquina que Aprende, assim como a Microsoft.

Este texto foi traduzido do Search Engine Land.

Há muitos anos, os varejistas on-line perceberam que, para a conta financeira da loja fechar no azul, ele precisará de uma ajuda extra dos Portais de Busca, mais especificamente do Google (que detém quase 100% do tráfego de quem usa esses serviços no Brasil).

E não estamos falando aqui de link patrocinado (anúncios pagos), mas sim de técnicas de SEO que consistem  em deixar sua loja mais bem posicionada nas páginas do Google, conforme a palavra-chave buscada. Este post não se propõe a citar as melhores práticas de SEO que são inúmeras e merecem, pela sua importância, que o profissional de e-commerce se aprofunde nos assunto seja pesquisando na web seja por meio de cursos especializados em SEO.

Me aterei apenas a um quesito importante de SEO que são as chamadas meta-tags.
Para quem não está familiarizado com o termo, trata-se de linhas de comando colocadas no código das páginas da loja virtual ( ou de qualquer site), que ajudam os sistemas de cadastramentos dos Portais de Busca (chamados de “robozinhos”) a melhorarem a exposição do link das páginas da loja nas páginas de resultados do Google.

Acho que a melhor maneira de explicar é mostrando na prática. Quando busco no Google “tênis tracking”, aparece como primeira opção, após os anúncios (indicados com o “Ad” ao lado do link), a loja Centauro:

centauro-busca

Analisando o código da página deste produto, verificamos que a Centauro fez a “lição de casa”, além de colocar a meta title, inseriu uma descrição atraente para chamar a atenção do internauta, usando a força da marca Oakley.

centauro-codigo

A grande maioria das plataformas, possui campos específicos na página de cadastramento do produto para que você preencha estas informações. Vejamos alguns exemplos de plataforma de e-commerce que oferecem esta funcionalidade:

 Vtex

meta-tag-vtex

Dotstore

meta-tag-dotstore-2

Verifique se a sua plataforma possui esta funcionalidade, se possuir, certifique–se de que, senão todos pelo menos os produtos mais importantes da sua loja, tenha estes campos preenchidos. Saiba que são 3 os campos principais que você terá de preencher:

Meta-tag Title

Corresponde ao título que aparecerá na busca, como por exemplo: “Centauro – Tênis Oakley Tracker Masculino”.

Meta-tag Descripition

Corresponde à descrição curta, no máximo de 160 caracteres, que aparecerá logo após o título, exemplo: “O Tênis Oakley Tracker foi confeccionado para que você tenha o máximo de conforto em suas aventuras com a qualidade Oakley. Vale apena Conferir!”.

Meta tag Keywords

São palavras-chaves relativas ao item buscado, exemplo: “tenis traking, tênis aventura, tênis oakley, tracker.

Esta última tag tem bem menos importância que as duas primeiras, pois, desde 2012, conforme anunciado pelo principal engenheiro do Google, Matt Cuts, os algoritmos do Google deixaram de dar importância às palavras-chaves e passaram  a considerar mais outros critérios para indexar determinada página. Isto causou muita confusão, pois alguns programadores entenderam que as outras duas também perderam o seu valor.

Não se engane, o meta title e a meta description são de grande importância para sua loja, uma meta descripition vendedora pode aumentar, comprovadamente, de 5 a 10%, a taxa de clique em links mostrados no Google.

Lembrando que, para acompanhar o desempenho de suas palavras-chaves, é recomendável ferramentas como Google Webmaster Tools, SEO Monitor, MOZ, SEM Rush (assim, saberá como sua página está posicionada em relação aos concorrentes, e se está subindo ou descendo no ranking das páginas). É indicado, também, o bom e velho Google Analytics para se informar quanto às páginas mais visualizadas e clicadas.

As palavras “conteúdo duplicado” normalmente causam calafrios quando pronunciadas na internet. ‘Nunca fale CONTEÚDO DUPLICADO em voz alta‘. Pessoas sem experiência em SEO usam elas o tempo todo. A grande maioria nunca parou para ler simples e claras orientações do próprio Google sobre conteúdo duplicado. Assume-se apenas que, se de alguma forma algo aparecer mais de uma vez, asteróides e gafanhotos virão decretar uma maldição eterna ao seu site.

Diante disso, é bem saudável tentar derrubar alguns mitos que correm no boca a boca de quem trabalha com conteúdo. Vamos à eles:

Mito 1#: Conteúdo não-original vai comprometer o rankeamento de todas as páginas do seu domínio

Alguém conhece alguma evidência de que conteúdo não-original atrapalha a classificação de um site, com exceção de casos extremos? Eis o que acontece:

Um novo site entrou no ar, uma preguiçosa empresa de relações públicas copiou o texto da home page e colou em um comunicado de imprensa. Eles enviam para inúmeros veículos de notícias, criando imediatamente centenas de versões de conteúdos idênticos ao da home page por toda a internet. Alarmes ensurdecedores disparam pelo Google e seu domínio entra manualmente em uma Lista Negra.

Coisa feia. Uma vez que você participa do projeto, tem responsabilidade se isso acontece. Ainda é possível entrar com um pedido de reconsideração e o domínio pode ser re-indexado. Porém, você não vai querer ter este tipo de emoção e incerteza.

Então, qual foi mesmo o problema?

• Volume: Haviam centenas de instâncias do mesmo texto.
• Tempo: Todo o conteúdo apareceu ao mesmo tempo.
• Contexto: Foi a cópia página inicial em um novo domínio.

Não é nada difícil imaginar como isso acabou marcado como SPAM, certo?

Porém, não é exatamente disto que as pessoas estão falando quando sussurram “CONTEÚDO DUPLICADO“. Eles normalmente estão falando sobre alguns parágrafos de um texto simples em um site bem estabelecido. É preciso de bem mais do que isso para fazer os alarmes altos do Google entrarem em alerta.

Muitos sites e blog bastante populares na internet, incluindo este que você lê, muitas vezes repassam artigos que apareceram pela primeira vez em outros lugares. É o que chamamos nas aulas de Marketing de Conteúdo, de Curadoria de Conteúdo. Você mostra o conteúdo que você sabe que é relevante para seu público, mesmo sem tê-lo desenvolvido, amplia o alcance do conteúdo original e direciona para quem escreveu.

Não se espera que este conteúdo seja bem ranqueado, ele normalmente serve como alimento diário aos seus seguidores. O mais importante é que isto, apesar de ser menos relevante do que um conteúdo original, não vai prejudicar a credibilidade do seu domínio.

Mito 2#: Web Scrapers ferirão seu site

Um conteudista que ler atentamente o Google Webmasters Tools, certamente terá medo de robôs Scrapers (que varrem o site e clonam todo o conteúdo) e apontam o link para você em busca de relevância. Na sua reputação, estas páginas de entrada contam, e caso este site que aponta para o seu viole diretrizes do Google, pode jogar seu site para baixo. Para isso é indicado a leitura deste texto sobre conteúdo duplicado, ou este a seguir, sobre como rejeitar links.

Imagine um grande Blog com centenas de milhares de acessos diários. Agora imagine o número de trackbacks recebidos até a hora do almoço de um dia comum. E depois de um final de semana! Você realmente acredita que existe uma equipe focada tempo integral em rejeitar todas estas ligações ao longo do dia? Não. Eles não ligam! E dormem tranquilamente à noite sem temer o conteúdo duplicado.

O web scraping não vai te ajudar, mas também não deve te prejudicar. Eles simplesmente serão menos relevantes do que você. Pessoalmente não me preocuparia com esse tipo de “raspagem”. Eles copiarão normalmente todos os links internos, e ocasionalmente você terá até mesmo mais visitas. Como disse anteriormente, seu alcance também cresce em uma Curadoria.

Dica: Denúncia de Scrapers

Na raríssima possibilidade de o Google confundir a versão copiada e esta superar a versão original, existe salvação. Aqui você pode contar tudo para sua mãe  reportar o equívoco ao Google. Use o Scraper Report.

https://docs.google.com/forms/d/1Pw1KVOVRyr4a7ezj_6SHghnX1Y6bp1SOVmy60QjkF0Y/viewform

Dica: Assine seu conteúdo digitalmente com o Google Autoria (Authorship)

Fazer sua foto aparecer nos resultados de busca não é a única razão para usar o Google Autorship, e se fosse o seu único motivo, seria tarde demais. O Google Authorship é a melhor maneira de provar que você é o autor do conteúdo.

Com isso, cada parte do conteúdo estará ligada somente com UM autor, sem importar quantas vezes aquele conteúdo foi replicado.

Dica: Como agir contra plágio na internet

Existe um abismo de diferença entre conteúdo ‘raspado’ (ou Curado) e violação de Direitos Autorais. Em algumas ocasiões empresas copiam seu conteúdo (quem sabe o site todo) e dizem ser autores.

Plágio é o ato de assinar alguma obra intelectual que contenha algo desenvolvido por outras pessoas. E não é isso que o Scrapers fazem. O plágio é ilegal e é exatamente contra ele que você tem o Copyright em seu rodapé. Se isso acontecer, nem adianta procurar o Google, é melhor acionar seus advogados.

Para lidar com isso, ouça este podcast da Agência Mestre: Plágio na internet: Casos e como combater.

Mito 3#: Republicar seus textos para outros blogs no seu blog penalizarão seu site

Você escreve para diversos sites. É improvável que seu público habitual veja todos os seus textos, por isso é bastante tentador republicá-los em seu próprio site. Caso você tenha como estratégia um site ou blog com conteúdo estritamente original, faça isso pela intenção de agregar valor, não por medo de uma sanção que provavelmente não existirá.

Lembra daquele grande Blog com milhares de acessos? Existe uma boa chance dele te incentivar a republicar seu texto no próprio site algumas semanas depois. Eles têm consciência de que o Google não vai se confundir. É simples, eles apenas pedirão para inserir uma simples tag em HTML no post…

Dica: Use Canonical Tag

A Canonical realmente pode resolver todos os problemas. Se você quer publicar um artigo que saiu anteriormente em outro lugar, basta usar esta linha de código para dizer ao robô do buscados que foi publicada uma versão original àquele texto em outro lugar. Mais uma que o Google Webmasters Tools ensina. Veja um exemplo:

É isso aí! Basta adicionar a tag e republicar sem medo.

Dica: Escreva o “Evil Twin”

Se no texto original era “Como fazer” (How To) olhe pelo espelho e escreva “Como não fazer“. Baseie-se no mesmo conceito e pesquise, mas use diferentes exemplos e agregue valor. Seu texto “Evil Twin” (irmão gêmeo do mal) será semelhante, mas ninguém poderá dizer que não é original.

3 Mitos sobre Conteúdo Duplicado.

Você não vai só evitar uma penalidade, mas pode obter benefícios de SEO. Ambos os textos aparecerão bem ranqueados. Não só você vai evitar uma penalidade, mas você pode obter um benefício SEO.Ambas as mensagens classificar na primeira página de “navegação do site.”

Acalme-se, sem pânico!

Sem exageros, nem pânico desnecessário. Respire fundo e considere:

“Googlebot visita a maioria dos site diariamente. Se ele encontrar uma versão chupinhada de alguma coisa uma semana depois em outro site, ele saberá onde a original apareceu. O Googlebot não vai sentir raiva e te penalizar. Ele simplesmente seguirá em frente. Isto é muito bonito e uma coisa que você precisa saber.”

Lembre-se, o Google tem 2 mil doutores de matemática na equipe. Eles constroem carros que dirigem sozinhos e óculos computadorizados. Eles são muito, muito bons. Você acha que eles vão banir um domínio porque encontraram uma página de texto banal?

Uma enorme porcentagem da internet é conteúdo duplicado. O Google sabe disso. Eles estão separando os originais de cópias desde 1997, muito antes do termo “conteúdo duplicado” tornar-se um chavão em 2005.

3 Mitos sobre Conteúdo Duplicado.
Relatório de interesse ao longo do tempo por “conteúdo duplicado”.

Discorda? Tem qualquer evidência conflitante?

Quando falamos em SEO e principalmente sobre conteúdo duplicado é importante procurar por evidências. Eventualmente se encontra alguém que fez. Andy Crestodina, autor da versão original em inglês deste texto para o blog da Kissmetrics contou este caso: Como experiência foi construído um site com mensagens republicadas por toda parte, literalmente e gradualmente alguns deles começaram a ser indexados. Até que veio nosso amigo Panda e derrubou.

Seria uma penalidade? Ou apenas alguns pontinhos negativos na relevância? Existe diferenças entre uma penalidade (como a temida Lista Negra já mencionada) e uma correção para restaurar a ordem correta das coisas.

Se você tem exemplos reais sobre penalidades relacionadas a conteúdo duplicado, gostaríamos de ouvir. Comente!

Texto traduzido e adaptado do Blog da Kissmetrics.

O americano Walmart.com está repensando toda sua atividade em e-commerce. Antes de efetivar uma já prometida mudança na logística, repaginou toda sua loja virtual, o “verdadeiro motor de crescimento” do Walmart.

Segundo Neil Ashe, Vice-presidente executivo e CEO da divisão global de e-commerce do Walmart, a nova home page se aproxima de como eles acreditam que as pessoas estão comprando, um foco maior na busca, uma nova seção de tendências de busca e a experiência da loja: “Como encontrar uma perto de você?“.

Conceito multicanal - Novo portal Walmart.com
Novo portal Walmart.com

O Walmart.com além da loja virtual destaca que existem lojas físicas perto de você (Estadunidense). A ideia é que tudo está integrado, compre online ou na loja física (ou compre online e retire na loja física), mas compre no Walmart. Este é o conceito Omnichannel (ou consumidor multicanal), o foco é agradar o consumidor como ele quiser, “onde e como gosta de ser servido“.

Leia também: A Era do Consumidor Multicanal. Por Pedro Guasti.

E o mobile commerce completa o conceito:

“Mais da metade dos nossos clientes agora têm smartphones… Estamos comprometidos com recursos significativos para celulares.”
Neil Ashe.

Agora os clientes mobile americanos do Walmart podem “chavear” seu aplicativo para o modo “in-store” nas mais de 200 lojas. O aplicativo vai fornecer o mapa de produtos do local, informações de quantidade de estoque, digitalização de itens e checar a disponibilidade em outras lojas.

Outras inovações incluem que, por exemplo, o cliente pague em dinheiro! “Algo que nenhum outro site permite que se faça…”. Muitos clientes que não têm conta no banco podem encomendar online e retirar na loja física. Segundo Ashe, cerca de metade da mercadoria encomendada pelo site é enviada para ser retirada nas lojas.

Outro fator saudável é extinguir a sensação que a loja online pode “canibalizar” a loja física, segundo Ashe não existe mais essa competição interna. Os gerentes das lojas físicas recebem créditos em receitas geradas pelo e-commerce enviadas à sua loja física.

Com isso, o Walmart pretende trabalhar em conjunto para um objetivo único: agradar seu consumidor como ele (consumidor) bem entender

Fonte: Walmart Retools E-Commerce, Mobile; Tests Lockers, do MediaPost.com.