O que são Dados Estruturados?

Porque usar Dados Estruturados para melhorar o SEO


Autor: Réulison Silva Publicado em: Agosto 30, 2021

O que são dados estruturados?

Exemplo da Girafa para dados estruturados.

Os leitores de voz podem entender o que significa “agirafavivenasavana”. Eles podem facilmente dividir a seqüência de letras nas palavras “a girafa vive na savana”, e eles têm um conjunto de associações distintas com as palavras. Uma “girafa” é um animal alto com um pescoço extremamente longo, quatro pernas longas e uma pele bastante distintiva. E “vive” (o que significa que habita um determinado lugar) na “savana”. Talvez não possamos saber exatamente o que é uma “savana”, mas podemos facilmente classificá-la como um lugar. Afinal, normalmente vivemos em um “lugar”, não é?

“To manage a system effectively, you might focus on the interactions of the parts rather than their behavior taken separately” – Russell L. Ackoff

Os robôs dos motores de busca não são tão inteligentes. Uma vez que eles tropeçam em “agirafavivenasavana”, eles salvam 22 caracteres em sua memória e vão para um novo pedaço de informação para consumir. Sem um vocabulário pré-carregado e um conjunto de regras especiais (ou, se eu fosse usar um termo técnico, sem dados estruturados), os programas de computador não podem derivar o significado de uma cadeia de caracteres.

Quando alguém pesquisa na web por “agirafavivenasavana”, os motores de busca retornarão a página onde esta string exata aparece em seu conteúdo. Mas se você pesquisar “onde as girafas vivem?”, Um motor de busca provavelmente não conseguirá indexar a mesma página, mesmo que essa página responda a sua pergunta.

OBS.: Para algumas pesquisas o Google já capaz de separar as sílabas e entender o conteúdo, mas ainda é muito incipiente.

Efetivamente, isso significa que você não pode esperar que os motores de busca entendam a linguagem dos humanos. Mas se você é um SEO, é de seu interesse ajudá-los a entender. E é aí que entra os dados estruturados.

A partir deste artigo, você aprenderá como obter mais tráfego e exposição na SERP ( resultados da pesquisa), ajudando os motores de busca a entender melhor o seu site.

A semântica e dados estruturados

A semântica da web (semantic web) e a semântica de busca (semantic search) foram mencionados em todas as conferências de SEO em 2017. Mas você pode se surpreender ao descobrir que o conceito de semântica referente a Internet existe desde 1998, aproximadamente.

Vamos remover a fumaça e os espelhos do marketing e descobrir o que é semântica. Semântica é o estudo do significado em linguagens. Particularmente, ele estuda a relação entre significantes (como palavras, frases e símbolos) e o que eles representam (seu significado). Assim, a semântica é uma teia de significados. A semântica não é sobre palavras-chave e backlinks, é sobre relacionamentos entre conceitos (ou coisas). Em vez de olhar para as strings, os “significantes”, se atente nos conceitos por trás deles e suas propriedades.

Existem vocabulários e gramáticas para semântica da web, assim como para a linguagem humana. Você pode usá-los para formar declarações lógicas em seu site, e os robôs do mecanismos de pesquisa podem coletar, analisar e processá-los. O que torna a pesquisa semântica diferente da pesquisa regular é que as regras da lógica podem ser aplicadas à informação. Se um motor de busca encontrar uma declaração lógica no site de Barack que diga “Barack é amigo de Michelle” e alguém pesquisar “amigos de Michelle”, mesmo que o site de Michelle não mencione Barack (mesmo que o site de Michelle não exista), o motor de busca nos informará que Barack se considera um amigo de Michelle.

Aquele casal de respeito.

A partir do exemplo acima, vemos que os motores de busca podem derivar novos conhecimentos dos dados com um alto grau de organização. Podemos chamá-lo de dados significativos ou estruturados.

Por que usar dados estruturados no seu site?

Ao longo dos anos, as páginas de resultados dos motores de busca (sim, estou falando sobre o Google) não são mais apenas uma lista chata de links azuis.

Como eram os resultados do Google há muito tempo.

Agora são páginas bastante informativas que abrange milhares de informações, hoje as SERPs são capazes de responder algumas pesquisas em sua própria página. Ou seja, a própria SERP pode satisfazer as solicitações dos usuários, sem que elas precisem clicar nos resultados da pesquisa.

Como estão os resultados do Google em meados de 2018.

Esses vários widgets e cards que são chamados de recursos de pesquisa (search features). Existem dois tipos de recursos de pesquisa:

  • Recursos de tipo de conteúdo que aparecem como resultados separados. Estes incluem respostas diretas, painéis de gráficos de conhecimento ou carrosséis de notícias.
  • Aprimoramentos dos resultados da pesquisa. Eles fazem parte dos snippets de resultados de pesquisa, como breadcrumbs ou classificações.

Sobre os recursos de pesquisa A Pesquisa do Google pode ativar um conjunto avançado de recursos para sua página nos resultados de pesquisa, se entender o conteúdo da página e, em algumas circunstâncias, se você fornecer explicitamente informações adicionais no código da página usando dados estruturados. Esses recursos se enquadram em duas categorias gerais:

  • Tipo de conteúdo: muitos recursos de pesquisa estão vinculados ao tópico da sua página. Por exemplo, se a página tiver uma receita ou um artigo de notícias ou contiver informações sobre um evento ou um livro. Os resultados da Pesquisa do Google podem, então, aplicar recursos específicos do conteúdo, como tornar sua página qualificada para exibição em um carrossel de notícias, um carrossel de receitas ou uma lista de eventos.
  • Melhorias: são recursos que podem ser aplicados a mais de um tipo de conteúdo. Por exemplo, fornecer estrelas de revisão para uma receita ou filme ou expor um carrossel de resultados ricos (anteriormente conhecidos como rich cards).

Não há garantia de que sua página aparecerá nos resultados da pesquisa com o recurso especificado. Isso ocorre porque os recursos de pesquisa dependem de muitos fatores, incluindo o tipo de dispositivo de pesquisa, o local e se o Google acredita que o recurso forneceria a melhor experiência de pesquisa para o usuário.

A Pesquisa do Google tem alguns tipos gerais de categorias de resultados de pesquisa. A maioria dos recursos se aplica a categorias específicas.

Os recursos de pesquisa ocupam um bom espaço nas SERPs e, para completar, eles têm uma taxa de cliques substancialmente maior. Pelo que eu observei, os resultados com algum tipo de snippet de destaque ganham cerca de 30% na CTR em relação a seus concorrentes em resultados simples. Se o seu site não aproveitar os recursos de pesquisa, você pode estar perdendo impressões adicionais, por exemplo, nas principais notícias ou respostas diretas, e cliques.

Um exemplo de resposta direta:

Veja como o snippet de destaque dá maior relevância ao site.

Além disso, os dados estruturados abrem um novo mundo de funcionalidade do usuário. Os usuários podem transferir dados estruturados entre aplicativos e sites. Se um site usa dados estruturados, os navegadores da Web podem fornecer uma experiência de usuário aprimorada. Por exemplo:

  • Um evento em uma página da Web pode ser importado diretamente para o calendário da área de trabalho do usuário;
  • Os usuários podem reservar ingressos para um filme ou show diretamente na página de resultados de busca;
  • Encontrar o número de telefone do restaurante mais próximo para jantar depois.

Os recursos de pesquisa fazem parte da semântica da web e são baseados nos dados estruturados que o Google pode entender e interpretar. O Google pode ativar recursos avançados para sua página nos resultados de pesquisa se entender o conteúdo da página e se você fornecer explicitamente informações adicionais no código da página com a ajuda de dados estruturados.

Espero ter conseguido persuadi-lo de que a marcação de dados estruturados não é mais uma opção.

Schema.org, Microdata, Microformats, or RDFa?

A galera de SEO tem suas preferências quanto à melhor maneira de marcar dados estruturados. Como resultado, um monte de novas terminologias confusas foram criadas, incluindo RDF, RDFa, Microformats, Microdata, Schema e etc. Vamos descobrir qual deles é a melhor escolha para SEO, ou pelo menos vamos tentar.

Basicamente, se você quiser transmitir informações para os motores de busca, seja em linguagem natural ou máquina (linguagem de programação), você precisa de duas coisas:

  • Vocabulário: um grupo de palavras conhecidas por um indivíduo ou qualquer outra entidade, concreta ou abstracta;
  • Gramática: um conjunto de regras que dizem como usar o vocabulário para transmitir o significado, contendo prescrições e regras que determinam o uso considerado correto da língua escrita e falada.

Abaixo está um exemplo de um vocabulário simples para marcação de dados estruturados. Inclui apenas cinco entradas.

  • Person – uma pessoa (viva, morta ou fictícia). Pessoa pode ser descrita pelas seguintes propriedades;
  • familyName – Nome da família ou o sobrenome da pessoa;
  • givenName – Nome dado ou o primeiro nome da Pessoa;

E precisamos de algumas regras gramaticais que devemos aplicar para que um programa de computador possa compreender e armazenar os dados. Por exemplo:

  • Coloque os dados estruturados em chaves;
  • Separe a propriedade e seu valor por dois pontos e coloque-os entre aspas duplas;
  • Separe os pares de valor da propriedade por uma vírgula.
  • gender – gênero da pessoa;
  • birthDate – Data de nascimento da pessoa.
{
"type": "Person",
"givenName": "Paulo",
"gender":"Male"
}

Sem entrar em detalhes desnecessários, a maior parte da assustadora terminologia referente à marcação de dados estruturados pode ser colocada em dois grupos – vocabulários e gramáticas. Com exceção dos Microformats, você pode combinar arbitrariamente gramáticas e vocabulários para satisfazer suas necessidades. Siga os links se você estiver procurando informações específicas sobre qualquer um deles.

Os Microformats especificam a gramática para incorporar dados estruturados em documentos HTML e o vocabulário de termos específicos. É por isso que incluí as duas colunas. Com o Microformats, você só pode marcar seu conteúdo se a comunidade do Microformats criar e aceitar um vocabulário apropriado. Esta é uma grande desvantagem deste formato. Pelo contrário, você pode usar qualquer vocabulário, mesmo o seu, com RDFa, Microdata e JSON-LD.

Twitter e Facebook incentivam os webmasters a usar sua própria marcação de dados também. Estes são os Twitter Cards e o Open Graph Protocol. Esses formatos não são destinados aos mecanismos de pesquisa; assim eles não são abordados neste artigo. Tanto o Twitter Cards quanto o Open Graph podem coexistir com outros tipos de marcação. Com os cards do Twitter ativados em seu website, os usuários que acessarem links para seu conteúdo terão um “card” adicionado ao tweet visível para os seguidores. O “Card” pode ser pré-preenchido com imagens, vídeos ou texto de sua escolha. O Open Graph Protocol permite que qualquer página da Web se torne um objeto rico em um gráfico na rede social, isso é usado no Facebook para permitir que qualquer página da Web tenha a mesma funcionalidade que qualquer outro objeto no Facebook, ou seja, para que ele tenha o mesmo comportamento de um post na rede social.

Que vocabulário e gramática você deve usar em seu site?

Schema.org deve ser a sua escolha para o vocabulário. É apoiado pelos principais mecanismos de busca, incluindo Google, Bing, Yahoo e Yandex. O Shema.org é bem documentado, versátil, possui uma comunidade ativa e está sempre em atualização.

No que diz respeito à gramática, não há como fugir. Existem três grandes players agora: RDFa (Resource Description Framework in Attributes), Microdata e JSON-LD (JSON para vincular dados). RDFa e Microdata são conceitualmente muito semelhantes. Ambos permitem reutilizar dados HTML visíveis.

Na implementação de RDFa (veja abaixo), startDate, endDate e outros valores marcados são realmente visíveis para o usuário, não há duplicação das informações:

<div vocab="http://schema.org/" typeof="SportsTeam">
<span property="name">Barcelona FC</span>
<div property="member" typeof="OrganizationRole">
<div property="member" typeof="http://schema.org/Person">
<span property="name">Ronaldinho Gaúcho</span>
</div>
<span property="startDate">2003</span>
<span property="endDate">2008</span>
<span property="roleName">Meia</span>
</div>

JSON-LD, pelo contrário, duplica os dados, que são inseridos na <head> ou <body> de uma página web como um <script>.

Esta é uma diferença fundamental do ponto de vista de um cara de Marketing e um SEO.

De acordo com o Web Data Commons (veja o gráfico abaixo), Microdata é a especificação mais usada, seguida por JSON-LD, e o JSON-LD está ganhando popularidade. No momento, o Google recomenda a codificação de dados com o JSON-LD, embora o mecanismo de pesquisa também seja capaz de analisar Microdata e RDFa.

Na minha humilde opinião, Shema.org + JSON-LD é o melhor pacote para a maioria dos proprietários de sites.

Web Data Commons – RDFa, Microdata, Embedded JSON-LD, and Microformats Data Sets – October 2016.

Como implementar a marcação de dados estruturados?

Finalmente, estamos prontos para colocar a teoria em prática. Você está a apenas há quatro passos de uma overdose de dados estruturados…Hahahaa!

1. Escolha os esquemas

Estude cuidadosamente os esquemas disponíveis no Schema.org. Veja abaixo os mais amplamente utilizados.

Organization Creative Work
Person Book
Place Movie
Local Business Music Recording
Restaurant Recipe
Product TV Series
Offer Event
Review

Crie um mapa de esquemas para o seu site em uma planilha. Listar os URLs de páginas individuais ou categorias de sites em uma coluna e esquemas relevantes na outra coluna.

URLS SCHEMAS
http://my-dance-school.com/about Organization, Local Business
http://my-dance-school.com/the-team Person
http://my-dance-school.com/training-videos Creative Work
http://my-dance-school.com/testimonials Review
http://my-dance-school.com/calendar Event

Vários esquemas podem ser combinados para descrever um objeto. Por exemplo, Person é um bom esquema para descrever um Réulison Silva. Mas Person também pode ter um Address e estar associada a uma Organization que, por sua vez, pode ter seu próprio Address, Person, Address e Organization são três esquemas diferentes que usamos para descrever apenas um Réulison Silva.

Quando o mapa de esquemas estiver concluído, você estará pronto para prosseguir para a próxima etapa.

2. Crie uma marcação de dados estruturados

Graças ao Google, você não precisa ser um desenvolvedor web para marcar os dados estruturados em um site. Você pode usar o Assistente de marcação de dados estruturados. É uma ferramenta fácil de usar, contém um guia que te ajuda por todo o processo.

  1. Abra o Assistente de marcação de dados estruturados, selecione o esquema relevante e insira uma URL da planilha criada na etapa anterior. Em seguida, clique em Começar a marcar.
Esta ferramenta ajudará você a adicionar marcação de dados estruturados a uma página de amostra da Web.
  1. Realce os elementos da página e atribua tags de esquema a eles. Você pode adicionar tags ausentes se não houver representação visível para as informações. Basta clicar no botão Adicionar tags ausentes. Clique em Criar HTML, quando estiver pronto.
Criando as tags para a camada de dados.
  1. Selecione JSON-LD no menu suspenso. Copie o código e cole-o entre as tags <head> ou <body> no código HTML da página em seu website.
Agora é só adicionar o bloco de scripts abaixo à seção head de seu HTML.

Se o seu site tiver milhares de páginas que possam utilizar esses dados estruturados, seria mais eficiente abordar sua equipe de desenvolvimento com essa tarefa.

3. Teste a marcação

Visite a Ferramenta de teste de dados estruturados e insira a URL da página que você deseja testar. A ferramenta exibe todos os dados marcados e fornece informações sobre erros e avisos.

Agora é hora de sentar e relaxar. Os rich snippets não serão exibidos na pesquisa antes que o Google rastreie novamente o site. Lembre-se de que não há garantia de que seus dados estruturados serão exibidos nos resultados de pesquisa, mesmo que os dados estruturados estejam marcados e possam ser extraídos com êxito de acordo com a ferramenta de teste. Estas são as razões mais comuns:

  • Os dados estruturados não são representativos do conteúdo principal da página ou potencialmente enganosos;
  • Os dados estruturados estão incorretos de uma maneira que a ferramenta de teste não conseguiu capturar;
  • O conteúdo marcado está oculto ao usuário.

Para simplificar, não tente enganar o Google. Na pior das hipóteses, seu site pode ser penalizado pelo uso indevido dos dados estruturados. Há casos em que o Google realizou ações manuais contra sites. A mensagem de penalidade geralmente é assim:

A marcaçao de dados estruturados em algumas páginas neste site parece usar técnicas como a marcação de conteúdo que é invisível para os usuários, a marcação de conteúdo irrelevante ou enganosa, e / ou outro comportamento manipulativo que viola as diretrizes de qualidade rich snippet do Google.

Ou assim:

Para práticas recomendadas e recomendações adicionais, leia a Introdução aos dados estruturados do Google.

4. Use a ferramenta de dados estruturados para diagnosticar problemas

Como diz a lei de Murphy, se algo pode dar errado, dará. Seus desenvolvedores podem comprometer código com bugs, ou um gerente de marketing novato pode adicionar dados estruturados com erros às suas páginas.

Faça as verificações de dados estruturados parte de sua rotina de SEO. Faça login no Search Console do Google. Clique em Aspecto da pesquisa > Dados estruturados. Você não apenas obterá os detalhes sobre os erros, mas também irá destacar informações detalhadas sobre os tipos de dados estruturados detectados em seu website.

Search Console

Finalizando

A “web semântica” (em inglês: semantic web) é um termo antigo que existe desde o final dos anos 90. Ela remete a significância da web, em que as relações reais entre as coisas são mais importantes do que as instâncias de palavras-chave e os links href. É mais fácil para os mecanismos de busca entender o significado dos dados quando estão estruturados.

Novas experiências de pesquisa, como os Recipes ou Knowledge Graph, são baseadas nos dados estruturados. Você pode implementar os dados estruturados com a ajuda do vocabulário Schema.org e da sintaxe JSON-LD. A maneira mais fácil de criar a marcação para páginas individuais é a Ferramenta de teste de dados estruturados do Google.

Agora você tem todas as ferramentas e conhecimentos necessários para preparar o seu site para a web semântica. E se você tiver dúvidas ou opiniões, deixe um comentário abaixo.

"author" : {
"@type" : "Person",
"name" : "Réulison Silva"
}