Ya te digo, con una programación en general que esté como muy cuidada, estarás enviado una única URL a los buscadores y estarás ahorrando muchísimos problemas de posible contenido duplicado, de manera tal que digamos que si Google encuentra seis versiones diferentes para esa página interna, sepa cuál coger y por lo tanto la muestre frente a las opciones de tu competencia.
También te digo, te pueden aconsejar que, esto también lo he visto muchas veces, que simplemente poniendo las URLs en el robots.txt "pues cojo lo indico y ya con esto yo ya me aseguro de que no se indexe" no es la mejor opción, no te lo recomiendo. Es mucho mejor evitar ya desde programación, que esa URL no exista, que no luego tener que estar indicando a los buscadores "esto sí cógelo, este parámetro no, esto con canónicas, esto con redirecciones...".
¿En qué se nota si nos está afectando el contenido duplicado de una página web?
- Pues sobre todo en que el bot de Google pasa menos a rastrear nuestra página web, que si tenemos esos problemas solucionados. Cuando una página web está limpia y todo está ordenado, Google pasa con mucha más frecuencia porque encuentra más rápido la información también, con lo cual si tú actualizas cualquier ficha de producto o un post en el blog etcétera y no hay duplicidades, además de ser original en tu contenido, también le estás facilitando al motor de rastreo la labor de encontrar ese contenido.
- Y luego la otra vía en la que se nota mucho cuando estás auditando la página web es, bueno que es la vía principal además, es que está Google mostrando una página que no es la que tú quieres enseñar realmente como principal y está mostrando otro contenido duplicado que ya digo no es realmente el importante para ti, bien para tu blog, bien para tu negocio, para tu tienda online o lo que sea.
¿Qué tipos de contenidos duplicados en SEO existen?
Continuando con los tipos de contenido duplicado que hay, digamos que:
- hablamos de lo que se llama comúnmente verdaderos duplicados o true duplicates, es la denominación que le damos a nivel interno en el sector. O sea verdaderos duplicados que sería copiar pegar tal cual,
- luego estarían los duplicados que tienen cierta aproximación (near duplicates) que es cojo esto de una web (por ejemplo entre dominios) cojo esto de esta página o este post que me ha gustado y lo transformo un poquito y lo pongo en mi página web; contenido duplicado tal cual, los algoritmos de hoy día son lo suficientemente avanzados como detectar ese tipo de trabajos de colegio copiados, no os recomiendo que no lo hagáis, siempre el contenido cuanto más original mejor.
También puede pasar dentro de tu propia página web. Entonces ten mucho cuidado por ejemplo si dices "pues voy a coger un post que escribí en 2010 y lo voy a actualizar, lo pego tal cual y pongo una pequeñita cosa y tengo publicado el post más antiguo de 2010 y el nuevo de 2018 con una pequeña actualización" no te lo aconsejo, eso no lo hagas. Es mejor que cojas el post antiguo con su URL antigua y hagas la actualización sobre esa URL antigua indicando "actualización de 2018".
¿Los Guest Post son duplicados?
Otra manera importante para evitar por ejemplo los duplicados, que también se da mucho últimamente, es todo el tema del guest post o del post con invitado, que dices "bueno yo he escrito un post colaborando con otro blog porque su dominio tiene mucha fuerza y el enlace que me va a mandar hacia mi página tiene muchísima calidad, es muy bueno, pues voy a coger ese post y además de estar publicado donde he sido invitado, lo voy a publicar también en mi página" también te aconsejo que no lo hagas.
Ten en cuenta que todo esto son señales confusas de cuál es el original y de todas maneras el que está copiando en este caso siempre vas a ser tú, porque el otro lo ha publicado primero, aunque el autor de la entrevista por ejemplo si es una entrevista y eres tú el que está respondiendo, seas tú.
Entonces yo te aconsejo en este caso que tu blog hagas una cita, en plan "pues me han hecho una entrevista en este blog, donde he tenido la suerte de colaborar con tal..." y puedes hacer pequeñas menciones como coger pequeñitos, ya te digo, citar. Como si fueras un periodista y estás recogiendo aquello que te parece más destacable de esa noticia.
Se te puede quedar más corto, se te puede quedar más extenso, puedes coger sólo un trocito y luego ampliarlo en tu página web... Hay muchas maneras de evitar el contenido duplicado en ese aspecto.
Sobre el thin content
Y sobre todo ya digo, como decía antes con las fichas de producto del ecommerce, trata de escribir contenido suficiente dentro de cada página para evitar lo que se le llama thin content o contenido débil. Esto te puede evitar también muchos problemas.
Esto me pasa mucho por ejemplo con páginas que audito que son de B2B, (business to business) de servicios, páginas corporativas de servicios, pues no sé abogados, empresas de consultoría de electricidad, lo que sea.
Aquí, esto es muy común, pues voy a ir creando páginas internas, antes se hacía para ir recabando más palabras clave y ahora directamente se hace a lo mejor pues porque voy a crear un pequeña variación de mi servicio, entonces tengo un servicio de derecho laboral y voy a crear un pequeñito apartado y en ese pequeñito apartado tengo muy poquito texto. La cabecera y el pie de la página web coincide mucho con el resto de páginas internas de tu página web pero luego en el texto pongo un poquito donde explico un poco el servicio y ya está.
Eso es contenido débil y el contenido débil si además lo mencionas en otra página donde hablas del conjunto global de tus servicios, esa página va a tener mucha más fuerza que ese contenido débil, simplemente por cantidad, aquí sí que es una cuestión más de cantidad, aunque luego el texto de dentro tenga más calidad.
Es mejor que si creas una página interna propia para desarrollar más en detalle un servicio, realmente lo desarrolles más en detalle y realmente lo expliques, eso es un poco el consejo que te doy. Y sobre todo ya digo, para Google es muy importante ser consistente, auditar muy bien y de vez en cuando todas nuestras páginas internas, hacer búsquedas en Google también para compararnos con la competencia o bien con nosotros mismos, con nuestras propias páginas y tomar decisiones que sean coherentes, que estén enviando a los buscadores una información clara de por dónde han de rastrear la página una vez que accedan y el usuario, cuál es la información más importante que le vamos a dar.
Habréis visto seguro en Google que muchas veces cuando buscas y estás viendo tu página web, buscas un poco la información que está indexada de tu dominio y aparece abajo "esta página web contiene... (te lo digo más o menos) esta página web contiene 206 resultados muy parecidos que no se muestran en este índice" claro indicador de contenido duplicado y algo que hay que solucionar ahí, eso sí que te recomiendo que lo revises.