¿SEO tus pdf - este trabajo?
| by Kevin Kantola | October 07, 2004
¿Por qué optimizar?
¿Primero, por qué cualquier persona desearía al Search Engine optimiza sus archivos del pdf? Bien, si tenías un eBook, un folleto, una descripción del producto o un documento técnico en formato del pdf, puedes desear optimizar éstos para tomar un cierto tráfico adicional del Search Engine.
¿Pueden los motores de búsqueda leer archivos del pdf?
Sí, la mayor parte de los motores de búsqueda principales ahora pueden leer el contenido básico de los archivos del pdf, aunque consiguiendo estas páginas para alinear tan bien como archivos del HTML sigue siendo cuestionable.
¿Cómo se supone para trabajar?
Éste es cómo el workflow se supone para trabajar. Crear tu archivo en MS Word, o en un drenaje o un programa de la disposición de página que se puedan destilar más adelante en un pdf (con algunos usos tendrás que crear un archivo de EPS primero y entonces destilarlo y con otros usos, tú puede destilar a la derecha fuera de los apps). Si estás utilizando un programa tal como MS Word, estar atento aplicar el H1, H2, etiquetas H3 donde necesario y optimizar el texto del cuerpo como un archivo del HTML.
Cuando te acaban, destilar el archivo. Traer este archivo en la versión completa del acróbata 6 del adobe para corregir. Enchufar el contenido apropiado, fijar el pdf en tu Web site y dejar las robustezas del Search Engine poner en un índice el archivo.
¿Cómo enchufo el contenido apropiado?
En el acróbata 6 del adobe hay dos lugares para entrar el contenido en un archivo del pdf. El primer lugar está bajo características del archivo/del documento y el segundo lugar está bajo meta datos avanzados/del documento. Bajo características del archivo/del documento hay varios menús pero el más relevante para nuestros propósitos es el menú de la descripción. Bajo menú de la descripción, hay campos para el título, el autor, el tema y las palabras claves.
Ahora para confundir materias más, dejarnos pasan al menú avanzado/del documento de los meta datos. Hay pares de opciones aquí, pero dejarnos miran de nuevo el menú de la descripción. Bajo este menú de la descripción, hay campos para el URL del título, del autor, de la descripción, del escritor de la descripción, de las palabras claves, del estado del copyright, del aviso de copyright y del copyright Info.
¿Cómo el pdf almacena los datos?
Con los campos duplicados, es importante descubrir cómo se almacenan los datos de modo que poder hacer algunas conjeturas educadas en cuanto a cómo los motores de búsqueda leen estos datos. Realicé algunos experimentos pequeños y aquí soy lo que he encontrado. Los campos del título y del autor se parecen ser ligados el uno al otro porque cuando cambias uno y cheque en el otro que verás que ha cambiado también. También, el tema del menú de las características del documento se parece ser ligado al campo de descripción del menú de los meta datos del documento por las mismas razones. Los campos de la palabra clave, sin embargo, no se ligan. Los sistemas separados de palabras claves se pueden agregar a ambos campos. Cuando se ahorra el archivo, ambos sistemas de palabras claves se almacenan en el archivo del pdf.
¿Cuál fijó de palabras claves entonces está correcto?
El adobe almacena sus meta datos en formato de XML. Abriendo el archivo del pdf en libreta, aparece que el campo de la palabra clave bajo características del documento es el que los motores de búsqueda utilizarán (esto no se ha probado, con todo sin embargo). La entrada de las palabras claves en este campo aparece en el pdf pues hemos venido esperar, separado por comas, como esto: Palabras claves (películas, cines, matinees, teatros, palomitas).
Las palabras claves que fueron entradas en el menú de los meta datos del documento aparecen como clase de lista como esto: treeswoodchips
Por supuesto, esto no significa cualquier cosa realmente - es cómo los motores de búsqueda leen el que cuente.
¿Cómo realmente trabaja?
He funcionado algunas pruebas preliminares (y por esto significo mismo preliminar) y más prueba necesitaré ser terminado para verificar estos resultados, pero aquí soy lo que he subido con hasta ahora. Cuando un archivo del pdf primero fue abierto en el acróbata 6 las características del documento o los meta datos del documento titula y los campos del autor fueron completados ya del nombre del archivo y de las iniciales del autor (información recibida de MS Word)
Sin completar cualquier dato adicional en las características del documento o el menú de los meta datos del documento, Google utilizó la información del campo del título para el título en los resultados y la descripción en los resultados fue adquirida de la copia de cuerpo. Yahoo! , en el uso de un pdf más viejo el texto más grande en la página como el texto del título. En respeto a los documentos más recientemente puestos en un índice del pdf, sin embargo, Yahoo! está utilizando la información del campo del título como el texto del título en los resultados de la búsqueda. En esta escritura, el texto de la descripción en los resultados del Search Engine viene del texto del cuerpo del pdf y no de las características del documento o del texto de los meta datos del documento.
Pensando puede ser que apenas consiga afortunado (y que espera resultados rápidos), yo funcioné algunos optimizados y los pdf no-optimizados con algunos de los simuladores más populares de la araña del Search Engine en la tela, pero estas arañas no manejaron el código binario muy bien. Ninguna de ellas volvieron título o la información de la etiqueta del meta y las palabras claves más populares eran snippets del código binario.
¿A este punto, realmente paga así pues, optimizar un pdf?
La respuesta simple es, sí. La copia de la etiqueta y de cuerpo del título puede todavía ser optimizada y los motores de búsqueda principales la pondrán en un índice por consiguiente. Hasta las etiquetas del meta de las palabras claves y de la descripción, Google bien no hacen caso de esto en los pdf justos como hace en documentos y Yahoo! del HTML, que utiliza la etiqueta de la descripción, es solamente intermedio a donde necesita estar.
Pero Google y Yahoo! no están los únicos dos motores de búsqueda/directorios alrededor y con de los algoritmos que cambian toda la hora, pronto o la voluntad del SE pueda quizás algún día leer completamente un archivo del pdf o el adobe ofrecerá un remiendo que haga los pdf SE-más amistosos. Es solamente una cuestión de tiempo, mi amigo. ¿Serás listo?
¿Primero, por qué cualquier persona desearía al Search Engine optimiza sus archivos del pdf? Bien, si tenías un eBook, un folleto, una descripción del producto o un documento técnico en formato del pdf, puedes desear optimizar éstos para tomar un cierto tráfico adicional del Search Engine.
¿Pueden los motores de búsqueda leer archivos del pdf?
Sí, la mayor parte de los motores de búsqueda principales ahora pueden leer el contenido básico de los archivos del pdf, aunque consiguiendo estas páginas para alinear tan bien como archivos del HTML sigue siendo cuestionable.
¿Cómo se supone para trabajar?
Éste es cómo el workflow se supone para trabajar. Crear tu archivo en MS Word, o en un drenaje o un programa de la disposición de página que se puedan destilar más adelante en un pdf (con algunos usos tendrás que crear un archivo de EPS primero y entonces destilarlo y con otros usos, tú puede destilar a la derecha fuera de los apps). Si estás utilizando un programa tal como MS Word, estar atento aplicar el H1, H2, etiquetas H3 donde necesario y optimizar el texto del cuerpo como un archivo del HTML.
Cuando te acaban, destilar el archivo. Traer este archivo en la versión completa del acróbata 6 del adobe para corregir. Enchufar el contenido apropiado, fijar el pdf en tu Web site y dejar las robustezas del Search Engine poner en un índice el archivo.
¿Cómo enchufo el contenido apropiado?
En el acróbata 6 del adobe hay dos lugares para entrar el contenido en un archivo del pdf. El primer lugar está bajo características del archivo/del documento y el segundo lugar está bajo meta datos avanzados/del documento. Bajo características del archivo/del documento hay varios menús pero el más relevante para nuestros propósitos es el menú de la descripción. Bajo menú de la descripción, hay campos para el título, el autor, el tema y las palabras claves.
Ahora para confundir materias más, dejarnos pasan al menú avanzado/del documento de los meta datos. Hay pares de opciones aquí, pero dejarnos miran de nuevo el menú de la descripción. Bajo este menú de la descripción, hay campos para el URL del título, del autor, de la descripción, del escritor de la descripción, de las palabras claves, del estado del copyright, del aviso de copyright y del copyright Info.
¿Cómo el pdf almacena los datos?
Con los campos duplicados, es importante descubrir cómo se almacenan los datos de modo que poder hacer algunas conjeturas educadas en cuanto a cómo los motores de búsqueda leen estos datos. Realicé algunos experimentos pequeños y aquí soy lo que he encontrado. Los campos del título y del autor se parecen ser ligados el uno al otro porque cuando cambias uno y cheque en el otro que verás que ha cambiado también. También, el tema del menú de las características del documento se parece ser ligado al campo de descripción del menú de los meta datos del documento por las mismas razones. Los campos de la palabra clave, sin embargo, no se ligan. Los sistemas separados de palabras claves se pueden agregar a ambos campos. Cuando se ahorra el archivo, ambos sistemas de palabras claves se almacenan en el archivo del pdf.
¿Cuál fijó de palabras claves entonces está correcto?
El adobe almacena sus meta datos en formato de XML. Abriendo el archivo del pdf en libreta, aparece que el campo de la palabra clave bajo características del documento es el que los motores de búsqueda utilizarán (esto no se ha probado, con todo sin embargo). La entrada de las palabras claves en este campo aparece en el pdf pues hemos venido esperar, separado por comas, como esto: Palabras claves (películas, cines, matinees, teatros, palomitas).
Las palabras claves que fueron entradas en el menú de los meta datos del documento aparecen como clase de lista como esto: treeswoodchips
Por supuesto, esto no significa cualquier cosa realmente - es cómo los motores de búsqueda leen el que cuente.
¿Cómo realmente trabaja?
He funcionado algunas pruebas preliminares (y por esto significo mismo preliminar) y más prueba necesitaré ser terminado para verificar estos resultados, pero aquí soy lo que he subido con hasta ahora. Cuando un archivo del pdf primero fue abierto en el acróbata 6 las características del documento o los meta datos del documento titula y los campos del autor fueron completados ya del nombre del archivo y de las iniciales del autor (información recibida de MS Word)
Sin completar cualquier dato adicional en las características del documento o el menú de los meta datos del documento, Google utilizó la información del campo del título para el título en los resultados y la descripción en los resultados fue adquirida de la copia de cuerpo. Yahoo! , en el uso de un pdf más viejo el texto más grande en la página como el texto del título. En respeto a los documentos más recientemente puestos en un índice del pdf, sin embargo, Yahoo! está utilizando la información del campo del título como el texto del título en los resultados de la búsqueda. En esta escritura, el texto de la descripción en los resultados del Search Engine viene del texto del cuerpo del pdf y no de las características del documento o del texto de los meta datos del documento.
Pensando puede ser que apenas consiga afortunado (y que espera resultados rápidos), yo funcioné algunos optimizados y los pdf no-optimizados con algunos de los simuladores más populares de la araña del Search Engine en la tela, pero estas arañas no manejaron el código binario muy bien. Ninguna de ellas volvieron título o la información de la etiqueta del meta y las palabras claves más populares eran snippets del código binario.
¿A este punto, realmente paga así pues, optimizar un pdf?
La respuesta simple es, sí. La copia de la etiqueta y de cuerpo del título puede todavía ser optimizada y los motores de búsqueda principales la pondrán en un índice por consiguiente. Hasta las etiquetas del meta de las palabras claves y de la descripción, Google bien no hacen caso de esto en los pdf justos como hace en documentos y Yahoo! del HTML, que utiliza la etiqueta de la descripción, es solamente intermedio a donde necesita estar.
Pero Google y Yahoo! no están los únicos dos motores de búsqueda/directorios alrededor y con de los algoritmos que cambian toda la hora, pronto o la voluntad del SE pueda quizás algún día leer completamente un archivo del pdf o el adobe ofrecerá un remiendo que haga los pdf SE-más amistosos. Es solamente una cuestión de tiempo, mi amigo. ¿Serás listo?
Article Source: http://www.articleset.com

You are welcome to publish or reprint this article free of charge, provided:
- you include the entire article, unchanged, including the "About The Author" box
- all hyperlinks remain active, including the bottom ArticleSet.com link (does not apply to print publications)
- you agree not to hold the authors nor ArticleSet.com liable for any loss profits, expenses, or any other damages resulting from the use or misuse of articles published on this website