tecnologia

tecnologia gyJuanita-Card070 Argaez cbcnpanR 16, 2016 IS pagos PACE 1 oris to View nut*ge Investiga cuales son las clasificaciones que se le da a los diferentes buscadores en la web. La World Wide Web, comúnmente llamada Web o WWW, nace a principios de los años 90, aunque sus origenes se remontan a mucho tiempo antes, ya que es fruto de la confluencia de la teoría hipertextual y de las redes de ordenador. Fue creada por Tim Berner-Lee del Centro Europeo de Física Nuclear (CERN) con el objetivo de servir como herramienta para la búsqueda y transmisión de información entre los científicos.

El hipertexto es la base funcional y estructural de la World Wide Web. podríamos decir que la Web es un hipertexto de escala relacionar documentosmultimedia (imágenes, sonidos, vídeo, etc. ) y recursos residentes en múltiples servidoresmundiales y ofrece un nuevo y más extenso medio para estudiar las consecuencias del hipertexto convertido en hipermedia. La Web se ha convertido en uno de los sewicios principales de Internet.

En pocos años, casi toda la información disponible en la red se ha volcado a la Web y se han ido abandonando otros métodos cómo Gopher, con su estructura jerárquica de acceso a a información, o las técnicas documentales que ofrecía Wais. La World Wide Web ha triunfado y millones de documentos se encuentran accesibles mediante este sistema de almacenamiento y acceso a la informacion. La Word Wide Web constituye una gran red documental de estructura hipertextual. El éxito de este modo de presentar la información, se debe principalmente a la flexibilidad del protocolo HTTP y a las capacidades del lenguaje HTML.

En la base de ambos, está la estructura hipertextual de los documentos creados, de donde protocolo y lenguaje, toman us nombres:Hypertext Transfer Protocol e Hypertext Markup Language. Lo cierto es que en la Web hoy existen otros muchos lenguajes tanto para estructurar la información como para conceptualizarla y que a través de la Web no sólo se accede a información, sino que la Web se ha convertido en la interfaz más utilizada hoy en día para la prestación de muchos de los servicios de Internet debido, sobre todo, además de a su capacidad hipertextual, a sus capacidades hipermediales, dinámicas e interactivas.

Las páginas Web precisan de una conexión a Internety de un programa de navegación que debe OF páginas Web precisan de una conexión a Internet y de un programa de navegación que deberá estar disponible en el ordenador del usuario o cliente web, ya que el funcionamiento de la Web se basa en el modelo cliente-sewidor. El programa de navegación se denomina navegador, browser, visualizador, explorador, visor, lector u hojeador (la traducción de la palabra browser no está claramente definida, aunque en los últimos años parece haber triunfado finalmente la palabranavegador).

El primer navegador fue Mosaic desarrollado por el NCSA (The National Center for Supercomputing Applications), y hoy los navegadores más populares son Internet Explorer, Netscape Navigator, Opera, Firefox, etc; aunque existen otros muchos. Analizaremos aquí distintos aspectos de la Word Wide Web como son la historia de la Web, sus aspectos tecnológicos centrándonos en el modelo de cliente-servidor, los protocolos web y las funciones y tipos de navegadores que se precisan para visualizar las páginas-; así como el enfoque de la Web como hipertexto de alcance universal.

Sin embargo, hay que tener en cuenta que la Web no es Internet, sino una pequeña parte de ella. Por lo tanto, también es preciso analizar los distintos aspectos relacionados con la red Internet, como son la historia de Internet, sus aspectos tecnológicos (protocolos, direcciones IP, URI_, dominios, etc. )y los distintos servicios que presta la red de redes.

En capítulos aparte se estudiarán otros aspectos relacionados con la búsqueda y recuperación de información en la Web y otras actividades relacionadas como son la descripción, localización, indización, clasificación y resumen de d actividades relacionadas como son documentos en la Web. También merecen una mención aparte a puesta en práctica de nuevos desarrollos en el campo de los lenguajes hipertextuales que permiten dotar de una semántica a los documentos contenidos en la Web – lo que se ha venido en denominar la Web Semántica-, y el desarrollo de los nuevos Servicios Web, así como el auge y popularidad de la llamada Web 2. basada en redes sociales y cooperativasl. En cuanto a la utilización del término World Wide Web, todavía existen oscilaciones y algunos autores utilizan el articulo masculino al intentar castellanizar el término inglés -el Web-, y otros prefieren usar el femenino por corresponder la traducción a ste género -la Web, la telaraña-.

Motores de búsqueda La diferencia fundamental entre un índice y un motor de búsqueda es que mientras los índices mantienen su base de datos «manualmente», utilizando para la inclusión de las direcciones a sus empleados o a los propios internautas que dan de alta sus páginas, los motores de búsqueda emplean para ello un robot de búsqueda. Estos robots no son otra cosa que potentes programas que se dedican a recorrer la Web automáticamente recopilando e indizando todo el texto que encuentran, formando así enormes bases de datos en las que uego los internautas hacen sus búsquedas mediante la inclusión de palabras clave.

Los robots recorren los distintos servidores de forma recursiva, a través de los enlaces que proporcionan las páginas que allí se encuentran, descendiendo como si de un árbol se tratara a través de las dis 40F páginas que allí se encuentran, descendiendo como si de un árbol se tratara a través de las distintas ramas de cada servidor. Luego, periódicamente, visitarán de nuevo las páginas para comprobar si ha habido Incorporaclones o si las páginas siguen activas, de modo que su base de datos se mantenga siempre ctualizada.

Además, estas actualizaciones se realizarán de forma «inteligente», visitando con más asiduidad aquellos servidores que cambien más a menudo, como por ejemplo los de los servicios de noticias. Y esa es la principal ventaja de los motores de búsqueda frente a los Índices temáticos: la gran cantidad de información que recogen y la mayor actualización de sus bases de datos. Además, estos robots permiten a los creadores de las páginas web la inclusión de «metatags» o etiquetas en lenguaje HTML (entre las cuales pueden incluirse metadatos normalizados tipo Dublin

Core) para resumir los contenidos de sus páginas y para incluir las palabras claves que las definan. Mediante los metadatos y las etiquetas, los motores de búsqueda podrán indizar las páginas web de forma correcta. Por el contrario, la ventaja de los Directorios frente a los motores radica en la mayor precisión y un menor ruido, aunque son menos exhaustivos que los motores de búsqueda, ya que se obtienen menos resultados. Los motores de búsqueda no son otra cosa que enormes bases de datos generadas como resultado de la indexación automática de documentos que han sido analizados previamente en a Web.

Recogen documentos en formato HTML y otro tipo de recursos. Esta tarea la lleva a cabo un programa denominado crawler (robot) que rastrea la red e s OF recursos. Esta tarea la lleva a cabo un programa denominado crawler (robot) que rastrea la red explorando todos los servidores, o limitándose a ciertos sewidores siguiendo un criterio temático, geográfico o idiomático. La posterior recuperación se lleva a cabo gracias a la gestión de esta enorme base de datos que permite diferentes tipo de consulta y ordena los resultados por relevancia, dependiendo de la estrategia de consulta.

Los motores son mas exhaustivos en cuanto al volumen de páginas, pero son menos precisos ya que no interviene la indexación humana. Fuente: Rogelio Aguilar González. Monografía sobre motores de búsqueda. Yahoo, Geocities, 2002. http://www. geocities. com/ motoresdebusquedafintroduccion. html Existen un gran número de motores de búsqueda y cada uno presenta diferencias en cuanto al volumen de páginas indexadas, la interfaz, el lenguaje de consulta, el algoritmo de cálculo de relevancia, etc. Todas ellas son causa de que, ante una búsqueda, cada motor presente resultados diferentes.

Para valorar la calidad de un buscador se deben tener en cuenta una serie de factores: la exhaustividad: es decir, el número de documentos que almacena en su base de datos la periodicidad con que se actualiza su base de datos (tanto para verificar si hay nuevas páginas, si otras se han actualizado y si otras han desaparecido) la calidad, flexibilidad y facilidad del lenguaje de consulta la calidad y facilidad que ofrecen tanto la interfaz de consulta, como la interfaz de resultados la pertinencia de los resultados la velocidad de respuesta (el tiempo que gasta en consultar el ?ndice, aplicar el algoritmo de resp 6 OF índice, aplicar el algoritmo de respuesta y ofrecer los resultados) Los motores de búsqueda a veces ofrecen la posibilidad de conocer cuántas y qué páglnas mantienen enlaces a un Sltio web.

Para ello se suele utilizar el operador link seguido de dos puntos y la LIRI_ de la que queremos conocer cuántas páginas apuntan a ella, aunque los diferentes buscadores utilizan distintos métodos: AltaVista y Google: se introduce link:dominio. También se puede reducir la búsqueda a una URL particular: link:dominio/ paginahtml. Para que no aparezcan las páginas del mismo sitio que se enlazan entre sí, se usa el comando -url: link:dominio – url:dominio. AllTheWeb: se introduce link. all:dominio. Por ejemplo, si en el buscador Google tecleamos link:wm. ‘w. google. com nos mostrará todas las páginas que apuntan a la página inicial de Google. Sin embargo, no es posible combinar una búsqueda link: con una búsqueda de términos común.

Ejemplo de Motor de Búsqueda: Go. com (Infoseek) http:// infoseek. go. com Existen buscadores como Gigablast y Exalead que permiten delimitadores por dominio, lo que permite usarlos con propósitos ibermétricos. La mayor ventaja de utilizar un motor de búsqueda es la rapidez e inmediatez, pero una gran desventaja radica en que puede resultar difícil encontrar lo que se busca si no se domina el lenguaje de interrogación a su base de datos. Si no se sabe buscar, el internauta puede encontrarse con una gran cantidad de enlaces que no le interesen (lo que se denomina «ruido») o, por el contrario, con que no le devuelvan ningún enlace («silencio»).

Pero si denomina «ruido») o, por el contrario, con que no le devuelvan ningún enlace («silencio»). Pero si se conoce minimamente el istema de busqueda – los buscadores suelen contar con alguna página de información o ayuda sobre cómo se deben realizar las búsquedas- los buscadores suelen ser una solución muy potente. para las búsquedas precisas, los motores tienen su propio lenguaje de interrogación y suelen permitir acotar las búsquedas utilizando interfaces sencillas de búsqueda que permiten la introducción de texto en alguna de estas variantes: Todas las palabras: esto permite recuperar los resultados que contengan todas las palabras que se introducen en la caja de interrogación.

Por ejemplo, buscando «hipertexto documento istona» mediante Todas las palabras, se localizarán los resultados que incluyan todos los términos, aunque estén separados: hipertexto y documento e historia. Alguna de las palabras: permite recuperar los resultados que contienen una de las palabras. Por ejemplo, la interrogación: «documento digital virtual» devolvería los resultados que contuvieran alguna de estas tres palabras: documento o digital ovirtual. La frase exacta: es la más adecuada para búsqueda por nombres propios y expresiones que deben ser buscadas en el orden especificado. Para introducirla se suelen utilizar comillas. Por jemplo, la consulta: «historia del hipertexto» localizaría los documentos que contuvieran dicha frase.

La búsqueda booleana: se trata de un tipo de interrogación que incluye alguno de los operadores lógicos. Así pues, los buscadores también permiten acotar las búsqueda por medio de la introducción de una s pues, los buscadores también permiten acotar las búsqueda por medio de la introducción de una serie de operadores entre los que destacan: Operadores lógicos o boolenos: AND: une dos palabras clave y equivale a la conjunción «y» española, ordenando a la base de datos del buscador que evuelva todos los documentos que contengan ambas palabras clave. En algunos buscadores en vez del operador AND se usan el s[mbolo «+» (suma) o el símbolo «&».

OR: equivale a la conjunción «o» y también une a dos palabras clave, pero para indicarle al buscador que devuelva todos los documentos que contengan, al menos, una de las palabras clave solicitadas. Sirve para introducir sinónimos o cuasl-sinonimos, o traducciones en la cadena de búsqueda (hipertexto or hipermedia/hipertexto or hypertext/). Otra forma de introducir este operador es el símbolo » XOR: es un operador similar al anterior, pero de carácter xclusivo. En este caso, se le dice al buscador que muestre aquellos enlaces que contengan una u otra de las dos palabras clave, pero no aquellos documentos que contengan ambas a la vez. NOT: este operador, que significa «no», tiene como fin excluir una determinada palabra clave.

Está muy indicado para restringir la búsqueda, y en algunos buscadores se sustituye por el símbolo ‘ » (resta) o por «! » Operadores posicionales: permiten medir la distancia entre los términos que se intentan localizar en el documento. Son los siguientes: NEAR: sinónimo de cerca, mejora los resultados del operador AND, al solicitar los documentos que contengan ambas palabras clave, pero sólo en el caso de que éstas no se encuentren separadas por contengan ambas palabras clave, pero sólo en el caso de que éstas no se encuentren separadas por más de 80 caracteres 0 10-25 palabras (aunque estas cantidades pueden vanar dependiendo del buscador), independientemente del orden en que aparezcan.

En algunos buscadores se puede sustituir por el símbolo «-» o utilizando corchetes «1 1» para delimitar las palabras clave que deben estar «cerca». BAR: lo mismo que el anterior, pero para indicar lo contrario: lejos. Se utiliza para localizar documentos en los que los términos de la búsqueda aparecen con 10-25 palabras o más de distancia. ADJ: adyacente. Se utiliza cuando se quieren encontrar documentos en los que aparezcan los términos juntos, sea en el orden que sea. BEFORE: es similar a AND, la única diferencia es que los términos deben aparecer en el orden especificado, pero pueden encontrarse a cualquier distancia en el mismo documento.

FOLLOWED BY: igual que el anterior, pero en este caso las palabras tendrán que aparecer en el mismo orden en que aparecen en la cadena de búsqueda. PHRASE: este operador no se suele escribir como tal ya que es más común utilizar comillas para obtener el mismo resultado. Lo que hace es tratar las palabras clave como una frase, es decir, tal y como han sido introducidas es como deben aparecer en los documentos que devuelva el buscador. Es muy útil cuando se conoce parte del contenido de un texto o para buscar por nombre y apellidos, entre otros. Es el operador que más restringe las búsquedas, por lo que si no se conocen los datos con exactitud es muy probable que se obtenga sólo silencio por parte de la base de datos. Otra form