woensdag 28 oktober 2015

Tarea modulo 4 Web Superficial y Web Profunda



Tarea modulo 4   Web Superficial y Web Profunda


Web superficial o visible:


Es accesible por robots(bots), nosotros podemos consultarles con una búsqueda.

Web profunda o invisible: 
Accesible mediante bases de datos pero inaccesible por robots. Ya que sus páginas no tienen URL fija.

La web invisible se dividió por Sherman Y Price en Web opaca, privado, propietaria, y realmente invisible.

LA Web Opaca: (the opaque web)
>por economía: no todas las páginas son indizadas
>por frecuencia: La frecuencia de indización no permita incluirlas a todas.
>por limitar el número de resultados que se muestran
>por falta de link, no sido han referenciado en otros documentos porque no tienen relevancia.

La Web Privada (the private web)
>Páginas con contraseñas
>contienen archivo "robots.txt": no se puede indizar
>Contienen campo "noindex", en partes no se puede indizar.
Si los dueños no quieren compartir, no se puede franquear esta barrera.

La Web propietaria: (the proprietary web)
Tiene que registrar, de forma gratuita o arancelada

La Web realmente invisible (the truly invisible web)
Se compone de páginas que no pueden ser indizadas por
limitaciones técnicas de los buscadores, programas ejecutables y archivos comprimidos, páginas generadas dinámicamente, es decir, que se generan a partir de datos que introduce el usuario, información almacenada en bases de datos relacionales, que no puede ser extraída a menos que se realice una petición específica.

Un par de recursos de búsqueda en la web profunda:

> The WWW Virtual Library: el más antiguo iniciado por Tim Berners
Lee, el creador de la web
>Infoplease: Es posible acceder a un buen número de enciclopedias, atlas, y biografías.
>DeepWebTech: Los motores de búsqueda abarcan la ciencia, medicina y negocios. Puede consultar las bases de datos subyacentes en la Web profunda
> TechXtra: ingeniería, matemáticas e informática. Es posible navegar a través de una extensa lista de revistas gratuitas especializa
das de ingeniería, documentos técnicos, descargas y podcasts.

Lluis Codina: "La web no indizable" es un término mucho mas adecuado que "Internet invisible"

¿Y como se llama esto termino en Inglés?

vrijdag 16 oktober 2015

Tarea Herramientas de Búsqueda y P2P



 Tarea Herramientas de Búsqueda y P2P

 No sabía que un buscador estaba compuesto por cuatro componentes básicos:
un robot o "spider"
un motor de indexación,
los índices
un motor de búsqueda.

Pensaba que solo buscaba, y naturalmente hacen mucho más.  
Sabía que se usan "capcha" en muchos foros y comunidades para evitar que entre un buscador non-humano, un robot.

Y ahora aprendo que la indexación analiza, condensa y organiza la información. Y que esta indexación se hace por palabras claves o conceptos. Mientras que los índices o 'ficheros inversos' asocian esto a documentos web relacionadas. El motor de búsquedarecorre los índices inversos buscando los términos relacionados con la consulta y las presenta. No busca sobre la Web entera, por lo cuanto recupera una muy pequeña parte de todo lo que realmente hay en Internet.

Dentro de los buscadores conocía a Google, Bing y Yahoo, pero no Lycos y DuckduckGo, parece que sea el único que
no almacene nuestros datos de registro.


Nunca utulicé metabuscadores, los “buscadores en buscadores y directorios”
El metabuscador tiene que dar formato a cada petición de acuerdo a la interfaz de cada uno de los buscadores y presenta los resultados  ordenados por relevancia.

El curso enumera cincos. Metacrawler, Zoo, IBoogie, Ixquick y Dogpile. Como Dogpile usa (el motor de) Ask.com con quien tengo muy pero muy malas experiencias, no voy a entrar nunca mas en Ask.com.

Mi primera búsqueda <free university courses online
1 Zoo da resultados ADS primero en todo sus páginas. Muy muy molesto.
2 Iboogie es muy superior en esta búsqueda.
3 Ixquick da solo  8 resultados, increíble (no hay más páginas?)
4 Solo Google da MOOC como resultado en pagina 2

Otra: <aprender a programar gratis>
IBoogie y Ixquick me parecen equilibrados en esta búsqueda.
 
Comparando los directorios temáticos que organizan y clasifican manualmente de Yahoo, DMOZ, Portal SEO, exite:

SEO=> directory not found
DMOZ no da el resultado buscado (el libro de John J. Murphy)
Yahoo da más resultados buenos que EXITE . La organización de exite no me gusta tanto.
Google: Solo GOOGLE pone el resultado que estaba buscando en primer lugar, arriba, como número uno,  como el libro de John J. Murphy ha recibido la mayoría de las citaciones.

Conclusión: Se puede confiar más en Google que en los directorios, Google  pone también las reseñas científicas de más éxito arriba en el buscador. Igual como los más citados.

Ahora voy a probar los GUIAS

http://goo.gl/8tDn1i: ¿Pero que puedo hacer con esto? Es un portal sin buscador…

Buscamos: <aire comprimido y compresores>

http://goo.gl/F4AlNa Da un montón de resultados (160.000), todos específicas.

No hay nada a buscar. Supongo que solo se puede entrar en la biblioteca buscando títulos de libros. Tienen une escuela de ingeniera, pero nada a encontrar sobre este tema.


http://goo.gl/OyScXJ: La página http://biblioteca.ua.es/es/guias-tematicas/guias-tematicas.html no existe.
Pero hay un cuadro de búsqueda.
Este cuadro re direcciona a….GOOGLE
Hay solo 1 resultado:
Adv.www.atlascopco.com/Aire-Comprimido
Compresores de Aire de Alta Calidad Servicio 24/7 ¡Visita Nuestra Web!  
Esto es la constructora market leader en Europa para la cuál he trabajado 15 años como ingeniero de venta.

En el departamento ingeniería: Lo siento, su búsqueda por aire comprimido y compresores no produjo ningún resultado.

Finalmente los agentes, con sus Software especializado.

Como no brindan ayuda directa a mí, no pueden hacer nada para mí.
Búsqueda en Yahoo sobre agente de búsqueda:
Que es un agente de busqueda?
Me gustaría saber que es un agente de búsqueda
Respuestas
Calificación
reyco.love
Mejor respuesta:  Es simplemente un perfil estandarizado q puedes diseñar facilmente ya con tus datos y tus preferencias y cada vez q haya información nueva, actualizaciones o simplemente en la primera búsqueda te mande todos los resultada a la pantalla, o a tu correo. Y así hasta q lo desactives o termine su ciclo.
****
Mi comentario (yo, Rudy Bourgeois):
¿Como puedo diseñar un perfil así y lograr que sea operativo?

******************************************
Así se terminó la tarea
Gracias por la atención.

******************************************
******************************************