TIPOS+DE+WEB

WEB INVISIBLE HAY DOS WEB: WEB SUPERFICIAL (VISIBLE) Y UNA WEB PROFUNDA (INVISIBLE)

INTERNET: CONJUNTO DE REDES INTERCONECTADAS ENTRE SI

WEB SUPERFICIAL: SE CONOCE COMO WEB 1.0 WWW (WEB ALREDEDOR DEL MUNDO). ES EL 20% DEL IPER


 * ESTA COMPUESTO POR PAGINAS ESTATICAS PUBLICAMENTE ACCESIBLES
 * CONSTITUYE UNA PORCION RELATIVAMENTE MUY PEQUEÑA DE TODA LA WEB (17% APROX)
 * LA INFORMACION QUE SE RECUPERA DEBE SER CUIDADOSAMENTE EVALUADA

WEB PROFUNDA: SE CONOCE COMO WEB 2.0. ES EL 80% DEL IPER
 * SE CONOCE COMO WEB INVISIBLE COMPUESTA POR:
 * CONTENIDOS DINAMICOS: RETORNAN EN RSPUESTA A UNA BUSQUEDA O ACCEDIDAS SOLO POR UNA VIA (PERTENECEN A LA WEB 2.0)
 * CONTENIDOS NO ENLAZADOS: PAGINAS QUE NO TIENEN VINCULOS ENLAZANTES CON OTRAS PAGINAS (NO UTILIZAN LA RSS)
 * CONTENIDOS DE ACCESO LIMITADO: QUE REQUIEREN REGISTRADO (HTTPS) O QUE LIMITAN EL ACCESO A SUS PAGINAS, PROHIBIENDO QUE LOS BUSCADORES QUE INCLUYAN EN SUS BASES DE DATOS (PARA ENTRAR TENEMOS QUE REGISTRARNOS)
 * CONTENIDOS “SCRIPTED”: PAGINAS QUE SOLAMENTE SON ACCESIBLES A traves de enlaces producidos por JavaScript y Flash Y ADOBE (ESTOS NO SON PROGRAMAS, SON APLICACIONES), LAS CUALES REQUIEREN UN TRATAMIENTO ESPECIAL
 * CONTENIDOS NO TEXTUALES: ARCHIVOS MULTIMEDIA(CONTENDIO AL QUE SE PUEDE ACCEDER POR DIFERENTES CONTENIDOS: MUSICA, SONIDOS, IMÁGENES), EN OTROS FORMATOS O “USENET”

CLASIFICACION DE LA WEB PROFUNDA

FRECUENCIA DE LA INDIZACION: los buscadores indexan de forma periodica y la WWW cambia diariamente (no siempre va a ser el mismo orden de las paginas, cambia periódicamente) NUMERO MAXIMO DE RESULTADOS VISIBLES: se limita los 200 y 1000 documentos, si bien el numero de resultados es mayor. URL´s DESCONECTADOS: los buscadores presentan los resultados en base a la cantidad de referencias o enlaces a los sitios, caso contrario la pagina no sera indizada
 * OPACA: SE COMPONE DE PAGINAS QUE SON EXCLUIDAS POR: EXTENSION DE LA INDIZACION: tiene un indice de mayor importancia a menor por una cuestion…
 * PRIVADA: LAS PAGINAS WEB SON EXCLUIDAS POR ESTAS CAUSAS:
 * SE ENCUENTRAN PROTEGIDAS POR CONTRASEÑAS
 * CONTIENEN UN ARCHIVO “ROBOTS.TXT” PARA EVITAR SER INDIZADAS (PARA EVITAR QUE LA PONGAMOS EN UN RANKING)
 * CONTIENEN UN CAMPOR “NOINDEX” PARA EVITAR QUE EL BUSCADOR INDICE LA PARTE CORRESPONDIENTE AL CUERPO DE LA PAGINA (PARA EVITAR ESTAR PRIMERO, SER INDIZADAS)
 * PROPIETARIA : INLUYE A AQUELLAS PAGINAS EN LAS QUE HAY UN DUEÑO Y QUE ES NECESARIO REGISTRARSE PARA TENER ACCESO AL CONTENIDO, YA SEA DE FORMA GRATUITA O PAGADA. SE DICE QUE AL MENOS 95% DE LA WEB PROFUNDA CONTIENE INFORMACION DE ACCESO PUBLICO Y GRATUITO
 * REALMENTE INVISIBLE: LAS PAGINAS NO SON INDIZADAS POR LAS SIGUIENTES RAZONES SON ALEATORIAS:
 * INCLUYEN FORMATOS COMO PDF(FORMATO DE TEXTO QUE NO SE PUEDE MODIFICAR), POST SCRIPT, FLASH, SOCKWAVE, PROGRAMAS EJECUTABLES Y ARCHIVOS COMPRIMIDOS(ZIP Y RAR)
 * SE GENRAN DINAMICAMENTE, A PARTIR DE DATOS QUE INTRODUCEEL USUARIO
 * ALMACENAN LA INFORMACION EN BASES DE DATOS, QUE NO PUEDE SER EXTRAIDA A MENOS QUE SE REALICE UNA PETICION ESPECIFICA

¿COMO BUSCAR EN LA WEB INVISIBLE?

FORMAN PARTE DE LA WEB PROFUNDA
 * LOS BUSCADORES TRADICIONALES HAN AÑADIDO FUNCIONALIDADES ADICIONALES PARA LA BUSQUEDA DE LA LLAMADA WEB PROFUNDA
 * TAMBIEN EXISTEN BUSCADORES ESPECIALIZADOS EN ESE SEGMENTO DE LA WEB, QUE NO SOLO BUSCAN EN LA WEB SUPERFICIAL, SINO TAMBIEN EN LA WEB INVISIBLE


 * LAS BIBLIOTECAS DIGITALES, CATALOGOS DE BIBLOTECAS, BASES DE DATOS DE BIBLIOTECAS, BASES DE DATOS BIBLIOGRAFICOS.
 * BASES DE DATOS.
 * REVISTAS ELECTRONICAS Y ARCHIVOS DE DOCUMENTOS.
 * DOCUMENTOS EN FORMATOS NO INDIZABLES, (pdf, ppt, doc, mp3, wav, avi, mpeg, etc).
 * CATALOGOS DE EDITORIALES, DIRECTORIOS DE PUBLICACIONES PERIODICAS.
 * ARCHIVOS (INSTITUCIONES Y ORGANISMOS DE GOBIERNO).
 * REPOSITORIAOS DE ARTICULOS DE REVISTAS, TESIS Y LITERATURA GRIS.
 * DIRECTORIOS DE BASES DE DATOS.
 * GUIAS DE SITIOS, REVISTAS ELECTRONICAS, OBRAS DE REFERNCIAS: ENCICLOPEDIAS, DICCIONARIOS, TESAUROS, ETC.
 * FORO, BLOGS, NOTICIAS(DIARIOS).
 * SITIOS DE REMATES, PAGINAS BLANCAS/AMARILLAS, DIRECTORIOS.
 * EVISTAS ELECTRONICAS, EN LA QUE ES NECESARIO UN REGISTRO PREVIO Y LAS QUE SOLO SE PUEDEN RECUPERAR LA INFORMACION MEDIANTE BUSQUEDAS EN SU BASE DE DATOS.
 * ORGANISMOS PUBLICOS DE GOBIERNO, ONGs, ETC…QUE EN SUS SITIOS WEB DISPONEN DE CONSULTAS A SUS BASES DE DATOS.

DIRECTORIO DE BIBLIOTECAS







EL ARCHIVO DE INTERNET
 * ASUME EL RETO DE PRESERVAR EL PASADO DEL INTERNET
 * LA MAYOR PARTE DE LA INFORMACION QUE CONTIENE ES ESTADOUNIDENSE
 * SE INGRESA A TRAVES DEL SITIO []
 * DE SUS SECCIONES SE DESTACA WAYBACK MAchine, QUE CONTIENE MILES DE MILLONES DE PAGINAS, GRABADAS DESDE 1996