Estados Unidos crea Memex, un motor de búsqueda capaz de rastrear la Deep Web

4

Hace un año, la agencia estadounidense DARPA (Defence Advance Research Projects) anunció un proyecto para crear un potente motor de búsqueda, Memex, capaz de encontrar en la Deep Web todo lo que no está indexado por Google y otros motores de búsqueda.

Pornografía infantil, tráfico de drogas y humanos… La llamada Deep Web o web profunda  es un nido de actividades ilegales, un mercado en lo más oscuro de Internet donde los ciberdelincuentes campan a sus anchas sabiendo que pueden actuar a salvo al margen de la ley. Hasta ahora.

DARPA ha mostrado a Scientific American una prueba de este software y ha revelado más detalles sobre su funcionamiento. El motor de búsqueda Memex es capaz de bucear en la dark net, y revelar la información que circula ahí. El buscador cuenta con avanzadas características que permiten descubrir datos de los usuarios, hacer un seguimiento de las personas que navegan en la Deep Web y analizar la información recopilada.

Internet es mucho más grande de lo que pensamos. Se estima que los motores de búsqueda tradicionales sólo nos dan acceso al 10% (o incluso 5% según la fuente) del contenido de la web. El 90% restante es lo que se conoce como Deep Web.

memex mapa

Una parte de los contenidos de la web profunda solo son accesibles a través de software específico, como TOR (The Onion Router), que permite compartir información de forma secreta mediante conexiones punto a punto. DARPA ha trabajado junto a 17 equipos de investigadores de compañías privadas y universidades para crear este buscador.

Cómo funciona Memex

La agencia, por motivos obvios, ha dado muy poca información sobre el buscador, y de cómo lo usarán las autoridades y los investigadores para perseguir a los cibercriminales. Pero de la demostración que han realizado a la publicación estadounidense se extrae que tan importante como la capacidad de Memex para extraer la información de la parte más profunda de internet son las herramientas que permiten identificar las relaciones entre las diferentes piezas de los datos. Esto ayuda a los investigadores a crear mapas de datos que permiten crear patrones espaciales y temporales.

Precisamente la semana pasada hablábamos con Silvia Barrera, Jefa del Grupo de Redes de la Policía sobre la Deep Web. La inspectora de Policía aseguraba que la web profunda no es tan anónima como podemos creer, ya que siempre quedan rastros, y ahora con tecnologías como la creada por DARPA, cada vez se arroja más luz sobre la dark net.

 

 

About Author

Periodista especializada en tecnología y ciberseguridad. Presentadora del programa sobre seguridad informática y tecnología Mundo Hacker. @monivalle

4 comentarios

  1. Una puntualización.

    La deep web no solo va asociado a actividades delictivas, sino que como comentáis al principio, es todo aquello que no es indexable por un buscador. Esto hace que cosas como tor solo sea un pequeño porcentaje de lo que es la deep web.

    Por poner un escenario hipotético. Si un buscador quiere indexar una base de datos de una biblioteca que solo este accesible mediante la cumplimentación de de los campos de un formularios como «autor», «título», «ISBN», etc. El buscador no sabrá como completar esos campos y terminará por no indexar el contenido de esa base de datos.

    Si no me confundo, también entra en la definición todos aquellos sitios protegidos por contraseña y que por tanto no son alcanzables por un buscador, pero que por contra, si forman parte de la web.

    Hay que decir que hay muchos avances en ese tema (como rellenar de forma automática los datos de los campos) y que posiblemente Memex haga algo parecido para llegar a sitios donde un buscador puramente tradicional no llegaría.

    La conclusión importante a la que quiero llegar es que de ese 90-95% de la web que no es alcanzable, solo un pequeño porcentaje esta relacionado con actividades delictivas, el resto, es simplemente contenido de lo más normal o privado que simplemente no está accesible mediante un buscador.

    • Por supuesto. No toda la información contenida en la Deep Web está relacionada con contenido delictivo. Como dices, gran parte son sitios web protegidos por contraseñas, documentos no indexables, bases de datos… Lo que sí que es cierto es que hporsus características es un refugio para la ciberdelincuencia y no es difícil encontrar contenido ilícito en ella.

  2. Por otra parte, la Web (en general) es sólo una parte, aunque muy importante, de Internet. El buscador Memex es capaz, por tanto, de buscar en una región de una parte de Internet. Queda todo un mundo de protocolos y servicios en Internet. Los servicios de correo electrónico, las redes P2P, IRCs, etc, son parte de Internet pero no de la Web. Especialmente interesante es la parte de Internet conocida por Darknet, de muy difícil acceso, donde se usan protocolos y puertos no estándar. Son redes privadas superpuestas a la red de acceso general. Por estas redes circulan contenidos de muy difícil control, salvo que se conozcan los procedimientos y claves de acceso. Finalmente, una región que está adquiriendo importancia es el espacio oscuro de direcciones o «agujero negro» de Internet. Se trata de un conjunto de direcciones a las que no es posible llegar, por diversas causas. Pueden ser direcciones sin uso, asignadas a los antiguos equipos militares que constituían la MILNET, o parte militar que se separó de ARPANET. También pueden ser direcciones no asignadas por proveedores de servicios de Internet, direcciones en reserva para ampliar redes, fallos de configuración, etc. Muchos ataques se lanzan suplantando estas direcciones (que son conocidas), de forma que parecen provenir del «agujero negro». Con ser mucho lo que puede lograr Memex, la Red es tan grande y compleja que resulta imposible de dominar.

Leave A Reply