descargar archivo pdf

Transcripción

descargar archivo pdf
Uso de Fuentes Abiertas para la Inves4gación Penal (Día 1 – Sesión Matu'na) Bogota, Colombia 15 y 16 de Setiembre 2015 Presentado por Colin Ehren en asociación con la Inicia'va StAR 15 de se'embre de 2015 © C&SE 2015
Obje4vos del Taller Ampliar el conocimiento sobre Internet a fin de tomar consciencia de: •  Los peligros existentes cuando se u'liza Internet para realizar una inves'gación; •  Cómo encontrar la información deseada; •  Cómo u'lizar internet como una herramienta efec'va para inves'gaciones; y •  Cómo demostrar los hallazgos obtenidos. 15 de se'embre de 2015 © C&SE 2015
Obje4vos – Día 1 •  Tomar consciencia respecto de las huellas Internet (“Internet Footprints”) y las consideraciones de seguridad/privacidad asociadas a ellas. •  Comprender las diferencias entre Buscadores, Meta-­‐
buscadores, Directorios y la Web Invisible. •  Emplear estrategias para inves'gaciones lícitas, é'cas y efec'vas. •  Tomar conciencia de las herramientas de información de redes •  Comprender cómo minimizar el riesgo de comprometer las inves'gaciones en internet. 15 de se'embre de 2015 © C&SE 2015
Día 1 -­‐ Esquema •  “Huellas en la arena”.
•  Elementos clave sobre motores de búsqueda e
investigación.
•  Estrategias de Búsqueda y herramientas de
información de la red.
•  Minimización del compromiso.
15 de se'embre de 2015 © C&SE 2015
Huellas en la arena ¿Qué riesgos supone el uso Internet para inves4gaciones, búsquedas y operaciones de inteligencia? 15 de se'embre de 2015 © C&SE 2015
Huellas en la arena Las organizaciones acceden a Internet de diversas maneras, como ser desde:  
 
 
 
 
 
 
 
Computadoras corpora'vas en red Computadoras corpora'vas autónomas Computadoras recuperadas autónomas Computadoras encubiertas/anónimas autónomas Computadoras encubiertas/anónimas en red Trabajando desde el hogar (con computadoras para “Home-­‐office” -­‐ autónomas o en red) Disposi'vos Móviles Cyber-­‐cafés 15 de se'embre de 2015 © C&SE 2015
Huellas en la arena Los criminales saben que las organizaciones usan Internet para sus inves'gaciones. Hay varias cues'ones relacionadas con estos métodos de acceso. Recomendaciones •  Las estaciones de trabajo corpora'vas, en red o autónomas, deberían ser usadas únicamente para inves'gaciones genéricas, tales como búsquedas de información sobre las tendencias delic'vas o publicaciones de inves'gaciones en si'os web acreditados. •  No deberían u'lizarse las estaciones de trabajo recuperadas autónomas, a menos que se pueda garan'zar que estas han sido “limpiadas” por una empresa debidamente acreditada y aprobada. 15 de se'embre de 2015 © C&SE 2015
Huellas en la arena Recomendaciones (Cont.) Todas las búsquedas sensibles o detalladas, o las inves'gaciones de fuentes abiertas deben llevarse a cabo a través de una PC encubierta o anónima y registrada, u'lizando una conexión encubierta o anónima. ¿Por qué? Porque la huella de internet podría comprometerlo a usted, a sus colegas o a la inves'gación u operación de Inteligencia en la que esté par'cipando su organización o socio. 15 de se'embre de 2015 © C&SE 2015
Huellas en la arena Cada vez que u'liza Internet, usted deja sus huellas en los si'os web que visita. El tamaño de su huella depende de las “variables ambientales” que su computadora y navegador de Internet transmitan, y también de su ac'vidad en la web. 15 de se'embre de 2015 © C&SE 2015
Huellas en la arena Usuario
Webmaster
Servidor Web
Reportes
ID del Dispositivo
Navegador/Software
 
 
Acceso a
Internet
Registros
De Acceso
Al hacer click en un enlace, su huella de internet es enviada a un Servidor Web, el
que luego envía a usted al sitio web solicitado.
El Webmaster que controla el Servidor Web puede ver su huella para recibir
información sobre usted o su Organización (ubicación física, ISP, sus intereses, tipo
de PC/Software, etc.).
15 de se'embre de 2015 © C&SE 2015
Huellas en la arena  
 
 
 
Cada página web que usted consulta deja una huella individual en un Servidor Web. Sea cauteloso de las huellas que deja al visitar ciertos si'os web, ya que podrían comprometer a su organización. De ser necesario consultar: badguy.com desde your.org Sus huellas pueden incluir;  
El nombre de su computadora (o gateway).  
La dirección de IP de su computadora, o su proxy gateway.  
El URL de la página que ha vistado previamente. (Los Webmasters usan esta información para determinar qué páginas web conducen a los navegadores a su sitio.) 15 de se'embre de 2015 © C&SE 2015
Huellas en la arena Usuario
“términos de búsqueda”
Google.com
webmaster
http://www.google.com/keywords=términosdebúsqueda
Hackdiary.com
webmaster
Huella:
- @your.org O
- [email protected]
El webmaster de Google.com conoce sus “términos de búsqueda”
El webmaster de hackdiary.com conoce qué “términos de búsqueda” ha utilizado para
encontrarlo
15 de se'embre de 2015 © C&SE 2015
Huellas en la arena En Resumen -­‐ Su huella de internet podría comprometer una inves'gación u operación de inteligencia en la que esté involucrada su organización o agencia encargada de la aplicación de la ley. 15 de se'embre de 2015 © C&SE 2015
Huellas en la arena 15 de se'embre de 2015 © C&SE 2015
Huellas en la arena 15 de se'embre de 2015 © C&SE 2015
Huellas en la arena 15 de se'embre de 2015 © C&SE 2015
Huellas en la arena 15 de se'embre de 2015 © C&SE 2015
Huellas en la arena 15 de se'embre de 2015 © C&SE 2015
Huellas en la arena -­‐ Dominios y Whois 15 de se'embre de 2015 © C&SE 2015
Huellas en la arena -­‐ Dominios y Whois 15 de se'embre de 2015 © C&SE 2015
Huellas en la arena – Términos de Búsqueda 15 de se'embre de 2015 © C&SE 2015
Huellas en la arena – Términos de Búsqueda 15 de se'embre de 2015 © C&SE 2015
Huellas en la arena – Surfing Paralelo El Surfing Paralelo puede asociar una PC encubierta o anónima a su organización. El Surfing Paralelo ocurre cuando los mismos si'os web y términos de búsqueda son ingresados desde una estación de trabajo corpora'va, y luego son u'lizados desde una estación de trabajo encubierta o anónima. Los Webmasters pueden ejecutar reportes que iden'fican quién ha estado u'lizando los mismos términos de búsqueda, etc. 15 de se'embre de 2015 © C&SE 2015
Huellas en la arena – Surfing Paralelo. Usuario #1: deja huellas “your.org” al visitar “target.com”
Usuario #2: deja huellas “encubiertas” al visitar “target.com”
El Usuario “encubierto” ahora puede ser reconocido como un visitante de
“your.org.uk”.
Usuario #1
your.org
Usuario #2
target.com
[email protected]
Incluso si Ud. impidiera que los términos de búsqueda fuesen transmitidos, el
Webmaster de target.com aún podría hacer asociaciones a partir de los high
volume hits o los patrones de búsqueda similares que acceden a las mismas
páginas.
15 de se'embre de 2015 © C&SE 2015
Huellas en la arena – Surfing Paralelo 15 de se'embre de 2015 © C&SE 2015
15 de se'embre de 2015 © C&SE 2015
Huellas en la arena – Surfing Paralelo 15 de se'embre de 2015 © C&SE 2015
Huellas en la arena – Anuncios / Imágenes Usted deja huellas en cada si'o web que visita. Si esos si'os exhiben anuncios o imágenes de terceros, sus huellas son automá'camente enviadas a ellos también. No es necesario que usted visite el si'o de un tercero para que aquel obtenga información suya. 15 de se'embre de 2015 © C&SE 2015
Huellas en la arena – Anuncios / Imágenes. Los sitios web pueden incluir anuncios o imágenes (y, por tanto, cookies) de terceros.
AdultFriend.com
Ad-Image.com
Hot_stuff
[email protected]
Su Perfil
Historial de navegación
Cookies en su PC
AdultFriend.com ID#_201
insurance.co.uk ID#_4873
traffikid.com ID#_539
Ad-Image.com ID#_435349
Insurance.co.uk
Joanne Hotman
[email protected]
Dirección y teléfono
Historial de navegación
Traffikid.com
Africa_man
[email protected]
Historial de navegación
AdultFriend.com
Hot_stuff
[email protected]
Historial de navegación
Likes / Dislikes
Insurance.co.uk
Joanne Hotman
[email protected]
Dirección y teléfono
Automóviles / Joyas
Historial de navegación
Traffikid.com
Africa_man
[email protected]
Historial de navegación
Contactos
Empresas como “Ad-Image.com” son capaces de compilar un perfil significativo
sobre Ud. y sus hábitos de navegación, el cual luego pueden pasar o
comercializar a sus socios o clientes.
15 de se'embre de 2015 © C&SE 2015
Huellas – Si4os Web Afiliados Asegúrese de cerrar la sesión en todas las plataformas de redes sociales como Google+, Facebook y Twi@er, antes de iniciar una inves'gación confidencial o sensible. Cuando visita otras plataformas, Ud. podría estar iniciando una sesión incluso si no ha creado una cuenta para esa plataforma específica. 15 de se'embre de 2015 © C&SE 2015
Huellas – Si4os Web Afiliados 15 de se'embre de 2015 © C&SE 2015
Huellas – Si4os Web Afiliados 15 de se'embre de 2015 © C&SE 2015
Huellas en la arena Pasos fundamentales para crear y mantener una presencia-web anónima Desactive cualquier elemento que registre su actividad Si está utilizando MS Internet Explorer: •  Desactive las cookies. •  Limpie el historial de carpetas, y •  Rutinariamente remueva los archivos almacenados en caché. Utilice medios de almacenamiento extraíbles para guardar cualquiera de los
archivos descargados. Solamente utilice el internet de su PC para navegar. No use el Word
Processor para negocios o escritos personales. Cerciórese que todos los detalles de su conexión sean anónimos. Asegúrese que la configuración de su sistema se lo más estándar posible. Use software Anti-Virus y Anti-Spyware.
Asegúrese de que su Firewall esté configurado correctamente.
15 de se'embre de 2015 © C&SE 2015
La estación del “Cyber-­‐Espacio” de Mario Profaca hcp://mprofaca.cro.net 15 de se'embre de 2015 © C&SE 2015
Huellas en la arena Ir a – hcp://centralops.net •  Iden'fique su dirección de IP. •  Navegue hasta el “Browser Mirror”. •  ¿Puede iden'ficar alguna diferencia con los resultados de sus colegas? Use un Buscador para encontrar información sobre su dirección de IP. •  ¿Encontró algo interesante? Búsquese a Ud. mismo o a su nombre de usuario u'lizando un motor de búsqueda. •  ¿Encontró algo que usted no sabía? 15 de se'embre de 2015 © C&SE 2015
Día 1 -­‐ Esquema •  “Huellas en la arena”.
•  Elementos clave sobre motores de búsqueda e
investigación.
•  Estrategias de Búsqueda y herramientas de
información de la red.
•  Minimización del compromiso.
15 de se'embre de 2015 © C&SE 2015
Motores de búsqueda Los motores de búsqueda construyen un índice •  El motor de búsqueda usa un Robot (Spider/Crawler) para encontrar páginas web. •  Las páginas encontradas luego son almacenadas en caché en los centros de datos. •  Los datos de las páginas web son categorizados. •  Los datos de las páginas web son evaluados para crear un ranking. •  El centro de datos se actualiza con información sobre la categoría y el ranking. •  El robot del motor de búsqueda re-­‐visita las páginas web encontradas. 15 de se'embre de 2015 © C&SE 2015
Motores de búsqueda 15 de se'embre de 2015 © C&SE 2015
Motores de búsqueda Visualización del Caché Abrir el navegador de internet. Ir a Google Realizar cualquier búsqueda. Hacer clic en el pequeño triángulo verde adyacente a la dirección web para los resultados. •  Luego seleccionar <cached>. • 
• 
• 
• 
•  Para ver cuántas páginas Google almacena en caché de ese si'o web se usa el comando “site”, que se encuentra en el cuadro de búsqueda; •  Ejemplo de sintáxis <site:ford.com> 15 de se'embre de 2015 © C&SE 2015
Motores de búsqueda Buenos para búsquedas detalladas. Inútiles para búsquedas temáticas.
15 de se'embre de 2015 © C&SE 2015
Motores de búsqueda Principales herramientas de búsqueda u4lizadas en Colombia 1. 
4.
5. 
6. 
8.
9.
12.
13.
14.
18.
19.
28.
15 de se'embre de 2015 google.com.co google.com live.com yahoo.com wikipedia.org msn.com el'empo.com (No'cias) google.es minuto30.com (No'cias) elespectador.com (No'cias) ask.com semana.com (No'cias) © C&SE 2015
Robots.txt Centro de Datos 15 de se'embre de 2015 © C&SE 2015
Robots.txt •  El Robots.txt es un archivo que un Webmaster ingresa a un Servidor Web indicando a los Robots del Buscador (y a otros Crawlers) qué páginas no quisiera que estos visiten. •  No es obligatorio, pero por lo general los motores de búsqueda responden a esto, es decir cumplen con lo que se les solicita evitar. •  No es un método para evitar que los buscadores ingresen a un si'o (es decir, no es un firewall o una protección por contraseña). •  Es como un cartel que dice “Por favor No Entrar” en una puerta sin traba. •  U'liza un sistema de declaraciones (“system of statements”). Para excluir todos los Robots del Servidor. Para excluir a todos los Robots de parte del Servidor. User-agent: *!
Disallow: /!
Para dar acceso total a los Robots. User-agent: *!
Disallow: /cgi-bin/!
Disallow: /tmp/!
Disallow: /junk/!
User-agent: *!
Disallow:!
Para dar acceso total a un solo Robot. Para excluir solo un Robot del Servidor. User-agent: goodbot!
Disallow:!
User-agent: BadBot!
Disallow: /!
15 de se'embre de 2015 User-agent: *!
Disallow: /!
© C&SE 2015
Robots.txt 9. 
hcp://www.yahoo.com/robots.txt 1. 
hcp://www.mujerhoy.com/robots.txt 2. 
hcp://www.diariolasamericas.co/robots.txt 10.  hcp://www.google.co/robots.txt 3. 
hcp://www.elheraldo.co/robots.txt 11.  hcp://www.facebook.com/robots.txt 4. 
hcp://www.myspace.com/robots.txt 12.  hcp://www.whitehouse.gov/robots.txt 5. 
hcp://www.twicer.com/robots.txt 13.  hcp://www.cisco.com/robots.txt 6. 
hcp://www.youtube.com/robots.txt 14.  hcp://www.senalcolombia.gov.co/robots.txt 7. 
hcp://www.bing.com/robots.txt 15.  hcp://www.elnuevosiglo.com.co/robots.txt 8. 
hcp://www.fuac.edu.co/robots.txt 16.  hcp://www.cromos.com.co/robots.txt 15 de se'embre de 2015 © C&SE 2015
Tamaño de Internet A partir de diciembre de 2014
•  +915 millones de Sitios Web
•  +14.3 billones de Páginas Web en vivo
Indexados por Buscadores
•  Google: +45 miles de millones
•  Bing/Yahoo: +30 miles de millones
•  Lycos: +24 miles de millones
•  Baidu: +5 miles de millones (apróx.)
•  Yandex: +6 miles de millones
•  Terra: +2 miles de millones
15 de se'embre de 2015 © C&SE 2015
Red Profunda o Invisible Si'os está'cos (poco cambio de contenido). Información Genérica y de Nicho. Fácilmente indexados por los buscadores. Si'os especialista/Nichos que u'lizan Robots.txt. Si'os web con miles de millones de páginas almacenadas en bases de datos construidas dinámicamente para cada búsqueda. Los buscadores no pueden indexar facilmente este contenido. Open Web Web Profunda / Invisible Redes internas de compañías (Intranet), si'os y redes privadas. Los buscadores no pueden indexar este contenido. Zona criminal de Internet. Acceso a través de soMware especializado. Los buscadores no acceden a este contenido. 15 de se'embre de 2015 Web Privada Web Oscura © C&SE 2015
Red Profunda o Invisible Julio 2001 - Michael Bergman (brightplanet.com)
World Wide Web Web Profunda/Invisible Web Abierta 550x mayor 19 Terabytes 7,500 Terabytes 30 miles de millones de documentos 550 miles de millones de documentos +36.000.000 si'os +200.000 si'os Los 60 más grandes con'enen 40x información de la WWW •  Un estudio de 2004 identificó +330,000 sitios de la
Web profunda.
•  Esta ha crecido casi exponencialmente desde
entonces.
15 de se'embre de 2015 © C&SE 2015
Fundamentos de la Inves4gación •  Definir el tema: •  Especifique qué es lo que debe encontrarse. •  Iden'fique material de palabras clave (“Keywords”) para la búsqueda, incluyendo: •  Temas, Nombres, Direcciones, Números de teléfono, Direcciones de correo electrónico, Nombres de Usuario, Inicios de sesión (“Logins”), Empresas y negocios, etc. •  Iden'fique Acrónimos o términos informales para estos temas o lugares. •  Iden'fique apodos comunes para las personas, lugares o empresas. 15 de se'embre de 2015 © C&SE 2015
Fundamentos de la Inves4gación •  Forme una Estrategia. •  Iden'fique elementos primarios y secundarios a buscar. •  Qué herramientas se ha de u'lizar: •  Motor de búsqueda, directorio Web, meta-­‐Buscador, Web Invisible, Blogs, Redes Sociales, Chat, grupos de no'cias, foros, etc. •  Métodos de búsqueda; •  Búsqueda Estándar o Avanzada •  Palabras sueltas, Frases, Secuencias Numéricas, Combinaciones. 15 de se'embre de 2015 © C&SE 2015
Fundamentos de la Inves4gación •  Manténgase Enfocado •  Los clips de video entretenidos son una pérdida de 'empo y esfuerzo. •  Páginas de Búsqueda Avanzada •  Si se encuentran disponibles, consúltelas. •  Iden'fique la mejoración en la capacidad de búsqueda. •  Resultados •  Filtrar resultados. •  Seguir pistas per'nentes. •  Guardar/Descargar los resultados. •  Usar eficientemente las Carpetas de Favoritos. 15 de se'embre de 2015 © C&SE 2015
Fundamentos de la Inves4gación •  Problema habitual Pág.
Resultados
Link 1
Link2
Link 3
Pág.
Resultados
Link 1
Link2
Link 3
15 de se'embre de 2015 Pág. 1
Link A
LinkB
Link C
Pág. A
Link 7
Link 8
Link 9
Pág. 7
Link X
LinkY
Link Z
Estos links suelen ser olvidados y se dejan sin explorar.
Pág. 1
Link A
LinkB
Link C
Pág. 2
Link A
LinkB
Link C
Pág. 3
Link A
LinkB
Link C
Pág. A
Link 7
Link 8
Link 9
Pág. 7
Link X
LinkY
Link Z
Abra múl4ples enlaces ú4les en sus propias ventanas o pestañas con el clic derecho. Luego haga clic, a través de las pestañas, o u4lice la función ALT-­‐TAB para alternar entre ventanas abiertas. © C&SE 2015
Fundamentos de la Inves4gación Use la herramienta adecuada para el trabajo
adecuado.
15 de se'embre de 2015 © C&SE 2015
Directorios Buenos para búsquedas temáticas. Inútiles para búsquedas detalladas.
15 de se'embre de 2015 © C&SE 2015
Bibliotecas Virtuales Buenos depósitos de información.
15 de se'embre de 2015 © C&SE 2015
Meta-­‐Buscadores Búsquedas con Múltiples Fuentes
15 de se'embre de 2015 © C&SE 2015
Lógica Booleana 15 de se'embre de 2015 © C&SE 2015
Lenguaje de los Buscadores Comparación de Motores de búsqueda
Google Yahoo Bing Ask Booleano Predeterminado = AND -­‐keyword keyword OR keyword (keyword keyword) Predeterminado = AND -­‐keyword keyword OR keyword Predeterminado = AND -­‐keyword keyword OR keyword (keyword keyword) Predeterminado = AND -­‐keyword keyword OR keyword Fraseo “keyword keyword” “keyword keyword” “keyword keyword” “keyword keyword” Derivación de palabras clave Automá'ca – no para todas Automá'ca – no para todas No No Operadores in'tle:keyword allin'tle:keyword keyword site:domainname inurl:keyword allinurl:keyword keyword link:webpage Muchos más… in'tle:keyword site:domainname inurl:keyword in'tle:keyword domain:domainname inanchor:keyword inbody:keyword ip:ipaddress in'tle:keyword site:domainname inurl:keyword filetype:fileextension filetype:fileextension filetype:fileextension No 44 opciones – Página de Búsqueda Avanzada 41 opciones – Página de Búsqueda Avanzada 41 opciones 6 opciones – Página de Búsqueda Avanzada related:webpage No No No Búsqueda por Tipo de Archivo Búsqueda por idioma Páginas Similares 15 de se'embre de 2015 © C&SE 2015
Encontrando información básica Prác4ca de Google y de Búsqueda Avanzada 15 de se'embre de 2015 © C&SE 2015
Repaso •  Huellas en la Arena: • 
• 
• 
• 
Compar'r datos automá'camente puede poner en peligro las inves'gaciones. Surfing Paralelo, Anuncios e Imágenes, Redes Sociales, y si'os web afiliados. Ajustes de Navegación. Búsquedas Whois, y las propias huellas. •  Elementos clave sobre motores de búsqueda e inves'gación: • 
• 
• 
• 
• 
• 
Construcción de un índice y Robots.txt. Web Profunda/Invisible Fundamentos de la Inves'gación Directorios Web, Bibliotecas Virtuales, Meta-­‐Buscadores Lógica Booleana Prác'ca de Google y Búsqueda Avanzada 15 de se'embre de 2015 © C&SE 2015
Repaso ¿Preguntas? 15 de se'embre de 2015 © C&SE 2015
Uso de Fuentes Abiertas para la Inves4gación Penal (Día 1 – Sesión Matu'na) Colin Ehren [email protected] +44 (0)7941 338 449 15 de se'embre de 2015 © C&SE 2015

Documentos relacionados

descargar archivo pdf

descargar archivo pdf •  Los  peligros  existentes  cuando  se  u'liza  Internet  para   realizar  una  inves'gación;   •  Cómo  encontrar  la  información  deseada;   •  Cómo  u'lizar ...

Más detalles