descargar archivo pdf
Transcripción
descargar archivo pdf
Uso de Fuentes Abiertas para la Inves4gación Penal (Día 1 – Sesión Matu'na) Bogota, Colombia 15 y 16 de Setiembre 2015 Presentado por Colin Ehren en asociación con la Inicia'va StAR 15 de se'embre de 2015 © C&SE 2015 Obje4vos del Taller Ampliar el conocimiento sobre Internet a fin de tomar consciencia de: • Los peligros existentes cuando se u'liza Internet para realizar una inves'gación; • Cómo encontrar la información deseada; • Cómo u'lizar internet como una herramienta efec'va para inves'gaciones; y • Cómo demostrar los hallazgos obtenidos. 15 de se'embre de 2015 © C&SE 2015 Obje4vos – Día 1 • Tomar consciencia respecto de las huellas Internet (“Internet Footprints”) y las consideraciones de seguridad/privacidad asociadas a ellas. • Comprender las diferencias entre Buscadores, Meta-‐ buscadores, Directorios y la Web Invisible. • Emplear estrategias para inves'gaciones lícitas, é'cas y efec'vas. • Tomar conciencia de las herramientas de información de redes • Comprender cómo minimizar el riesgo de comprometer las inves'gaciones en internet. 15 de se'embre de 2015 © C&SE 2015 Día 1 -‐ Esquema • “Huellas en la arena”. • Elementos clave sobre motores de búsqueda e investigación. • Estrategias de Búsqueda y herramientas de información de la red. • Minimización del compromiso. 15 de se'embre de 2015 © C&SE 2015 Huellas en la arena ¿Qué riesgos supone el uso Internet para inves4gaciones, búsquedas y operaciones de inteligencia? 15 de se'embre de 2015 © C&SE 2015 Huellas en la arena Las organizaciones acceden a Internet de diversas maneras, como ser desde: Computadoras corpora'vas en red Computadoras corpora'vas autónomas Computadoras recuperadas autónomas Computadoras encubiertas/anónimas autónomas Computadoras encubiertas/anónimas en red Trabajando desde el hogar (con computadoras para “Home-‐office” -‐ autónomas o en red) Disposi'vos Móviles Cyber-‐cafés 15 de se'embre de 2015 © C&SE 2015 Huellas en la arena Los criminales saben que las organizaciones usan Internet para sus inves'gaciones. Hay varias cues'ones relacionadas con estos métodos de acceso. Recomendaciones • Las estaciones de trabajo corpora'vas, en red o autónomas, deberían ser usadas únicamente para inves'gaciones genéricas, tales como búsquedas de información sobre las tendencias delic'vas o publicaciones de inves'gaciones en si'os web acreditados. • No deberían u'lizarse las estaciones de trabajo recuperadas autónomas, a menos que se pueda garan'zar que estas han sido “limpiadas” por una empresa debidamente acreditada y aprobada. 15 de se'embre de 2015 © C&SE 2015 Huellas en la arena Recomendaciones (Cont.) Todas las búsquedas sensibles o detalladas, o las inves'gaciones de fuentes abiertas deben llevarse a cabo a través de una PC encubierta o anónima y registrada, u'lizando una conexión encubierta o anónima. ¿Por qué? Porque la huella de internet podría comprometerlo a usted, a sus colegas o a la inves'gación u operación de Inteligencia en la que esté par'cipando su organización o socio. 15 de se'embre de 2015 © C&SE 2015 Huellas en la arena Cada vez que u'liza Internet, usted deja sus huellas en los si'os web que visita. El tamaño de su huella depende de las “variables ambientales” que su computadora y navegador de Internet transmitan, y también de su ac'vidad en la web. 15 de se'embre de 2015 © C&SE 2015 Huellas en la arena Usuario Webmaster Servidor Web Reportes ID del Dispositivo Navegador/Software Acceso a Internet Registros De Acceso Al hacer click en un enlace, su huella de internet es enviada a un Servidor Web, el que luego envía a usted al sitio web solicitado. El Webmaster que controla el Servidor Web puede ver su huella para recibir información sobre usted o su Organización (ubicación física, ISP, sus intereses, tipo de PC/Software, etc.). 15 de se'embre de 2015 © C&SE 2015 Huellas en la arena Cada página web que usted consulta deja una huella individual en un Servidor Web. Sea cauteloso de las huellas que deja al visitar ciertos si'os web, ya que podrían comprometer a su organización. De ser necesario consultar: badguy.com desde your.org Sus huellas pueden incluir; El nombre de su computadora (o gateway). La dirección de IP de su computadora, o su proxy gateway. El URL de la página que ha vistado previamente. (Los Webmasters usan esta información para determinar qué páginas web conducen a los navegadores a su sitio.) 15 de se'embre de 2015 © C&SE 2015 Huellas en la arena Usuario “términos de búsqueda” Google.com webmaster http://www.google.com/keywords=términosdebúsqueda Hackdiary.com webmaster Huella: - @your.org O - [email protected] El webmaster de Google.com conoce sus “términos de búsqueda” El webmaster de hackdiary.com conoce qué “términos de búsqueda” ha utilizado para encontrarlo 15 de se'embre de 2015 © C&SE 2015 Huellas en la arena En Resumen -‐ Su huella de internet podría comprometer una inves'gación u operación de inteligencia en la que esté involucrada su organización o agencia encargada de la aplicación de la ley. 15 de se'embre de 2015 © C&SE 2015 Huellas en la arena 15 de se'embre de 2015 © C&SE 2015 Huellas en la arena 15 de se'embre de 2015 © C&SE 2015 Huellas en la arena 15 de se'embre de 2015 © C&SE 2015 Huellas en la arena 15 de se'embre de 2015 © C&SE 2015 Huellas en la arena 15 de se'embre de 2015 © C&SE 2015 Huellas en la arena -‐ Dominios y Whois 15 de se'embre de 2015 © C&SE 2015 Huellas en la arena -‐ Dominios y Whois 15 de se'embre de 2015 © C&SE 2015 Huellas en la arena – Términos de Búsqueda 15 de se'embre de 2015 © C&SE 2015 Huellas en la arena – Términos de Búsqueda 15 de se'embre de 2015 © C&SE 2015 Huellas en la arena – Surfing Paralelo El Surfing Paralelo puede asociar una PC encubierta o anónima a su organización. El Surfing Paralelo ocurre cuando los mismos si'os web y términos de búsqueda son ingresados desde una estación de trabajo corpora'va, y luego son u'lizados desde una estación de trabajo encubierta o anónima. Los Webmasters pueden ejecutar reportes que iden'fican quién ha estado u'lizando los mismos términos de búsqueda, etc. 15 de se'embre de 2015 © C&SE 2015 Huellas en la arena – Surfing Paralelo. Usuario #1: deja huellas “your.org” al visitar “target.com” Usuario #2: deja huellas “encubiertas” al visitar “target.com” El Usuario “encubierto” ahora puede ser reconocido como un visitante de “your.org.uk”. Usuario #1 your.org Usuario #2 target.com [email protected] Incluso si Ud. impidiera que los términos de búsqueda fuesen transmitidos, el Webmaster de target.com aún podría hacer asociaciones a partir de los high volume hits o los patrones de búsqueda similares que acceden a las mismas páginas. 15 de se'embre de 2015 © C&SE 2015 Huellas en la arena – Surfing Paralelo 15 de se'embre de 2015 © C&SE 2015 15 de se'embre de 2015 © C&SE 2015 Huellas en la arena – Surfing Paralelo 15 de se'embre de 2015 © C&SE 2015 Huellas en la arena – Anuncios / Imágenes Usted deja huellas en cada si'o web que visita. Si esos si'os exhiben anuncios o imágenes de terceros, sus huellas son automá'camente enviadas a ellos también. No es necesario que usted visite el si'o de un tercero para que aquel obtenga información suya. 15 de se'embre de 2015 © C&SE 2015 Huellas en la arena – Anuncios / Imágenes. Los sitios web pueden incluir anuncios o imágenes (y, por tanto, cookies) de terceros. AdultFriend.com Ad-Image.com Hot_stuff [email protected] Su Perfil Historial de navegación Cookies en su PC AdultFriend.com ID#_201 insurance.co.uk ID#_4873 traffikid.com ID#_539 Ad-Image.com ID#_435349 Insurance.co.uk Joanne Hotman [email protected] Dirección y teléfono Historial de navegación Traffikid.com Africa_man [email protected] Historial de navegación AdultFriend.com Hot_stuff [email protected] Historial de navegación Likes / Dislikes Insurance.co.uk Joanne Hotman [email protected] Dirección y teléfono Automóviles / Joyas Historial de navegación Traffikid.com Africa_man [email protected] Historial de navegación Contactos Empresas como “Ad-Image.com” son capaces de compilar un perfil significativo sobre Ud. y sus hábitos de navegación, el cual luego pueden pasar o comercializar a sus socios o clientes. 15 de se'embre de 2015 © C&SE 2015 Huellas – Si4os Web Afiliados Asegúrese de cerrar la sesión en todas las plataformas de redes sociales como Google+, Facebook y Twi@er, antes de iniciar una inves'gación confidencial o sensible. Cuando visita otras plataformas, Ud. podría estar iniciando una sesión incluso si no ha creado una cuenta para esa plataforma específica. 15 de se'embre de 2015 © C&SE 2015 Huellas – Si4os Web Afiliados 15 de se'embre de 2015 © C&SE 2015 Huellas – Si4os Web Afiliados 15 de se'embre de 2015 © C&SE 2015 Huellas en la arena Pasos fundamentales para crear y mantener una presencia-web anónima Desactive cualquier elemento que registre su actividad Si está utilizando MS Internet Explorer: • Desactive las cookies. • Limpie el historial de carpetas, y • Rutinariamente remueva los archivos almacenados en caché. Utilice medios de almacenamiento extraíbles para guardar cualquiera de los archivos descargados. Solamente utilice el internet de su PC para navegar. No use el Word Processor para negocios o escritos personales. Cerciórese que todos los detalles de su conexión sean anónimos. Asegúrese que la configuración de su sistema se lo más estándar posible. Use software Anti-Virus y Anti-Spyware. Asegúrese de que su Firewall esté configurado correctamente. 15 de se'embre de 2015 © C&SE 2015 La estación del “Cyber-‐Espacio” de Mario Profaca hcp://mprofaca.cro.net 15 de se'embre de 2015 © C&SE 2015 Huellas en la arena Ir a – hcp://centralops.net • Iden'fique su dirección de IP. • Navegue hasta el “Browser Mirror”. • ¿Puede iden'ficar alguna diferencia con los resultados de sus colegas? Use un Buscador para encontrar información sobre su dirección de IP. • ¿Encontró algo interesante? Búsquese a Ud. mismo o a su nombre de usuario u'lizando un motor de búsqueda. • ¿Encontró algo que usted no sabía? 15 de se'embre de 2015 © C&SE 2015 Día 1 -‐ Esquema • “Huellas en la arena”. • Elementos clave sobre motores de búsqueda e investigación. • Estrategias de Búsqueda y herramientas de información de la red. • Minimización del compromiso. 15 de se'embre de 2015 © C&SE 2015 Motores de búsqueda Los motores de búsqueda construyen un índice • El motor de búsqueda usa un Robot (Spider/Crawler) para encontrar páginas web. • Las páginas encontradas luego son almacenadas en caché en los centros de datos. • Los datos de las páginas web son categorizados. • Los datos de las páginas web son evaluados para crear un ranking. • El centro de datos se actualiza con información sobre la categoría y el ranking. • El robot del motor de búsqueda re-‐visita las páginas web encontradas. 15 de se'embre de 2015 © C&SE 2015 Motores de búsqueda 15 de se'embre de 2015 © C&SE 2015 Motores de búsqueda Visualización del Caché Abrir el navegador de internet. Ir a Google Realizar cualquier búsqueda. Hacer clic en el pequeño triángulo verde adyacente a la dirección web para los resultados. • Luego seleccionar <cached>. • • • • • Para ver cuántas páginas Google almacena en caché de ese si'o web se usa el comando “site”, que se encuentra en el cuadro de búsqueda; • Ejemplo de sintáxis <site:ford.com> 15 de se'embre de 2015 © C&SE 2015 Motores de búsqueda Buenos para búsquedas detalladas. Inútiles para búsquedas temáticas. 15 de se'embre de 2015 © C&SE 2015 Motores de búsqueda Principales herramientas de búsqueda u4lizadas en Colombia 1. 4. 5. 6. 8. 9. 12. 13. 14. 18. 19. 28. 15 de se'embre de 2015 google.com.co google.com live.com yahoo.com wikipedia.org msn.com el'empo.com (No'cias) google.es minuto30.com (No'cias) elespectador.com (No'cias) ask.com semana.com (No'cias) © C&SE 2015 Robots.txt Centro de Datos 15 de se'embre de 2015 © C&SE 2015 Robots.txt • El Robots.txt es un archivo que un Webmaster ingresa a un Servidor Web indicando a los Robots del Buscador (y a otros Crawlers) qué páginas no quisiera que estos visiten. • No es obligatorio, pero por lo general los motores de búsqueda responden a esto, es decir cumplen con lo que se les solicita evitar. • No es un método para evitar que los buscadores ingresen a un si'o (es decir, no es un firewall o una protección por contraseña). • Es como un cartel que dice “Por favor No Entrar” en una puerta sin traba. • U'liza un sistema de declaraciones (“system of statements”). Para excluir todos los Robots del Servidor. Para excluir a todos los Robots de parte del Servidor. User-agent: *! Disallow: /! Para dar acceso total a los Robots. User-agent: *! Disallow: /cgi-bin/! Disallow: /tmp/! Disallow: /junk/! User-agent: *! Disallow:! Para dar acceso total a un solo Robot. Para excluir solo un Robot del Servidor. User-agent: goodbot! Disallow:! User-agent: BadBot! Disallow: /! 15 de se'embre de 2015 User-agent: *! Disallow: /! © C&SE 2015 Robots.txt 9. hcp://www.yahoo.com/robots.txt 1. hcp://www.mujerhoy.com/robots.txt 2. hcp://www.diariolasamericas.co/robots.txt 10. hcp://www.google.co/robots.txt 3. hcp://www.elheraldo.co/robots.txt 11. hcp://www.facebook.com/robots.txt 4. hcp://www.myspace.com/robots.txt 12. hcp://www.whitehouse.gov/robots.txt 5. hcp://www.twicer.com/robots.txt 13. hcp://www.cisco.com/robots.txt 6. hcp://www.youtube.com/robots.txt 14. hcp://www.senalcolombia.gov.co/robots.txt 7. hcp://www.bing.com/robots.txt 15. hcp://www.elnuevosiglo.com.co/robots.txt 8. hcp://www.fuac.edu.co/robots.txt 16. hcp://www.cromos.com.co/robots.txt 15 de se'embre de 2015 © C&SE 2015 Tamaño de Internet A partir de diciembre de 2014 • +915 millones de Sitios Web • +14.3 billones de Páginas Web en vivo Indexados por Buscadores • Google: +45 miles de millones • Bing/Yahoo: +30 miles de millones • Lycos: +24 miles de millones • Baidu: +5 miles de millones (apróx.) • Yandex: +6 miles de millones • Terra: +2 miles de millones 15 de se'embre de 2015 © C&SE 2015 Red Profunda o Invisible Si'os está'cos (poco cambio de contenido). Información Genérica y de Nicho. Fácilmente indexados por los buscadores. Si'os especialista/Nichos que u'lizan Robots.txt. Si'os web con miles de millones de páginas almacenadas en bases de datos construidas dinámicamente para cada búsqueda. Los buscadores no pueden indexar facilmente este contenido. Open Web Web Profunda / Invisible Redes internas de compañías (Intranet), si'os y redes privadas. Los buscadores no pueden indexar este contenido. Zona criminal de Internet. Acceso a través de soMware especializado. Los buscadores no acceden a este contenido. 15 de se'embre de 2015 Web Privada Web Oscura © C&SE 2015 Red Profunda o Invisible Julio 2001 - Michael Bergman (brightplanet.com) World Wide Web Web Profunda/Invisible Web Abierta 550x mayor 19 Terabytes 7,500 Terabytes 30 miles de millones de documentos 550 miles de millones de documentos +36.000.000 si'os +200.000 si'os Los 60 más grandes con'enen 40x información de la WWW • Un estudio de 2004 identificó +330,000 sitios de la Web profunda. • Esta ha crecido casi exponencialmente desde entonces. 15 de se'embre de 2015 © C&SE 2015 Fundamentos de la Inves4gación • Definir el tema: • Especifique qué es lo que debe encontrarse. • Iden'fique material de palabras clave (“Keywords”) para la búsqueda, incluyendo: • Temas, Nombres, Direcciones, Números de teléfono, Direcciones de correo electrónico, Nombres de Usuario, Inicios de sesión (“Logins”), Empresas y negocios, etc. • Iden'fique Acrónimos o términos informales para estos temas o lugares. • Iden'fique apodos comunes para las personas, lugares o empresas. 15 de se'embre de 2015 © C&SE 2015 Fundamentos de la Inves4gación • Forme una Estrategia. • Iden'fique elementos primarios y secundarios a buscar. • Qué herramientas se ha de u'lizar: • Motor de búsqueda, directorio Web, meta-‐Buscador, Web Invisible, Blogs, Redes Sociales, Chat, grupos de no'cias, foros, etc. • Métodos de búsqueda; • Búsqueda Estándar o Avanzada • Palabras sueltas, Frases, Secuencias Numéricas, Combinaciones. 15 de se'embre de 2015 © C&SE 2015 Fundamentos de la Inves4gación • Manténgase Enfocado • Los clips de video entretenidos son una pérdida de 'empo y esfuerzo. • Páginas de Búsqueda Avanzada • Si se encuentran disponibles, consúltelas. • Iden'fique la mejoración en la capacidad de búsqueda. • Resultados • Filtrar resultados. • Seguir pistas per'nentes. • Guardar/Descargar los resultados. • Usar eficientemente las Carpetas de Favoritos. 15 de se'embre de 2015 © C&SE 2015 Fundamentos de la Inves4gación • Problema habitual Pág. Resultados Link 1 Link2 Link 3 Pág. Resultados Link 1 Link2 Link 3 15 de se'embre de 2015 Pág. 1 Link A LinkB Link C Pág. A Link 7 Link 8 Link 9 Pág. 7 Link X LinkY Link Z Estos links suelen ser olvidados y se dejan sin explorar. Pág. 1 Link A LinkB Link C Pág. 2 Link A LinkB Link C Pág. 3 Link A LinkB Link C Pág. A Link 7 Link 8 Link 9 Pág. 7 Link X LinkY Link Z Abra múl4ples enlaces ú4les en sus propias ventanas o pestañas con el clic derecho. Luego haga clic, a través de las pestañas, o u4lice la función ALT-‐TAB para alternar entre ventanas abiertas. © C&SE 2015 Fundamentos de la Inves4gación Use la herramienta adecuada para el trabajo adecuado. 15 de se'embre de 2015 © C&SE 2015 Directorios Buenos para búsquedas temáticas. Inútiles para búsquedas detalladas. 15 de se'embre de 2015 © C&SE 2015 Bibliotecas Virtuales Buenos depósitos de información. 15 de se'embre de 2015 © C&SE 2015 Meta-‐Buscadores Búsquedas con Múltiples Fuentes 15 de se'embre de 2015 © C&SE 2015 Lógica Booleana 15 de se'embre de 2015 © C&SE 2015 Lenguaje de los Buscadores Comparación de Motores de búsqueda Google Yahoo Bing Ask Booleano Predeterminado = AND -‐keyword keyword OR keyword (keyword keyword) Predeterminado = AND -‐keyword keyword OR keyword Predeterminado = AND -‐keyword keyword OR keyword (keyword keyword) Predeterminado = AND -‐keyword keyword OR keyword Fraseo “keyword keyword” “keyword keyword” “keyword keyword” “keyword keyword” Derivación de palabras clave Automá'ca – no para todas Automá'ca – no para todas No No Operadores in'tle:keyword allin'tle:keyword keyword site:domainname inurl:keyword allinurl:keyword keyword link:webpage Muchos más… in'tle:keyword site:domainname inurl:keyword in'tle:keyword domain:domainname inanchor:keyword inbody:keyword ip:ipaddress in'tle:keyword site:domainname inurl:keyword filetype:fileextension filetype:fileextension filetype:fileextension No 44 opciones – Página de Búsqueda Avanzada 41 opciones – Página de Búsqueda Avanzada 41 opciones 6 opciones – Página de Búsqueda Avanzada related:webpage No No No Búsqueda por Tipo de Archivo Búsqueda por idioma Páginas Similares 15 de se'embre de 2015 © C&SE 2015 Encontrando información básica Prác4ca de Google y de Búsqueda Avanzada 15 de se'embre de 2015 © C&SE 2015 Repaso • Huellas en la Arena: • • • • Compar'r datos automá'camente puede poner en peligro las inves'gaciones. Surfing Paralelo, Anuncios e Imágenes, Redes Sociales, y si'os web afiliados. Ajustes de Navegación. Búsquedas Whois, y las propias huellas. • Elementos clave sobre motores de búsqueda e inves'gación: • • • • • • Construcción de un índice y Robots.txt. Web Profunda/Invisible Fundamentos de la Inves'gación Directorios Web, Bibliotecas Virtuales, Meta-‐Buscadores Lógica Booleana Prác'ca de Google y Búsqueda Avanzada 15 de se'embre de 2015 © C&SE 2015 Repaso ¿Preguntas? 15 de se'embre de 2015 © C&SE 2015 Uso de Fuentes Abiertas para la Inves4gación Penal (Día 1 – Sesión Matu'na) Colin Ehren [email protected] +44 (0)7941 338 449 15 de se'embre de 2015 © C&SE 2015
Documentos relacionados
descargar archivo pdf
• Los peligros existentes cuando se u'liza Internet para realizar una inves'gación; • Cómo encontrar la información deseada; • Cómo u'lizar ...
Más detalles