Saltar al contenido

OSINT: técnicas y herramientas para generar inteligencia en fuentes abiertas

    Por José Manuel Pérez-Íñigo, Departamento de Inteligencia en Winterman

    La información de fuentes abiertas es toda aquella cuyo acceso es lícito y de dominio público, esto supone que se puede acceder fácilmente y a bajo coste a un gran volumen de información.

    Sin embargo, las fuentes abiertas tienen un gran inconveniente, al incluir tanta información ésta es difícil de procesar por los medios tradicionales, siendo extremadamente fácil que un analista se vea sobrepasado por datos entre los que no se puede discriminar adecuadamente para realizar un análisis apropiado. Para lograr discriminar información de calidad, en el océano de las redes, se pueden implementar una serie de técnicas para optimizar la extracción de información.

    1. Estrategia de búsqueda

    Antes de empezar a buscar en Internet todo lo relacionado con el tema que nos interese es importante distinguir exactamente qué se quiere saber del ítem de la investigación. Para ello, es recomendable emplear la lista de preguntas de Alex Osborn, una técnica clásica de pensamiento creativo para limitar el enfoque de un problema. Una vez identificados los ítems que nos interesan, se desarrolla una estrategia de búsqueda capaz de responder a las cuestiones que nos hemos planteado. La estrategia debe seguir una ruta de información que coordine las características de la investigación, previendo el equipo que será necesario y el presupuesto del que se dispone, estableciendo un cronograma, dividiendo tareas y asignando un calendario de entregas y reuniones de monitorización del proceso que faciliten redirigir la búsqueda, en caso que sea necesario, y cumplir con los plazos acordados.

    2. Crear un kit de herramientas

    Aunque formaría parte de la creación de la estrategia de búsqueda, le dedico un apartado propio a la elección de herramientas debido a la crucial importancia que tiene en la obtención de información. Dependiendo del tipo de análisis y de la información que queremos obtener se escogerán unas herramientas u otras:

    • Búsqueda básica: en muchos casos, Google será el motor principal de la obtención. Sin embargo, no debemos olvidar que este buscador puede condicionar nuestra búsqueda e incluso «intoxicarnos» si no se usa adecuadamente, el modo más adecuado para evitarlo es usar operadores como booleanos, aunque hay otros como metabuscadores o Zapmeta, o la opción de realizar búsquedas a través alertas personalizadas en Talkwalker o Google Alerts.
    • Actualidad: la búsqueda de noticias en periódicos digitales es lenta y poco eficaz, vale la pena invertir dinero en los planes básicos de escritorios de actualidad personalizados como Netvibes o Hoosuite. Un buen uso de estas plataformas permite monitorizar la actualidad en tiempo real con bastante comodidad.
      Por otro lado, no se debe olvidar la amenaza de las noticias falsas, por lo que siempre se debe validar la información con consultas en páginas como Snopes o Cazahoax.
    • Redes Sociales: buscar información en las redes sociales es prácticamente imposible si no se recurre a páginas especializadas o software de análisis. No obstante, si estas herramientas se conocen y se emplean bien puede conseguirse información de buena calidad.
      La red social clásica para realizar análisis es Twitter, que al ser abierta y multitudinaria es muy atractiva para emplearla como fuente. Herramientas como NodeXL, Trendsmap o Tweetreach son muy eficaces para realizar búsquedas amplias, aunque existen otras y deberán elegirse unas u otras en función de cuan específica sea la información que necesitamos. Si queremos obtener información fuera de Twitter podemos recurrir a Social-Mention, Keyhole o BIOS (Buscador Investigative Operating System).
    • Plataformas de monitorización: completas, eficaces y con un enorme alcance, las plataformas de monitorización integran múltiples funcionalidades que permiten realizar complejos análisis empelando información de fuentes abiertas. El inconveniente es que son costosas y que requieren de analistas experimentados para sacarles todo el partido. Existen distintas plataformas como 4iQ, IWard o SimplyMeasure con diferentes características que deben valorarse con detenimiento en función del perfil de nuestros análisis.

    3. Categorizar información

    Para lograr que un análisis en OSINT sea operativo es vital que se realice una buena integración, para ello es importante realizar la categorización de la información a medida que esta se va recopilando.
    Las categorías entre las que se dividiría lo que se obtenga dependerían del análisis que nos interese, a pesar de que algunas son siempre útiles como categorizar en función del formato (artículo, publicación científica, etc.) o en función del tipo de fuente (revista digital, autor, etc.). Para facilitar este manejo de la información existen herramientas como ZOTERO, indispensable si vamos a gestionar un gran volumen de inputs.

    4. Representaciones gráficas

    Una categorización efectiva logra que la información sea accesible y se integre de forma operativa más fácilmente, aunque como en fuentes abiertas la información suele ser muy amplia y variada es difícil analizarla, por muy bien integrada que esté, si no se cuenta con herramientas gráficas.
    Algunas herramientas tienen representaciones gráficas automáticas pero la mayoría requerirán que se use una aplicación externa. De nuevo, la herramienta de representación gráfica dependerá del análisis que hagamos, si es de un texto podría usarse Tagcrowd, XMind para mapas conceptuales, cuando se trata de representaciones complejas es mejor usar SmartDraw o Anacapa AMIS y Mymapp si se necesita representar información de manera geográfica.

    5. Búsquedas seguras

    Existen muchas maneras de proteger nuestras búsquedas de las amenazas en un entorno ciber, lo más recomendable es el uso de un Proxy y una VPN. El proxy y la VPN mantendrán nuestra identidad en secreto mientras navegamos, haciendo de intermediario ante servidores y creando una extensión controlada, respectivamente.
    También es importante usar un cifrador como GPG o PGP para mantener seguras las comunicaciones entre miembros del equipo de analistas. Si se quiere maximizar la seguridad se puede emplear el navegador TOR o el buscador Duck Duck Go. No obstante, estas herramientas son muy lentas, por lo que sólo serían recomendables cuando se busca en la Deep Web o si la seguridad es una prioridad principal.
    Asimismo, es recomendable usar herramientas que reduzcan la posibilidad de infectarnos con un virus al descargar documentos o al navegar en una URL desconocida, VirusTotal sería una herramienta muy útil a la hora de cumplir esta función.

    winterman_articulo_num1

    Haz click en la imagen para descargar el artículo en pdf>>