12 de maig 2014

Els serveis de seguretat de l'estat estan molt interessats en tu

La capacitat d’emmagatzemar informació ha anat creixent a mesura que es desenvolupava la societat de dominació. Des de els arxius reials de Sumer fins al emmagatzemament al núvol em fet un llar camí. Però ha estat a partir de la dècada dels 90 en que aquesta acumulació s’ha disparat fins a nivells absolutament aclaparadors. El 90% de la informació emmagatzemada actualment s’ha generat a partir de 2010. El 2012 l’univers digital tenia 2.837 Eb i es preveu que el 2020 en tingui 40.026 (40.000.000.000 de Gb) (enllaç al "digital universe") (wikipedia unidades de información.

Aquest creixement exponencial de les dades acumulades va fer emergir la idea de que aquesta informació podia ser molt valuosa i generar considerables beneficis, les companyies de marketing, les corporacions financeres i les d’asegurances van ser provablement les primeres en valorar l’acumulació de dades i desenvolupar eines per “extreure” aquest valor, així al 1992 apareix el primer programa per detectar frau amb targeta de crèdit a temps real, i el 1998 es funda Google amb el seu motor de recerca a la xarxa. Hores d'ara Google mou 25Pb d'informació al dia, es fan 3.000 milions d'accions a FACEBOOK, hi han més de 400 milions diaris de missatges (2012) a TWITER i al mercat de valors dels EUA es fan 7.000 milions d'operacions diàriament... i totes aquestes xifres estan creixent a bona velocitat.

Simultàniament a l'interès corporatiu (i potser abans), els serveis d’intel·ligència dels estats van veure tot el potencial d’informació i d’estratègia que podien treure seguint els passos de les corporacions. La subordinació dels estats a les corporacions ens pot fer pensar que les anàlisis de dades dels estats, de fet, són encàrrecs d’aquestes. I, per tant, els estats anirien a remolc de les corporacions.
(més avall continua la informació...)

A finals dels anys 90 es va posar de moda el terme “mineria de dades”, aquest terme ha estat desplaçat per el de Big Data, malgrat que no volen dir el mateix, una és un mètode de tractament i l’altra és la qualitat del recurs. La definició de Big Data encara no està fixada i segons el definidor varia notablement, però, normalment, es refereix a totes les dades de fonts “obertes” i tancades que poden ser tractades mitjançant mètodes estadístics informàtics, mètodes als que també es refereixen sovint com a “big data”. Bàsicament es tracta d'establir patrons i fer prediccions “fiables”.

A l'estat espanyol, des de els temps dels ordinadors Berta (policia) i Duque de Ahumada (guàrdia civil), allà cap els anys 90 ha plogut molt i la informació, les bases de dades i el maquinari a disposició de les Forces Armades i els Cossos de Seguretat de l'Estat (FACSE) a crescut exponencialment. A partir de la substitució de l'obsolet Berta per l'ordinador Clara és difícil trobar rastres de les inevitables modificacions i ampliacions que sens dubte s'han anat produint.

Aquesta opacitat és fins i tot reconeguda, en un document del CESEDEN, on referint-se a l'OSINT (en l'argot dels serveis d'intel·ligència la informació procedent de fonts obertes) diuen “El propio CNI, al hacer referencia a sus fuentes de información, destaca principalmente las humanas, seguida de la información obtenida por medios técnicos, la facilitada por otros servicios de Inteligencia y en mucha menor medida la que procede de fuentes abiertas. Aún así, otras informaciones no oficiales confirman la utilización cada vez en mayor medida de fuentes abiertas tanto en el CNI, como por el CIFAS” (enllaç al document).

Així doncs els serveis d'intel·ligència de l'estat (el CNI, el CIFAS, els de la Guardia Civil i la Policia... ) no semblen estar massa disposats a donar-nos si més no una idea de les seves activitats en la obtenció d'informació de fonts obertes i tancades sobre nosaltres i les nostres activitats, cosa normal des de la seva lògica. Per fer-nos una idea haurem de fer servir fonts aïllades i fragmentaries i comparar-nos amb d'altres països.

Del que si podem trobar molta informació, i ens dona una idea del potencial acumulat, són les noticies de la forta incidència del càncer entre els treballadors dels CPD, especialment el de la policia a l'Escorial i que els sindicats i alguns serveis mèdics atribueixen als camps elèctrics i electromagnètics.

EL PODER “TIC” DE L'EXERCIT I EL MINISTERI DE L'INTERIOR.

No hem trobat referències recents sobre els ordinadors dels dos ministeris (qui en tingui que les comparteixi), però s'ha fet al llarg dels més de 10 anys de la implantació del ordinador Clara moltes inversions i un gran esforç d'actualització.

En el moment d’implantar els 3 terabits de Clara (6 si comptem el mirall), l’any 2000, semblava molta capacitat. En aquells moments 10TB eren el súmmum de la capacitat, un valor difícilment assolible, avui en dia 1.000 TB no donen cap problema, de fet ocupa menys d’un rack i un CPD pot tenir multitud de racks (10, 20, 30...PB).

El sistema d’hisenda que històricament estava constituït per el mític ordinador Rita (un únic CPD), es composa ara mateix de 6 CPD, tots ells d’una capacitat molt superior a l’obsolet Rita.

En un altra ordre de coses, i per comparar, el conjunt de CIA+ FBI+ NSA+ altres agències USA, disposa d’una capacitat suficient per menjar-se tot internet sense patir indigestió. Els estats disposen d’una capacitat pràcticament il·limitada d’emmagatzemament  (l'emmagatzemament cada cop és més econòmic), ara el problema (en vies de resolució) és el processament de tota aquesta informació.

A tall d'exemple només durant 2013 el Ministeri de Defensa a concertat contractes relacionats amb les TIC per valor de 877,79 milions d'euros a INDRA (el principal proveïdor), 14,77M€ a IBM, 6,32M€ a Cassidian, 5,28M€ a Tecnobit... en total la despesa supera de molt els 1.000 milions d'euros. I aquestes dades són sols per contractes de més de 18.000€ (sense IVA), per sota d'aquesta xifra no cal informació pública, suposem també que hi han contractes de més de 18.000 dels que no necessiten donar comptes...

Sempre que es dona una mirada a la despesa TIC, ja sigui al Ministerio de Defensa com a la Generalitat de Catalunya, INDRA resulta ser la empresa més afavorida en termes econòmics, ja sigui en el control dels sistemes de joc, del DNI, d'Hisenda.... o de les Forces Armades i dels Cossos de Seguretat. No sols això, també és el proveïdor estranger més important del cos de Marines dels EUA.

La tendència no variarà al llarg de 2014, de fet, fins març, INDRA ja tenia contractes per valor de 47,89 milions d'euros... i la majoria de la contractació s'acumula a partir del segon trimestre  de l'any, a finals de 2014 la xifra s'haurà incrementat força.

IBM va fer un bon negoci el 2013, i aquest negoci estava relacionat en la seva totalitat en el actuacions en software i manteniment de la plataforma HOST (funcionament del CPD) del Ministeri, casi 15 milions en el tema... un pessiguet menor se l'emporta Hewlett Packard pràcticament sols un milió, però entre els conceptes hi ha el manteniment de sistemes Integrity Superdome de Centre de Processament de Dades (CPD) que solen tenir una capacitat de 8 terabits (molt lluny dels 3 teras de cada ordinador “clara”).

Amb les dades de que disposem podem suposar que la potència d'emmagatzemament i processament dels Ministeris de l'Interior i Defensa són molt considerables, malgrat que la dedicació al seguiment i explotació de les dades sobre els ciutadans no la puguem quantificar.

Es pot espigolar entre la munior de dades sobre la contractació pública en els següents enllaços (enllaç amb contratación del estado, infodefensa).

ELS “MINISTERIOS” ESTAN MOLT INTERESSATS EN LA TEVA VIDA... I ACUMMULEN MOLTA INFORMACIÓ SOBRE ELLA.

A les bases de dades actuals, s'acumulen  milions de dades sobre la teva vida... un capital d'informació com aquest no pot deixar de ser explotat, així que, igual que telefònica te la seva filial que ven informació tractada amb metodologia de la Big Data, en el cas de les dades a disposició de les FACSE (Forces Armades i Cossos de Seguretat de l'Estat), no hi ha cap dubte de que s'està avançant (potser fins i més ràpid que en el sector privat) en aquesta direcció.

En un primer mirada (però segur que en son moltes més) les dades que tots sabem que l'estat, i especialment la poli te (o disposa fàcilment d'elles) són:

-Les dades personals de detinguts, implicats, condemnats i en busca i captura (sexe, petjades dactilars (les dels 10 dits), costums, ideologia, raça... fins a més de 60 items, incloent temes absolutament d'opinió dels farcidors de la base a aquesta base en diuen PERPOL la de la Policia i INTPO la de la Guardia Civil.

-Les dades d'ADN de moltes de les persones del fitxer anterior i una bona part de “desconegudes”.

-Els 26 milions de permisos de conduir i dades dels més de 30 milions de vehicles. Infraccions, multes, pèrdues de punts...

-La base de dades del DNI (DNIFIL), imatge de la cara, petjades dactilars del dit índex....a l'estat hi ha unes 38M de persones de més de 16 anys.

-La base de dades sobre menors “d'interès” policial i els seus familiars.

-La dels passaports, recordem que els passaports tendeixen a tota la UE a ser biomètrics.

-La base d'estrangeria on es recullen les dades sobre tots els estrangers resident i la seva situació, en diuen ADEXTRA (dades d’uns 5 milions de persones).

-El Sistema d’Informació de Schengen (SIRENE), el visat Schengen conté dades biomètriques dels 10 dits de les mans i de la cara, cada any s’expedeixen 13 milions de visats als països de l’Espai Schengen.

-Les dades de les 55 milions de línies de telèfon mòbils (incloent la situació) i les de les 19M de fixes, total 74 milions, cal recordar que les operadores han de guardar dos anys aquestes dades, encara que hi ha una sentència del Tribunal Superior Europeu que tomba aquesta directiva..

-Els dos anys d'activitats a internet des de cada IP que les operadores estan obligades a guardar (algunes en guarden més), correus electrònics, visites, compres, chats....

-Dades sobre la propietat o el lloguer d'habitatges (uns 25 milions).

-Registre de les 4.500.000 armes de foc legals i dades sobre les 300.000 il·legals estimades.

-Les dades del cens.

-Les histories laborals de tot aquell que alguna vegada hagi treballat en blanc.

-Dades de la seguretat social, nombre de visites, de quina especialitat i on s'han efectuat, ingressos hospitalaris, baixes (de moment l'historial clínic sembla estar fora del seu abast, però no en tingueu la seguretat).

-Evidentment les dades fiscals de totes les persones “físiques”.

-Contractes de serveis, electricitat, gas, aigua i els seus consums....

-Les fitxes de pernoctacions en allotjaments hotelers (el 2013 285.9M).

Les dades que s’acumularan en el nou fitxer que vol constituir el Ministerio d’Economia amb tots les dades financeres de totes les dades bancàries de tots els habitants del país, fitxer al que tindrà accés la policia i el CNI.

Cal també afegir les dades obtingudes  mitjançant la intervenció de telèfons amb el sistema SITEL (SITEL wikipedia), el sistema SITEL, a més de la conversa registra data, hora, durada, identificació IMEI, números de telèfon, tipus d’info continguda (text, àudio...) identitat dels titulars dels telèfons... el sector de les comunicacions avalua el nombre total d’intervencions el 2012 en un milió, en aquest cas queden enregistrades les conversacions i el contingut dels missatges. Tan el tribunal Suprem com l’Agència de Protecció de Dades considera SITEL totalment legítim i constitucional.

Crec que tots tenim més o menys clar que qualsevol sicari del poder amb autorització (o sense, per exemple tenim el cas de les fotos del DNI dels jutges pel dret a decidir) prement un boto i donat el teu DNI, o alguna altra identificació, pot obtenir totes, o bona part d'aquestes dades...

Però des de l'estat (i les corporacions) volen anar una mica més endavant, igual que van els estats punters (els que ofereixen un millor servei) i explotar les dades en conjunt, com si d'un treball de marketing es tractés. Més enllà de tenir un persona ben classificada (fitxada) acumular dades no te cap utilitat, només el tractament d'aquestes dades les valoritza i permet emprar-les per fer prediccions, per localitzar nodes de relació, per identificar al mon real les ciberidentitats...

AL MINISTERIO DE DEFENSA L'INTERESSA LA METODOLOGIA DE LA BIG DATA.

Malgrat l'hermetisme referent a eines, instruments, estructures... el Ministerio ha produït una bona quantitat de literatura, ponències, estudis, informes... sobre el tema

En l'informe més complet “Big Data en los entornos de defensa y seguridad” editat per l’Instituto Español de Estudios Estratégicos (IEEE) (enllaç al document) es marquen 12 grans usos per les metodologies Big Data:

1.-Detecció d’intrusió física en grans espais o infrastructures obertes.
2.-Computació sobre informació encriptada.
3.-Anàlisi automàtic de vulnerabilitat de la xarxa (maquinari i tràfic de dades).
4.-Criminologia computacional.
5.-Us fraudulent de recursos corporatius i/o sensibles.
6.-Anàlisi de vídeo en temps real / recerca i recuperació ràpida en llibreries de vídeo.
7.-Intel·ligència visual en màquines.
8.-Identificar anomalies, patrons i comportaments en grans volums de dades.
9.-Anàlisi de text (estructurat i no estructurat) com recolzament a la presa de decisions en temps real en entorns intensius de dades.
10.-Consciència situacional.
11.-Traducció automàtica a gran escala (en nombre d'idiomes i en volum).
12.-Predicció d'esdeveniments.

Com que el nostre interès està centrat a la vida quotidiana, repassarem els temes el 4, 9 i 12 que estan més lligats a mètodes nous d’explotació de fonts tradicionals més endavant mirarem d’esbrinar els temes compresos al 6 i el 7, ja que aquests semblen ser els temes de més futur, el control social en temps real mitjançant mètodes de visió artificial.

Tot fent transparents als súbdits de sa majestat:

De nou ens trobem amb que les dades públiques son escasses, sols tenim les dades que es trasllueixen de les activitats normals de les FACSE i les d'alguns projectes finançats per Europa (sols alguns naturalment) que sense ser transparents són translúcids...

Així, per exemple en l’informe sobre Big Data i defensa abans esmentat es dona compte d’un programa desenvolupat per les agències dels EUA i comercialitzat per IBM, el COPLINK i no es fa esment de diversos programes que s’estan desenvolupant per part de l’Agència de Defensa Europea i per part de la OTAN, amb participació de l’exercit espanyol.

El cas de COPLINK, es tracta segurament d’una de les aplicacions més esteses d’intel·ligència policial, emprat en els EUA i en més de 25 països de la OTAN, es de sospitar que la policia espanyola en disposa.

El programa permet el seu us des de dispositius mòbils, gestiona ases de dades i pot identificar sospitosos mitjans elles, entre d’altres te una aplicació de reconeixement facial i d’elaboració de mapes de delictes... El seu tret més suggeridor és la possibilitat d’anàlisi de xarxes, amb la possibilitat de descobrir organitzacions formal e informals, sub organitzacions i identificar els nuclis centrals, els membres claus i els patrons de relació entre ells (video sobre COPLINK)

Però és que l’Estat Espanyol participa, com mínim, en el projecte OSEMINTI de la EDA junt amb França i Itàlia, l’acrònim del projecte vol dir “Operational Semantic Intelligence Infrastructure”. El sistema permet analitzar informació en espanyol, francès, anglès, italià i en alguns casos en àrab clàssic i pot analitzar tot tipus de missatge escrit o sonor. Es tracta d’una versió europea, més sofisticada, del mític “carnivore” dels EUA. Espanya aporta 1.856.000€, un 30% del cost (Veure document) (aprovació del projecte OSEMINTI).

La Unió Europea te també el projecte INDECT, que pretén monitoritzar i fer un seguiment de continguts multimedia en temps real. Te per un apart aplicació en les imatges de videovigilància, però també en l’anàlisi en continu de l’univers web (pàgines, forums, xarxes socials...). El projecte ens costarà com a mínim 11 milions. Els socis que participen són les polis d’Irlanda del Nord i Polònia i tot un seguit d’universitats i empreses. Entre les universitats hi ha la Carlos III de Madrid que es dedicarà al tema de “observació, anàlisi i detecció d’activitats criminals i amenaces en entorns virtuals complexos”.(pàgina del projecte INDECT)

Com abans, la manca d’informació pot ser sempre vorejada mitjançant informació contractual, d’aquesta manera podem dir que durant el 2013 el ministerio es va gastar (com mínim) 2.600.000€ en “guerra electrònica” uns 2 milions per INDRA i 600.000€ per GMV.

De tota manera per el Ministerio de Defensa la guerra electrònica es centra més en temes d’intercepció de comunicacions convencionals i es centre molt en el “Programa Santiago” que és un programa “emblemàtic” d’intercepció de comunicacions.

En aquest marc cal inserir els articles en publicacions especialitzades, i publicacions mongràfiques diverses, per aquest camí també podem copsar cap on van o a on estan.

Així per exemple al document “Redes sociales fuentes de OSINT” del Instituto Universitario de Investigación sobre Seguridad Interior es diu Desde un punto de vista más operativo, las Redes Sociales pueden llegar a movilizar rápidamente a grandes cantidades de personas, con los problemas de seguridad que ello puede generar, asociados a toda concentración masiva. Es por ello por lo que conviene atender sus contenidos, con objeto finalmente de garantizar la seguridad de todos los ciudadanos. Por otro lado, a través de las Redes, los ciudadanos se avisan con rapidez también contra acciones que puedan estar llevando a cabo las FFCC de seguridad. Esto significa que las operaciones en calle alcanzan un nuevo nivel del concepto de “públicas”. Entre ellas está el riesgo de grabaciones de vídeo que pueden ser subidas al instante a YouTube exponiendo públicamente a los operativos. Por otro lado, se han estado utilizando con frecuencia para dificultar desahucios o para impedir la identificación de inmigrantes”. (enllaç al document)

Tenen molt clar però que les xarxes son una eina de doble us, a la publicació de la guardia Civil “Ciberamenazas y redes sociales” diuen Advertíamos de la utilización de la Red, y de los Medios Sociales, para el adoctrinamiento y la radicalización. La parte positiva es que todos los contenidos en Red quedan en la misma, en muchos casos con carácter abierto. Por tanto es posible rastrear información, monitorizar webs, palabras clave, entidades, de interés para los servicios de seguridad de los Estados, respetando la legalidad y la privacidad en base a las normativas de cada uno de ellos” (enllaç al document).

I també tenen molt clares les eines que han de fer servir, com diuen dos membres de la Guardia Civil a “Sensores inteligentes la nueva frontera de la accion operativa”: Hemos de dotar a nuestros agentes de dispositivos tecnológicos que les permitan
realizar rápidas consultas contra el Big Data de la Guardia Civil de aquellos elementos necesarios para su investigación, con respuestas en tiempo real, haciendo uso de dispositivos tecnológicos que automaticen la adquisición de datos es un reto que ha de afrontarse sin demora” (enllaç al document), al menys nominalment la Guardia Civil, segons aquest text disposa d’eines Big Data operatives...  

En la mateixa línia de saber cap on van està el seguiment de les jornades que es van celebrant, organitzades per diferents institucions dedicades a la seguretat, per exemple un seminari sobre Big Data celebrat el 30 de maig de 2013  (presentacions de les jornades big data i defensa), el Congrés sobre seguretat ciutadana en entorns des mart city (enllaç al congrés)  i les Jornadas de Ciberdefensa del més d’abril de 2014, a l’enllaç que segueix hi ha penjades les presentacions i els videos, especial interès te el de les xarxes TOR (presentacions i vídeos de les jornades de ciberdefensa).

En resum, malgrat que ens manquen dades, podem dir que l’Estat Espanyol” és una institució participativa a nivell Europeu en cibercriminologia i que te els ulls posats en internet i les xarxes socials...

I això només per les estructures estrictament del govern central, d’altres estructures com les de les autonomies, especialment el Mossos d’Esquadra són fins i tot més opaques.

AVIS A NAVEGANTS.

Ara no caiguem en la por i la paràlisi, si be quantitativament el control és cada cop més gran, també, qualitativament les nostres possibilitats de defugir-lo són també més grans, sentit comú, prudència i emprar prudentment els mitjans tecnològics ens permetran anar superant la era del Big Data.


SALUT I ALEGRIA

Cap comentari:

Publica un comentari a l'entrada