La
capacitat d’emmagatzemar informació ha anat creixent a mesura que es
desenvolupava la societat de dominació. Des de els arxius reials de Sumer fins
al emmagatzemament al núvol em fet un llar camí. Però ha estat a partir de la
dècada dels 90 en que aquesta acumulació s’ha disparat fins a nivells
absolutament aclaparadors. El 90% de la informació emmagatzemada actualment
s’ha generat a partir de 2010. El 2012 l’univers digital tenia 2.837 Eb i es
preveu que el 2020 en tingui 40.026 (40.000.000.000 de Gb) (enllaç al "digital universe") (wikipedia unidades de información.
Aquest
creixement exponencial de les dades acumulades va fer emergir la idea de que
aquesta informació podia ser molt valuosa i generar considerables beneficis,
les companyies de marketing, les corporacions financeres i les d’asegurances
van ser provablement les primeres en valorar l’acumulació de dades i
desenvolupar eines per “extreure” aquest valor, així al 1992 apareix el primer
programa per detectar frau amb targeta de crèdit a temps real, i el 1998 es
funda Google amb el seu motor de recerca a la xarxa. Hores d'ara Google mou
25Pb d'informació al dia, es fan 3.000 milions d'accions a FACEBOOK, hi han més
de 400 milions diaris de missatges (2012) a TWITER i al mercat de valors dels
EUA es fan 7.000 milions d'operacions diàriament... i totes aquestes xifres
estan creixent a bona velocitat.
Simultàniament
a l'interès corporatiu (i potser abans), els serveis d’intel·ligència dels
estats van veure tot el potencial d’informació i d’estratègia que podien treure
seguint els passos de les corporacions. La subordinació dels estats a les
corporacions ens pot fer pensar que les anàlisis de dades dels estats, de fet,
són encàrrecs d’aquestes. I, per tant, els estats anirien a remolc de les
corporacions.
(més avall continua la informació...)
(més avall continua la informació...)
A
finals dels anys 90 es va posar de moda el terme “mineria de dades”, aquest
terme ha estat desplaçat per el de Big Data, malgrat que no volen dir el
mateix, una és un mètode de tractament i l’altra és la qualitat del recurs. La
definició de Big Data encara no està fixada i segons el definidor varia
notablement, però, normalment, es refereix a totes les dades de fonts “obertes”
i tancades que poden ser tractades mitjançant mètodes estadístics informàtics,
mètodes als que també es refereixen sovint com a “big data”. Bàsicament es
tracta d'establir patrons i fer prediccions “fiables”.
A
l'estat espanyol, des de els temps dels ordinadors Berta (policia) i Duque de
Ahumada (guàrdia civil), allà cap els anys 90 ha plogut molt i la informació,
les bases de dades i el maquinari a disposició de les Forces Armades i els
Cossos de Seguretat de l'Estat (FACSE) a crescut exponencialment. A partir de
la substitució de l'obsolet Berta per l'ordinador Clara és difícil trobar
rastres de les inevitables modificacions i ampliacions que sens dubte s'han
anat produint.
Aquesta
opacitat és fins i tot reconeguda, en un document del CESEDEN, on referint-se a
l'OSINT (en l'argot dels serveis d'intel·ligència la informació procedent de
fonts obertes) diuen “El propio CNI, al hacer referencia a sus fuentes de
información, destaca principalmente las humanas, seguida de la información
obtenida por medios técnicos, la facilitada por otros servicios de Inteligencia
y en mucha menor medida la que procede de fuentes abiertas. Aún así, otras
informaciones no oficiales confirman la utilización cada vez en mayor medida de
fuentes abiertas tanto en el CNI, como por el CIFAS” (enllaç al document).
Així
doncs els serveis d'intel·ligència de l'estat (el CNI, el CIFAS, els de la
Guardia Civil i la Policia... ) no semblen estar massa disposats a donar-nos si
més no una idea de les seves activitats en la obtenció d'informació de fonts
obertes i tancades sobre nosaltres i les nostres activitats, cosa normal des de
la seva lògica. Per fer-nos una idea haurem de fer servir fonts aïllades i
fragmentaries i comparar-nos amb d'altres països.
Del
que si podem trobar molta informació, i ens dona una idea del potencial
acumulat, són les noticies de la forta incidència del càncer entre els
treballadors dels CPD, especialment el de la policia a l'Escorial i que els
sindicats i alguns serveis mèdics atribueixen als camps elèctrics i
electromagnètics.
EL
PODER “TIC” DE L'EXERCIT I EL MINISTERI DE L'INTERIOR.
No
hem trobat referències recents sobre els ordinadors dels dos ministeris (qui en
tingui que les comparteixi), però s'ha fet al llarg dels més de 10 anys de la
implantació del ordinador Clara moltes inversions i un gran esforç
d'actualització.
En
el moment d’implantar els 3 terabits de Clara (6 si comptem el mirall), l’any
2000, semblava molta capacitat. En aquells moments 10TB eren el súmmum de la
capacitat, un valor difícilment assolible, avui en dia 1.000 TB no donen cap
problema, de fet ocupa menys d’un rack i un CPD pot tenir multitud de racks
(10, 20, 30...PB).
El
sistema d’hisenda que històricament estava constituït per el mític ordinador
Rita (un únic CPD), es composa ara mateix de 6 CPD, tots ells d’una capacitat
molt superior a l’obsolet Rita.
En
un altra ordre de coses, i per comparar, el conjunt de CIA+ FBI+ NSA+ altres
agències USA, disposa d’una capacitat suficient per menjar-se tot internet sense
patir indigestió. Els estats disposen d’una capacitat pràcticament il·limitada
d’emmagatzemament (l'emmagatzemament
cada cop és més econòmic), ara el problema (en vies de resolució) és el
processament de tota aquesta informació.
A
tall d'exemple només durant 2013 el Ministeri de Defensa a concertat contractes
relacionats amb les TIC per valor de 877,79 milions d'euros a INDRA (el
principal proveïdor), 14,77M€ a IBM, 6,32M€ a Cassidian, 5,28M€ a Tecnobit...
en total la despesa supera de molt els 1.000 milions d'euros. I aquestes dades
són sols per contractes de més de 18.000€ (sense IVA), per sota d'aquesta xifra
no cal informació pública, suposem també que hi han contractes de més de 18.000
dels que no necessiten donar comptes...
Sempre
que es dona una mirada a la despesa TIC, ja sigui al Ministerio de Defensa com
a la Generalitat de Catalunya, INDRA resulta ser la empresa més afavorida en
termes econòmics, ja sigui en el control dels sistemes de joc, del DNI,
d'Hisenda.... o de les Forces Armades i dels Cossos de Seguretat. No sols això,
també és el proveïdor estranger més important del cos de Marines dels EUA.
La
tendència no variarà al llarg de 2014, de fet, fins març, INDRA ja tenia
contractes per valor de 47,89 milions d'euros... i la majoria de la
contractació s'acumula a partir del segon trimestre de l'any, a finals de 2014 la xifra s'haurà
incrementat força.
IBM
va fer un bon negoci el 2013, i aquest negoci estava relacionat en la seva
totalitat en el actuacions en software i manteniment de la plataforma HOST
(funcionament del CPD) del Ministeri, casi 15 milions en el tema... un
pessiguet menor se l'emporta Hewlett Packard pràcticament sols un milió, però
entre els conceptes hi ha el manteniment de sistemes Integrity Superdome de
Centre de Processament de Dades (CPD) que solen tenir una capacitat de 8
terabits (molt lluny dels 3 teras de cada ordinador “clara”).
Amb
les dades de que disposem podem suposar que la potència d'emmagatzemament i
processament dels Ministeris de l'Interior i Defensa són molt considerables,
malgrat que la dedicació al seguiment i explotació de les dades sobre els
ciutadans no la puguem quantificar.
Es
pot espigolar entre la munior de dades sobre la contractació pública en els següents
enllaços (enllaç amb contratación del estado,
infodefensa).
ELS “MINISTERIOS”
ESTAN MOLT INTERESSATS EN LA TEVA VIDA... I ACUMMULEN MOLTA INFORMACIÓ SOBRE
ELLA.
A
les bases de dades actuals, s'acumulen
milions de dades sobre la teva vida... un capital d'informació com
aquest no pot deixar de ser explotat, així que, igual que telefònica te la seva
filial que ven informació tractada amb metodologia de la Big Data, en el cas de
les dades a disposició de les FACSE (Forces Armades i Cossos de Seguretat de
l'Estat), no hi ha cap dubte de que s'està avançant (potser fins i més ràpid
que en el sector privat) en aquesta direcció.
En
un primer mirada (però segur que en son moltes més) les dades que tots sabem
que l'estat, i especialment la poli te (o disposa fàcilment d'elles) són:
-Les
dades personals de detinguts, implicats, condemnats i en busca i captura (sexe,
petjades dactilars (les dels 10 dits), costums, ideologia, raça... fins a més
de 60 items, incloent temes absolutament d'opinió dels farcidors de la base a
aquesta base en diuen PERPOL la de la Policia i INTPO la de la Guardia Civil.
-Les
dades d'ADN de moltes de les persones del fitxer anterior i una bona part de
“desconegudes”.
-Els
26 milions de permisos de conduir i dades dels més de 30 milions de vehicles.
Infraccions, multes, pèrdues de punts...
-La
base de dades del DNI (DNIFIL), imatge de la cara, petjades dactilars del dit
índex....a l'estat hi ha unes 38M de persones de més de 16 anys.
-La
base de dades sobre menors “d'interès” policial i els seus familiars.
-La
dels passaports, recordem que els passaports tendeixen a tota la UE a ser
biomètrics.
-La
base d'estrangeria on es recullen les dades sobre tots els estrangers resident
i la seva situació, en diuen ADEXTRA (dades d’uns 5 milions de persones).
-El
Sistema d’Informació de Schengen (SIRENE), el visat Schengen conté dades
biomètriques dels 10 dits de les mans i de la cara, cada any s’expedeixen 13
milions de visats als països de l’Espai Schengen.
-Les
dades de les 55 milions de línies de telèfon mòbils (incloent la situació) i
les de les 19M de fixes, total 74 milions, cal recordar que les operadores han
de guardar dos anys aquestes dades, encara que hi ha una sentència del Tribunal
Superior Europeu que tomba aquesta directiva..
-Els
dos anys d'activitats a internet des de cada IP que les operadores estan
obligades a guardar (algunes en guarden més), correus electrònics, visites,
compres, chats....
-Dades
sobre la propietat o el lloguer d'habitatges (uns 25 milions).
-Registre
de les 4.500.000 armes de foc legals i dades sobre les 300.000 il·legals estimades.
-Les
dades del cens.
-Les
histories laborals de tot aquell que alguna vegada hagi treballat en blanc.
-Dades
de la seguretat social, nombre de visites, de quina especialitat i on s'han
efectuat, ingressos hospitalaris, baixes (de moment l'historial clínic sembla
estar fora del seu abast, però no en tingueu la seguretat).
-Evidentment
les dades fiscals de totes les persones “físiques”.
-Contractes
de serveis, electricitat, gas, aigua i els seus consums....
-Les
fitxes de pernoctacions en allotjaments hotelers (el 2013 285.9M).
Les
dades que s’acumularan en el nou fitxer que vol constituir el Ministerio
d’Economia amb tots les dades financeres de totes les dades bancàries de tots
els habitants del país, fitxer al que tindrà accés la policia i el CNI.
Cal
també afegir les dades obtingudes
mitjançant la intervenció de telèfons amb el sistema SITEL (SITEL wikipedia),
el sistema SITEL, a més de la conversa registra data, hora, durada,
identificació IMEI, números de telèfon, tipus d’info continguda (text,
àudio...) identitat dels titulars dels telèfons... el sector de les
comunicacions avalua el nombre total d’intervencions el 2012 en un milió, en
aquest cas queden enregistrades les conversacions i el contingut dels missatges.
Tan el tribunal Suprem com l’Agència de Protecció de Dades considera SITEL
totalment legítim i constitucional.
Crec
que tots tenim més o menys clar que qualsevol sicari del poder amb autorització
(o sense, per exemple tenim el cas de les fotos del DNI dels jutges pel dret a
decidir) prement un boto i donat el teu DNI, o alguna altra identificació, pot
obtenir totes, o bona part d'aquestes dades...
Però
des de l'estat (i les corporacions) volen anar una mica més endavant, igual que
van els estats punters (els que ofereixen un millor servei) i explotar les
dades en conjunt, com si d'un treball de marketing es tractés. Més enllà de
tenir un persona ben classificada (fitxada) acumular dades no te cap utilitat,
només el tractament d'aquestes dades les valoritza i permet emprar-les per fer
prediccions, per localitzar nodes de relació, per identificar al mon real les ciberidentitats...
AL
MINISTERIO DE DEFENSA L'INTERESSA LA METODOLOGIA DE LA BIG DATA.
Malgrat
l'hermetisme referent a eines, instruments, estructures... el Ministerio ha
produït una bona quantitat de literatura, ponències, estudis, informes... sobre
el tema
En
l'informe més complet “Big Data en los entornos de defensa y seguridad” editat
per l’Instituto Español de Estudios Estratégicos (IEEE) (enllaç al document)
es marquen 12 grans usos per les metodologies Big Data:
1.-Detecció
d’intrusió física en grans espais o infrastructures obertes.
2.-Computació
sobre informació encriptada.
3.-Anàlisi
automàtic de vulnerabilitat de la xarxa (maquinari i tràfic de dades).
4.-Criminologia
computacional.
5.-Us
fraudulent de recursos corporatius i/o sensibles.
6.-Anàlisi
de vídeo en temps real / recerca i recuperació ràpida en llibreries de vídeo.
7.-Intel·ligència
visual en màquines.
8.-Identificar
anomalies, patrons i comportaments en grans volums de dades.
9.-Anàlisi
de text (estructurat i no estructurat) com recolzament a la presa de decisions
en temps real en entorns intensius de dades.
10.-Consciència
situacional.
11.-Traducció
automàtica a gran escala (en nombre d'idiomes i en volum).
12.-Predicció
d'esdeveniments.
Com
que el nostre interès està centrat a la vida quotidiana, repassarem els temes
el 4, 9 i 12 que estan més lligats a mètodes nous d’explotació de fonts
tradicionals més endavant mirarem d’esbrinar els temes compresos al 6 i el 7,
ja que aquests semblen ser els temes de més futur, el control social en temps
real mitjançant mètodes de visió artificial.
Tot
fent transparents als súbdits de sa majestat:
De
nou ens trobem amb que les dades públiques son escasses, sols tenim les dades
que es trasllueixen de les activitats normals de les FACSE i les d'alguns
projectes finançats per Europa (sols alguns naturalment) que sense ser
transparents són translúcids...
Així,
per exemple en l’informe sobre Big Data i defensa abans esmentat es dona compte
d’un programa desenvolupat per les agències dels EUA i comercialitzat per IBM,
el COPLINK i no es fa esment de diversos programes que s’estan desenvolupant
per part de l’Agència de Defensa Europea i per part de la OTAN, amb participació
de l’exercit espanyol.
El
cas de COPLINK, es tracta segurament d’una de les aplicacions més esteses d’intel·ligència
policial, emprat en els EUA i en més de 25 països de la OTAN, es de sospitar
que la policia espanyola en disposa.
El
programa permet el seu us des de dispositius mòbils, gestiona ases de dades i
pot identificar sospitosos mitjans elles, entre d’altres te una aplicació de
reconeixement facial i d’elaboració de mapes de delictes... El seu tret més
suggeridor és la possibilitat d’anàlisi de xarxes, amb la possibilitat de
descobrir organitzacions formal e informals, sub organitzacions i identificar
els nuclis centrals, els membres claus i els patrons de relació entre ells (video sobre COPLINK)
Però
és que l’Estat Espanyol participa, com mínim, en el projecte OSEMINTI de la EDA
junt amb França i Itàlia, l’acrònim del projecte vol dir “Operational Semantic
Intelligence Infrastructure”. El sistema permet analitzar informació en
espanyol, francès, anglès, italià i en alguns casos en àrab clàssic i pot
analitzar tot tipus de missatge escrit o sonor. Es tracta d’una versió europea,
més sofisticada, del mític “carnivore” dels EUA. Espanya aporta 1.856.000€, un
30% del cost (Veure document) (aprovació del projecte OSEMINTI).
La
Unió Europea te també el projecte INDECT, que pretén monitoritzar i fer un
seguiment de continguts multimedia en temps real. Te per un apart aplicació en
les imatges de videovigilància, però també en l’anàlisi en continu de l’univers
web (pàgines, forums, xarxes socials...). El projecte ens costarà com a mínim
11 milions. Els socis que participen són les polis d’Irlanda del Nord i Polònia
i tot un seguit d’universitats i empreses. Entre les universitats hi ha la
Carlos III de Madrid que es dedicarà al tema de “observació, anàlisi i detecció d’activitats criminals i amenaces en
entorns virtuals complexos”.(pàgina del projecte INDECT)
Com
abans, la manca d’informació pot ser sempre vorejada mitjançant informació
contractual, d’aquesta manera podem dir que durant el 2013 el ministerio es va
gastar (com mínim) 2.600.000€ en “guerra electrònica” uns 2 milions per INDRA i
600.000€ per GMV.
De
tota manera per el Ministerio de Defensa la guerra electrònica es centra més en
temes d’intercepció de comunicacions convencionals i es centre molt en el
“Programa Santiago” que és un programa “emblemàtic” d’intercepció de
comunicacions.
En
aquest marc cal inserir els articles en publicacions especialitzades, i
publicacions mongràfiques diverses, per aquest camí també podem copsar cap on
van o a on estan.
Així
per exemple al document “Redes sociales fuentes de OSINT” del Instituto Universitario de Investigación sobre Seguridad Interior es diu “Desde
un punto de vista más operativo, las Redes Sociales pueden llegar a movilizar
rápidamente a grandes cantidades de personas, con los problemas de seguridad
que ello puede generar, asociados a toda concentración masiva. Es por ello por
lo que conviene atender sus contenidos, con objeto finalmente de garantizar la
seguridad de todos los ciudadanos. Por otro lado, a través de las Redes, los
ciudadanos se avisan con rapidez también contra acciones que puedan estar
llevando a cabo las FFCC de seguridad. Esto significa que las operaciones en
calle alcanzan un nuevo nivel del concepto de “públicas”. Entre ellas está el
riesgo de grabaciones de vídeo que pueden ser subidas al instante a YouTube
exponiendo públicamente a los operativos. Por otro lado, se han estado
utilizando con frecuencia para dificultar desahucios o para impedir la
identificación de inmigrantes”. (enllaç al document)
Tenen molt clar però que les xarxes son una eina de
doble us, a la publicació de la guardia Civil “Ciberamenazas y redes sociales”
diuen “Advertíamos de la utilización de la Red, y de los
Medios Sociales, para el adoctrinamiento y la radicalización. La parte positiva
es que todos los contenidos en Red quedan en la misma, en muchos casos con
carácter abierto. Por tanto es posible rastrear información, monitorizar webs,
palabras clave, entidades, de interés para los servicios de seguridad de los
Estados, respetando la legalidad y la privacidad en base a las normativas de
cada uno de ellos” (enllaç al document).
I també tenen molt clares les eines que han de fer
servir, com diuen dos membres de la Guardia Civil a “Sensores inteligentes la
nueva frontera de la accion operativa”: “Hemos de dotar a nuestros agentes de
dispositivos tecnológicos que les
permitan
realizar
rápidas consultas contra el Big Data de la Guardia Civil de aquellos elementos necesarios para su
investigación, con respuestas en tiempo real, haciendo uso de dispositivos
tecnológicos que automaticen la adquisición de datos es un reto que ha de afrontarse
sin demora” (enllaç al document), al menys
nominalment la Guardia Civil, segons aquest text disposa d’eines Big Data
operatives...
En la mateixa línia de saber cap on van està el
seguiment de les jornades que es van celebrant, organitzades per diferents
institucions dedicades a la seguretat, per exemple un seminari sobre Big Data
celebrat el 30 de maig de 2013 (presentacions de les jornades big data i defensa), el Congrés sobre seguretat ciutadana en entorns des mart city (enllaç al congrés) i les Jornadas de Ciberdefensa del
més d’abril de 2014, a l’enllaç que segueix hi ha penjades les presentacions i
els videos, especial interès te el de les xarxes TOR (presentacions i vídeos de les jornades de ciberdefensa).
En
resum, malgrat que ens manquen dades, podem dir que l’Estat Espanyol” és una
institució participativa a nivell Europeu en cibercriminologia i que te els
ulls posats en internet i les xarxes socials...
I
això només per les estructures estrictament del govern central, d’altres
estructures com les de les autonomies, especialment el Mossos d’Esquadra són
fins i tot més opaques.
AVIS A NAVEGANTS.
Ara
no caiguem en la por i la paràlisi, si be quantitativament el control és cada
cop més gran, també, qualitativament les nostres possibilitats de defugir-lo
són també més grans, sentit comú, prudència i emprar prudentment els mitjans
tecnològics ens permetran anar superant la era del Big Data.
SALUT I ALEGRIA
Cap comentari:
Publica un comentari a l'entrada