Lähettäjä: xDxD.vs.xDxD Päiväys: Vastaanottaja: hackmeeting Aihe: Re: [Hackmeeting] dati aperti
2011/1/4 billie <billie@???>
> bhe, scusa, se la metti cosi, allora anche semplicemente quando fai la
> survey (cioè quando crei il questionario, raccogli i dati) stai
> scegliendo che domande fare, e quindi dai dei giudizi di valore. ed è
> una forma di potere.
>
> ah, sì, son daccordo. infatti il "problema" non è esattamente questo, ma già
scrivo troppo quando scrivo e non volevo esagerare :)
sorry di non essere stato abbastanza chiaro. faccio un breve chiarimento nel
messaggio dopo.
> per quanto riguarda gli indicatori ci sono degli standard che sono
> definiti a livello internazionale da OCSE, ILO ecc..
>
sissì, conosco. e, ripeto, non ne faccio un discorso di "intenti", quanto di
metodo, perchè:
> qui ci sono due cose secondo me interessanti:
> 1. guardare la struttura della rete è metà dell'analisi, l'altra metà è
> ovviamente guardare gli "attributi" o indicatori del soggetto.
> la scelta di uno o l'altro metodo dipende, direi, dalla domanda di
> ricerca che hai.
> a meno che tu nn stia facendo descriptives, e allora tutte e due sono
> importanti.
>
super-daccordo con questo, ma:
> il punto è che nn è che è statistica vs. reti..
questo è vero sulla carta ma non purtroppo nella maggior parte dei fatti.
perchè nei fatti purtroppo si cercano pochi dati sintetici (indicatori e
percentuali) e ci si scorda allegramente dei sistemi complessi che portano a
certe cose, delegando alla figura degli "esperti" che interpretano le
percentuali.
il che, voglio dire, non è nemmeno malissimo, perchè di esperti decenti ce
ne sono eccome. E' solo che altre strade vengono purtroppo percorse assai di
meno, ed è un peccato, perchè la ricchezza che si ottiene osservando le reti
spesso è una bella sveglia.
però sono anche daccordo, a conti fatti, che non è per nulla chiaro dire
"statistica vs reti".
> 2. quando analizzi i dati, lasciare che i dati emergano, suppongo tu
> intenda dire, fare modelli unsupervised o di machine learning in
> generale. che a differenza della statistica tradizionale, sono modelli
> non parametrici. quindi che a priori nn attribuisco un modello ai dati,
> ma faccio patter recognition, cioè vedo cosa "emerge"...
> anche io penso che questa cosa sia importantissima, ed è una parte della
> statistica che sta prendendo piede sempre piu'...pero' calcola che sono
> pochi anni che si possono fare studi su basi dati vere e nn simulando :)
>
> sì. pure qui: c'è da dire che con le analisi multivariate e le loro
evoluzioni caotiche ed "esperte" si è introdotta una certa intelligenza
nelle ricerche statistiche e sociologiche. vedemm'
> > dovevate vedere la faccia: mostrando una rappresentazione sperimentale
> sui
> > dati
> secondo me devi stare attento a non confondere rappresentazione con
> analisi dei dati..
>
ero appena stato stuprato da delle enormi tabelle piene di numeri e
percentuali, che si scontravano violentemente coi miei meravigliosi grafici
interattivi, in un piano di battaglia realmente bloody-burocratico.
sì: probabilmente lì per lì non ho saputo raccontare un granchè bene "a cosa
servissero" le rappresentazioni che avevo preparato. peccato: ci riproverò
:)
> molto carina questa cosa :)
> quindi pero' qui parli di dati anonimizzati ecc..
> cioè nn credo manco che IRES abbia accesso ai dati pre-anonimizzati..
>
questa è una cosa interessantissima: la regione Emilia Romagna ha avuto
problemi, infatti, perchè le regioni non sono in grado di darti
"automaticamente" nulla, tantomeno dei dati anonimizzati e trattati in modi
chissà quanto elaborati. Di quelle con cui ho trattato solo la lombardia sta
predisponendo dei servizi decenti, magari addirittura con dei web service,
per distribuire dati secondo accordi e protocolli applicativi. ma nemmeno
loro ancora ce li passano in quel modo. penso semplicemente che non siano
ancora pronti.
e, comunque la gestione del dato (anonimizzazione, normalizzazione,
georeferenziazione...) la deve fare chi lo riceve, per adesso, andando
incontro anche a diversi simpatici incubi (nomenclature differenti
nonostante gli standard, interpretazioni differenti degli standard, standard
non rispettati, cose inventate, campi vuoti, campi usati in un altro modo
rispetto a quel che ci dovrebbe essere scritto dentro, commenti
improbabili.... insomma, unbel delirio :) )
> cioè bho ci spacchiamo le palle per anonimato e robe cosi..
> e poi vorremmo che tutti dati micro a livello amministrativo fossero
> resi pubblici. con scritto tutta la mia vita, sociale e lavorativa?
> nn capisco...
>
info su questo: è un problema aperto, apertissimo. le regioni adesso, sia
per processi delle singole regioni sia secondo indicazioni di vari
ministeri, stanno tirando su fior fior di sistemi informativi, con lo scopo
di applicare una logica SAP-like alle persone: part-number e via, ti traccio
da cima a fondo. E per quello che riguarda la gestione va pure bene (in
lombardia per esempio si sono inventati il sistema delle "doti" che va alla
grande, almeno sulla carta). Però paradossalmente apre un mare di problemi
con l'integrazione verso l'esterno. E la privacy è proprio uno di questi
problemi: se ti do' il "part number" delle persone, delle comunicazioni, dei
contratti eccetera, c'è violazione della privacy, se non te lo do' non c'è
verso di fare gli incroci e quindi i dati te li dai in fronte.
L'anonimizzazione dei dati per ora sta al "buon cuore" (e alle indicazioni
perentorie di ministeri e regioni): noi l'abbiamo fatta, ma non è che
nessuno ci abbia mai controllato più di tanto. Si sono raccomandati a
riguardo: mi raccomando! levate i dati sensibili! :) E però questo è ancora
un ambito assai protetto, dentro un progetto interno di un ministero, e
quindi penso che prima di aprirsi provvederanno a predisporre meccanismi
migliori. O, almeno, questo mi sembra l'andamento.
insomma, a conti fatti adesso è un bordello, ma in realtà i percorsi
sembrano decenti. Se non ci fossero dei "man in the middle" così grossi (sia
tra gli "scientifici" che tra gli "integratori" che tra gli "istituzionali"
), in realtà lo scenario sarebbe anche interessante: in realtà si potrebbero
attuare un sacco di cose molto utili.