Re: [Aisa.circuli] Open o Free (as in freedom) Research? (wa…

Delete this message

Reply to this message
Autor: Mario Annunziato
Data:  
A: 380°
CC: aisa.circuli
Assumpte: Re: [Aisa.circuli] Open o Free (as in freedom) Research? (was Barcelona declaration on Open research information)
Buongiorno,

siamo in un'era di inflazione di vocaboli, vediamo
cosa dice la Treccani a proposito di 'metadato'.

Facendo una ricerca sul sito di Treccani per la parola 'metadato'
non c'è una voce specifica del vocabolario, ma solo alcuni riferimenti
indiretti.

Per il vocabolo 'dato' risulta una definizione abbastanza estesa:

https://www.treccani.it/vocabolario/dato/?search=dato%2F


"... Ciò che è immediatamente presente alla conoscenza, prima di ogni
forma di elaborazione: d. della sensazione; d. sperimentali, i risultati
di una determinata esperienza scientifica; dati di un problema, i valori
noti (o presunti noti) di talune grandezze, mediante i quali, sulla base
delle relazioni e condizioni presupposte nell’enunciato del problema, ci
si propone di determinare i valori incogniti di altre grandezze.
..."

prosegue anche per le discipline informatiche.

Probabilmente "meta-dato" nasce con il prefisso "mèta-";
questo il responso :-) di Treccani:

https://www.treccani.it/vocabolario/meta_res-749734e1-0025-11de-9d89-0016357eee51/?search=m%C3%A8ta-%2F

"1. Prefisso di molte parole composte derivate dal greco o formate
modernamente (anche nella terminologia lat. scient.), che indica in
genere: ..."

segue una lista di casi di utilizzo. Quello che mi sembra più
appropriato,
nel tentativo di dare una definizione alla parola 'metadato', è il caso
'd' seguente:

"d. Infine, per influenza del termine metafisica, erroneamente
interpretato come «scienza di ciò che trascende le cose naturali»
(mentre il sign. originario è «trattazioni posteriori a quelle circa la
natura», gr. τὰ μετὰ τὰ ϕυσικά), il prefisso ha acquisito il valore di
trans- ed è stato adottato in età moderna per designare scienze o forme
di considerazione teorica, concernenti zone di realtà analoghe a quelle
che sono oggetto della scienza al cui nome meta- è premesso, ma giacenti
comunque al di là dei loro confini (v. metalinguaggio, metamatematica,
metapsichica, metastoria, ecc.)."

Tuttavia in questo senso la possibile origine di 'mèta-dato' o
'trans-dato' mi pare inappropriata,
in quanto l'apposizione è usata davanti a discipline di studio.

Voglio dire che la parola metadato, non appare ben definita o
definibile, almeno sul vocabolario
Treccani con buona pace di Wikipedia, tuttavia sta diventando di uso
corrente.
Questo per sottolineare ancora una volta come certi termini possano
risultare troppo
vaghi ed imprecisi per essere usati in certi contesti.



Il 2024-05-17 12:58 380° via Aisa.circuli ha scritto:
> Buongiorno,
>
> scusate se commento con così ampio ritardo...
>
> "Mario Annunziato via Aisa.circuli" <aisa.circuli@???>
> writes:
>
> [...]
>
>> Personalmente osservo che i termini dati e metadati sono molto
>> generici,
>
> in realtà quei termini dovrebbero avere un significato molto ben
> preciso
> per tutti i ricercatori, non dovrebbe esserci nessuna ambiguità, con
> l'accortezza che il termine "dato/i" in _tutti_ gli ambiti di ricerca
> _deve_ essere interpretato in senso _informatico_ (senza mai perdere di
> vista quello _epistemologico_ [1]):
>
> dati:
> https://en.wikipedia.org/wiki/Data_(computer_science)
>
> metadati:
> https://en.wikipedia.org/wiki/Data_(computer_science)#Characteristics
> «Metadata helps translate data to information. Metadata is data about
> the data. Metadata may be implied, specified or given.»
> (si veda anche https://en.wikipedia.org/wiki/Metadata)
>
> la cosa fondamentale che tutti i ricercatori dovrebbero comprendere è
> che dati e metadati _non_ sono separabili... e che in genere i dati
> sono
> metadati di altri dati da un punto di vista epistemologico... è un
> processo _ricorsivo_
>
>> e vorrei vedere quanto sono trasparenti gli algoritmi che generano
>> questi ranking.
>
> bingo! :-D
>
> poter "vedere" gli algoritmi però non è sufficiente perché gli
> algoritmi
> sono "parole": è l'implementazione che conta, il software.



Certo! non solo l'implementazione, ma anche il singolo 'run'
dell'elaborazione,
ovvero il LOG passo-passo dell'esecuzione. Solo così si può raggiungere
la
totale trasparenza dell'elaborazione.


>
> detto in altri termini, tutte le ricerche (il ranking è frutto di una
> ricerca [2]):
>
> 1. implicano l'uso di software (sfido a trovare oggi una sola ricerca
> che non faccia uso di software), che implementa determinati algoritmi
>
> 2. implicano l'elaborazione di dati e matadati da parte del software di
> cui sopra
>
> inoltre, per essere considerate scientifiche le ricerche _devono_
> essere
> riproducibili [3] (altrimenti è /opinione/); conditio sine qua non per
> la riproducibilità (replicabilità) della ricerca è:
>
> «the results should be documented by making all data and code available
> in such a way that the computations can be executed again with
> identical
> results.»
>
> va da sè che il "code" citato sopra NON deve essere proprietario,
> altrimenti non è disponibile "in such a way..."
>
> in caso contrario, la "replication crisis" [4] rischia di diventare
> _endemica_ in tutte le ricerche scientifiche
>
> ecco perché non basta chiedere la trasparenza (cosa vuol dire?) dei
> dati: è assolutamente necessario che i ricercatori possano
> _liberamente_
> utilizzare dati, metadati _e_ software _esattamente nei termini
> specificati nelle 4 libertà del software libero:
>
> --8<---------------cut here---------------start------------->8---
>
> Freedom 0: The freedom to use the **data, metadata and program** for
> any
> purpose.
>
> Freedom 1: The freedom to study how the program works, and change it to
> make it do what you wish.
>
> Freedom 2: The freedom to redistribute and make copies so you can help
> your neighbor.
>
> Freedom 3: The freedom to improve the program, and release your
> improvements (and modified versions in general) to the public, so that
> the whole community benefits.
>
> --8<---------------cut here---------------end--------------->8---
> (ho adattato la Freedom 0)
>
> per dirla con un motto: «Free software, Free science»
>
> senza girarci troppo attorno, il copyright (che riguarda anche le
> _banche dati_) è uno dei grossi ostacoli alla libertà scientifica.
>
> [...]
>
>> Un po' di concorrenza farà bene tra i produttori di ranking ...
>> E' un po' come dire che fa bene la concorrenza tra ciarlatani.
>
> :-D
>
> la meta-scienza è un micidiale modo per smascherare i ciarlatani,
> effettivamente
>
>> Il 2024-04-16 11:14 Maria Chiara Pievatolo via Aisa.circuli ha
>> scritto:
>
> [...]
>
>>> La pubblicità dei dati non rende i ranking meno discutibili: li rende
>>> soltanto - e questo è certamente un aspetto importante - più facili
>>> da discutere.
>
> sì ma "solo" perché dichiarazioni come la "Barcelona declaration" di
> cui
> si discute in questo thread avanzano delle richieste del tutto
> insufficienti
>
> avere i dati e i metadati (che poi, vogliamo discutere delle
> _condizioni_ poste all'accesso?!?) è _ampiamente_ insufficiente
>
> serve anche il codice, _anche_ dei sistemi di ranking: solo i
> /ciarlatani/ non lo vogliono mostrare, perché si esporrebbero alla
> ridicolaggine


per quel poco che viene detto sui 'ranking', tipo 'impact factor', che
conteggiano
le citazioni, già questo per me è sufficiente a bollarli come ciarla,
non trovo necessario approfondire oltre.
La trasparenza sarebbe utile per mettere in discussione la legalità di
questi 'strumenti'.


saluti

M.A.

>
> [...]
>
> Cordiali saluti, 380°
>
>
> [1] es. https://en.wikipedia.org/wiki/Epistemology (cercare "data"),
> https://en.wikipedia.org/wiki/DIKW_pyramid
>
> [2] le classifiche sono frutto di "benckmarking", ovvero "analisi
> comparativa"
>
> [3] https://en.wikipedia.org/wiki/Reproducibility
>
> [4] https://en.wikipedia.org/wiki/Replication_crisis