Visualizzazioni totali

Machine learning: le macchine apprendono dai beni culturali

“Data Scientist” è stato definito come il titolo per annunci lavorativi più sexy del XXI secolo. Questo perché nell’ultimo decennio si è assistito a una vera e propria esplosione della quantità di dati prodotti e immagazzinati. Questa mole di dati contiene preziose informazioni, che possono essere impiegate dalle società per prendere decisioni e fare predizioni in diversi ambiti: l’analisi dei mercati, il processing delle immagini per il riconoscimento facciale e la biologia computazionale per l’individuazione di tumori sono solo alcune delle possibili applicazioni.

Una delle competenze che caratterizzano il data scientist è il Machine Learning. Il Machine learning (ovvero apprendimento automatico delle macchine) è un insieme di metodi che insegna ai computer ciò che viene naturale agli umani e agli animali: imparare dall’esperienza. Gli algoritmi, infatti, impiegano metodi computazionali per apprendere l’informazione direttamente dai dati senza utilizzare una predeterminata equazione come modello. Il modello, ed eventualmente l’equazione, nascono dai dati stessi e da una loro completa comprensione. La performance dell’algoritmo migliora col crescere del numero di casi a disposizione, esattamente come nella realtà accumulare esperienze pregresse ci aiuta a prendere decisioni in modo più consapevole.

Lo scopo del machine learning è, quindi, quello di trovare degli schemi naturali nei dati, al fine di generare una profonda comprensionee aiutare a prendere decisioni o compiere predizioni nei più disparati campi di ricerca.

Esistono due tipologie di algoritmi.

Il supervised machine learning (appredimento supervisionato) fornisce al sistema un set di dati di cui si conoscono gli input e gli output (le risposte) e, successivamente, viene addestrato a creare un modello per produrre predizioni ragionevoli come risposta a nuovi dati. Questa categoria include le tecniche di classificazione, che predicono risposte discrete (ad esempio se un tumore è cancerogeno o benigno) e le tecniche di regressione, che forniscono risposte di variabili continue (ad esempio fluttuazioni di temperatura).

Il unsupervised machine learning (apprendimento non supervisionato), invece, riesce a trovare dei pattern nascosti all’interno dei dati, che però non presentano l’output della risposta da predire. Il clustering è la tecnica più comune ed è impiegato per analizzare in modo esplicito i dati e individuarne eventuali naturali raggruppamenti.

Ma in che modo avviene l’apprendimento? Quale è il processo a cui sono sottoposti i dati? Le sfide principali del machine learning sono legate al modo in cui trattare i dati e all’individuazione del giusto modello. Possiamo quindi suddividere il processo di apprendimento in 3 passi principali:
1) Data pre-processing: i dati provengono in tutte le forme e dimensioni. I dataset reali possono essere confusi e incompleti: pertanto, il primo passaggio consiste nell’organizzare e pre-analizzare i dati (ad esempio valutare eventuali outliers, ovvero anomalie, e dati mancanti). Il set di dati sarà quindi costituito da un insieme di istanze (gli esempi), a cui sono associate delle caratteristiche, dette attributi, che serviranno a predire l’output (attributo target).
2) Costruzione del modello e training: parte dei dati di partenza costituiranno il training set (dati di addestramento) che il modello prescelto utilizzerà per apprendere la trama e le regole che caratterizzano i dati.
3) Valutazione del modello: una volta individuato il modello, esso verrà testato e valutato su un set di dati di verifica, che consentiranno di comprenderne accuratezza e precisione. In questa fase si potrà valutare se modificare il modello, semplificandolo oppure aggiungendo complessità per rappresentare meglio il caso in esame.

Il grafico mostra l'andamento dell'indice di creatività (asse y) nell'arco storico tra il 1850 e il 1950 (asse x). La figura è stata riadattata da arXiv:1506.00711 

Prendere decisioni e fare predizioni è alla base di innumerevoli campi, dalla finanza alla diagnostica, ma in che modo il machine learning può incontrare il mondo dei beni culturali? Il gruppo di ricerca del Dr. Elgammal presso Rutgers’ Art and Artificial Intelligence Laboratory ha proposto un algoritmo in grado di indicare il livello di creatività di un dipinto considerandone il contesto storico-artistico. Il modello è stato valutato su 1700 quadri e ha riscontrato diversi interessanti risultati. Ad esempio, l’algoritmo associa a “Les demoiselles d’Avignon” di Picasso il più alto punteggio in creatività tra tutti i dipinti analizzati tra il 1904 e il 1911. Questo risultato è in linea con il pensiero degli storici dell’arte, che hanno indicato l’opera, per la sua pittura “piatta” e l’applicazione del Primitivismo, un primo esempio dello stile cubista di Picasso.

Questo lavoro mostra come, attraverso il machine learning, non sono solo gli umani a saper giudicare la creatività, ma anche i computer ne sono in grado e, forse, in modo anche più oggettivo!

Alessandra

Riferimenti bibliografici:

- Tom Mitchell, Machine Learning, McGraw Hill, 1997.
- Ian H. Witten, Eibe Frank, Mark A. Hall, Data Mining: Practical Machine Learning Tools and Techniques, Morgan Kaufmann.
- Ahmed Elgammal, Babak Saleh, Quantifying Creativity in Art Networks, arXiv:1506.00711
- https://theconversation.com/which-paintings-were-the-most-creative-of-their-time-an-algorithm-may-hold-the-answers-43157

Commenti

Etichette

Fisica Pigmenti Silvia Soncin Metalli Chimica Conservazione Colore Analisi Diagnostiche Diagnostica non invasiva Film&Art Musei Restauro Tecniche non invasive UNESCO Resti Umani Spettroscopia Datazione Elettrochimica Spettroscopia Raman Carta Ceramica Film Imaging Lapidei Spettrometro di Massa Archeometria Arte Contemporanea Audiovisivi Bronzo Corrosione Degrado Dipinti ENEA Gemme Laser Libri Machine Learning Materiali Materiali di origine animale Picasso Rame Sincrotrone Spettrometria di Massa Studi di provenienza Voltammetria di Microparticelle arte libro Adorazione dei Magi Alessadra Virga Antropologia Archeoastronomia Artemisia Gentileschi Biodeterioramento Cervello Cinema Coloranti Dagherrotipia Data Science Diagnosta Egitto Ercolano Firenze Galleria degli Uffizi Gialli di cadmio Graphic Novel Inquinamento Atmosferico Leonardo da Vinci Luce Mass Spectrometry Memoria Michelangelo Microscopia Monitoraggio Museo NfDW Ottica Papiri Parchment Pellicole Piombo Pittura Prodotti innovativi Proteine Restauro digitale Roma SERS Strumenti musicali Tecnologie Termoluminescenza Van Gogh Vesuvio ZooMS calce cancro del bronzo dipinti ad olio inchiostri isotopi stabili leganti radiocarbonio raggi-X supporto scrittorio ANEDbc ANOVA ATR Ablation Actinobatteri Adriana Iuliano Affresco Alabastro Alberto Angela Alimenti Ambiente Amedeo Modigliani Analisi degli Isotopi Stabili Analysis of variance Anton Cechov Antonio Stradivari Archeologia Giudiziaria Archeologia Invisibile Archeologia subacquea Archeology Archeomafie Argento Arsenico Arte Povera Arte moderna Artista Assorbimento Atacama Attribuzione Autobiografia Avorio Azzurrite Benzotriazolo Bible Bioprodotto Biopulitura Birra Blu Bolzano Book CSGI Calchi Cammeo Cantiere Cappella Scrovegni Casa del Bicentenario Ceprano Christie's Ciclo pittorico Cile Cina Cinquecento Cleaning Codice dei beni culturali Conservazione Preventiva Costantino D'Orazio Crimini contro il Patrimonio Culturale Cromatografia DESY DNA Datazione U-Th Datazione al radiocarbonio Declorazione Diamanti Diffrattometria Neutronica Dimorfismo Sessuale Donatello ESRF Edmond de Belamy Elementi in traccia Emanuele Imbucci Enrico Lo Verso Esposizione Eufronio FT-IR Falsificazione Ferro Fotocatalizzatori Fotoemissione Fotografia Fotoluminescenza Francesca Gherardi Frida Kahlo Gesso Goujian Gran Sasso Heinrich Schliemann Howard Carter INFN IRMS Idrogel Nanostrutturato Illuminazione Imaging XRF Inibitori Biologici Insetti Internet of Things Intervista Io sono fuoco Italia Ivano Marescotti John Ruskin KHA LIF Laboratorio Laboratorio Arvedi di Diagnostica Non-Invasiva Lapislazzuli Laser Scanner Lazurite MIUR Macchina di Antikythera Margaret Keane Marina Abramovic Materiali cartacei Matisse Maya Blu Medioevo MiBACT Michelangelo Buonarroti Michelangelo infinito Microclima Microstruttura Mikhail Bulgakov Modigliani Modì Monetazione Romana Muoni Murex Brandaris Musei Vaticani Museo Archeologico dell'Alto Adige Museo Egizio Nanocellulosa Nanomateriali Nasiergel Neandertal Nopalgel Northumbria University Notre Dame de Paris Obvious Occhio Opificio delle Pietre Dure Ossidiane Ottica Non Lineare PIXE Padova Palmira Papiri carbonizzati Percezione Performance Pergamena Perkin Peste Petrografia Philippe Daverio Pompei Porcellana Porpora Porpora di Tiro Potere Risolutivo Progetto Grande Rilevanza Italia - Messico RGB Rafael Parra Reggia Repliche Research Riflessione Rinascimento Risoluzione Sacra Sindone Sali solubili Scientia ad Artem3 Seconda Armonica Sheele Sindone Sistina Smeraldo Sofia Podestà Spettroscopia di Impedenza Elettrochimica Stonehenge Storia del Restauro Storie di Sant'Orsola Street art Strontium isotopes Strumenti ad arco TEM TLS Tecnica EVA Teleri Teoria del Restauro Terahertz The cleaner Titanio Tiziana Pasciuto. Tomografia Computerizzata (CT) Tomografia a Raggi X a Contrasto di Fase Turismo Tutankhamon Urina VIMP VMP Valentina Risdonne Venaria Reale Venezia Verde Vermeer Vetro Victoria and Albert Museum Violini Viollet-le-Duc Visione Vittore Carpaccio William Turner Workshop XPS XRF Zooarchaeology acceleratori adesivi affreschi algoritmo ametista art bagnabilità cera ciclotrone cloro code colla collanti colorante colorante di sintesi cultural heritage dieta escher giallo indiano i colori dell'anima idrogel il gesto dell'arte illusioni ottiche marine reservoir effect mauveina mosaico mostra nastri adesivi natura del materiale nerofumo oli siccativi origine animale origine vegetale particelle pelle pietre preziose processo fotossidativo proteomica protoni pulitura registri mortuari Milano rimozione sintetici solubilità statistica storia del papiro tecnica pittorica tempere tempere polisaccaridiche tempere proteiche tempo di presa tintura triangolo di Teas viola viscosità Ötzi
Mostra di più