Visualizzazioni totali

Machine learning: le macchine apprendono dai beni culturali

“Data Scientist” è stato definito come il titolo per annunci lavorativi più sexy del XXI secolo. Questo perché nell’ultimo decennio si è assistito a una vera e propria esplosione della quantità di dati prodotti e immagazzinati. Questa mole di dati contiene preziose informazioni, che possono essere impiegate dalle società per prendere decisioni e fare predizioni in diversi ambiti: l’analisi dei mercati, il processing delle immagini per il riconoscimento facciale e la biologia computazionale per l’individuazione di tumori sono solo alcune delle possibili applicazioni.

Una delle competenze che caratterizzano il data scientist è il Machine Learning. Il Machine learning (ovvero apprendimento automatico delle macchine) è un insieme di metodi che insegna ai computer ciò che viene naturale agli umani e agli animali: imparare dall’esperienza. Gli algoritmi, infatti, impiegano metodi computazionali per apprendere l’informazione direttamente dai dati senza utilizzare una predeterminata equazione come modello. Il modello, ed eventualmente l’equazione, nascono dai dati stessi e da una loro completa comprensione. La performance dell’algoritmo migliora col crescere del numero di casi a disposizione, esattamente come nella realtà accumulare esperienze pregresse ci aiuta a prendere decisioni in modo più consapevole.

Lo scopo del machine learning è, quindi, quello di trovare degli schemi naturali nei dati, al fine di generare una profonda comprensionee aiutare a prendere decisioni o compiere predizioni nei più disparati campi di ricerca.

Esistono due tipologie di algoritmi.

Il supervised machine learning (appredimento supervisionato) fornisce al sistema un set di dati di cui si conoscono gli input e gli output (le risposte) e, successivamente, viene addestrato a creare un modello per produrre predizioni ragionevoli come risposta a nuovi dati. Questa categoria include le tecniche di classificazione, che predicono risposte discrete (ad esempio se un tumore è cancerogeno o benigno) e le tecniche di regressione, che forniscono risposte di variabili continue (ad esempio fluttuazioni di temperatura).

Il unsupervised machine learning (apprendimento non supervisionato), invece, riesce a trovare dei pattern nascosti all’interno dei dati, che però non presentano l’output della risposta da predire. Il clustering è la tecnica più comune ed è impiegato per analizzare in modo esplicito i dati e individuarne eventuali naturali raggruppamenti.

Ma in che modo avviene l’apprendimento? Quale è il processo a cui sono sottoposti i dati? Le sfide principali del machine learning sono legate al modo in cui trattare i dati e all’individuazione del giusto modello. Possiamo quindi suddividere il processo di apprendimento in 3 passi principali:
1) Data pre-processing: i dati provengono in tutte le forme e dimensioni. I dataset reali possono essere confusi e incompleti: pertanto, il primo passaggio consiste nell’organizzare e pre-analizzare i dati (ad esempio valutare eventuali outliers, ovvero anomalie, e dati mancanti). Il set di dati sarà quindi costituito da un insieme di istanze (gli esempi), a cui sono associate delle caratteristiche, dette attributi, che serviranno a predire l’output (attributo target).
2) Costruzione del modello e training: parte dei dati di partenza costituiranno il training set (dati di addestramento) che il modello prescelto utilizzerà per apprendere la trama e le regole che caratterizzano i dati.
3) Valutazione del modello: una volta individuato il modello, esso verrà testato e valutato su un set di dati di verifica, che consentiranno di comprenderne accuratezza e precisione. In questa fase si potrà valutare se modificare il modello, semplificandolo oppure aggiungendo complessità per rappresentare meglio il caso in esame.

Il grafico mostra l'andamento dell'indice di creatività (asse y) nell'arco storico tra il 1850 e il 1950 (asse x). La figura è stata riadattata da arXiv:1506.00711 

Prendere decisioni e fare predizioni è alla base di innumerevoli campi, dalla finanza alla diagnostica, ma in che modo il machine learning può incontrare il mondo dei beni culturali? Il gruppo di ricerca del Dr. Elgammal presso Rutgers’ Art and Artificial Intelligence Laboratory ha proposto un algoritmo in grado di indicare il livello di creatività di un dipinto considerandone il contesto storico-artistico. Il modello è stato valutato su 1700 quadri e ha riscontrato diversi interessanti risultati. Ad esempio, l’algoritmo associa a “Les demoiselles d’Avignon” di Picasso il più alto punteggio in creatività tra tutti i dipinti analizzati tra il 1904 e il 1911. Questo risultato è in linea con il pensiero degli storici dell’arte, che hanno indicato l’opera, per la sua pittura “piatta” e l’applicazione del Primitivismo, un primo esempio dello stile cubista di Picasso.

Questo lavoro mostra come, attraverso il machine learning, non sono solo gli umani a saper giudicare la creatività, ma anche i computer ne sono in grado e, forse, in modo anche più oggettivo!

Alessandra

Riferimenti bibliografici:

- Tom Mitchell, Machine Learning, McGraw Hill, 1997.
- Ian H. Witten, Eibe Frank, Mark A. Hall, Data Mining: Practical Machine Learning Tools and Techniques, Morgan Kaufmann.
- Ahmed Elgammal, Babak Saleh, Quantifying Creativity in Art Networks, arXiv:1506.00711
- https://theconversation.com/which-paintings-were-the-most-creative-of-their-time-an-algorithm-may-hold-the-answers-43157

Commenti

Etichette

Archeologia Emanuele Dell'Aglio Metalli Silvia Soncin Chimica Conservazione Film&Art Colore Restauro Analisi Diagnostiche Tecniche non invasive Diagnostica non invasiva Musei Resti Umani Spettroscopia Raman UNESCO Carta Degrado Spettroscopia Datazione Elettrochimica Imaging News from Diagnostic World Ceramica Coloranti Dipinti Film Lapidei Medioevo Pittura Research for Cultural Heritage Spettrometria di Massa Spettrometro di Massa Studi di provenienza Vetro Alessadra Virga Archeometria Arte Contemporanea Audiovisivi Bronzo Corrosione ENEA Gemme Laser Libri Machine Learning Materiali Materiali di origine animale Museo NfDW Papiri Picasso Piombo Rame Sincrotrone Voltammetria di Microparticelle arte libro tecnica pittorica tessuti vegetali Adorazione dei Magi Alimenti Antropologia Archeoastronomia Artemisia Gentileschi Biodeterioramento Cervello Cinema Costantino D'Orazio Dagherrotipia Data Science Diagnosta Egitto Ercolano Firenze Galleria degli Uffizi Gialli di cadmio Graphic Novel Inquinamento Atmosferico Legno Leonardo da Vinci Luce Mass Spectrometry Materiali cartacei Memoria Michelangelo Microscopia Monitoraggio Nanomateriali Ottica Papiri carbonizzati Parchment Pellicole Prodotti innovativi Proteine Restauro digitale Rinascimento Roma SERS Storia del Restauro Strumenti musicali Tecnologie Termoluminescenza Van Gogh Vesuvio ZooMS acceleratori adesivi biologia calce cancro del bronzo colla colorante dipinti ad olio doratura inchiostri isotopi stabili leganti pulitura radiocarbonio raggi-X supporto scrittorio ANEDbc ANOVA ATR Ablation Actinobatteri Adriana Iuliano Affresco Alabastro Alberto Angela Alessandro Guiccioli Ambiente Amedeo Modigliani Analisi degli Isotopi Stabili Analysis of variance Anton Cechov Antonio Stradivari Arazzi Archeologia Giudiziaria Archeologia Invisibile Archeologia subacquea Archeology Archeomafie Architettura Argento Arsenico Arte Povera Arte moderna Artista Assorbimento Atacama Attribuzione Autobiografia Avorio Azzurrite Beatrice Luzi Benedetta Vitale Benzotriazolo Bible Bioprodotto Biopulitura Birra Blu Bolzano Book CERN CSGI Caffè Calchi Cammeo Campus Ravenna Cantiere Cappella Scrovegni Caravaggio segreto Casa del Bicentenario Cemento Ceprano Christie's Chrozophora tinctoria Ciclo pittorico Cile Cina Cinquecento Cioccolato Cleaning Codice dei beni culturali Colori Conservazione Preventiva Coppa di Licurgo Coronavirus Crimini contro il Patrimonio Culturale Cromatografia DESY DNA Datazione U-Th Datazione al radiocarbonio Declorazione Diamanti Diffrattometria Neutronica Dimorfismo Sessuale Donatello ESRF Edmond de Belamy Elementi in traccia Emanuele Imbucci Enrico Lo Verso Esposizione Eufronio FT-IR Falsificazione Fenici Ferro Final Portrait Fotocatalizzatori Fotoemissione Fotografia Fotoluminescenza Francesca Gherardi Frida Kahlo Fruizione Gaia Servadio George Byron Gesso Giacometti Gioacchino Rossini Golden Lilium Gallery Goujian Gran Sasso Heinrich Schliemann Howard Carter INFN IRMS Idrogel Nanostrutturato Il viaggio a Reims Illuminazione Imaging XRF Inibitori Biologici Insetti Internet of Things Intervista Io sono fuoco Isabella Otto Italia Ivano Marescotti John Ruskin KHA LIF Laboratorio Laboratorio Arvedi di Diagnostica Non-Invasiva Lapislazzuli Laser Scanner Lazurite Leonardo MIUR Macchina di Antikythera Margaret Keane Maria Bernadette Melis Marina Abramovic Marmo Matisse Maya Blu Mercurio MiBACT Michelangelo Buonarroti Michelangelo infinito Microclima Microscopia elettronica ESEM Microstruttura Mikhail Bulgakov Modelli tridimensionali Modigliani Modì Monetazione Romana Mozia Muoni Murex Brandaris Musei Vaticani Musei virtuali Museo Archeologico dell'Alto Adige Museo Egizio Nanocellulosa Nanotecnologie Nasiergel Nastri magnetici Neandertal Nopalgel Northumbria University Notre Dame de Paris Obvious Occhio Opera lirica Opera&Art Opificio delle Pietre Dure Ossidiane Ottica Non Lineare PIXE Padova Palazzo Guiccioli Palmira Percezione Performance Pergamena Perkin Peste Petrografia Philippe Daverio Physically Based Renderer Piogge acide Pompei Porcellana Porpora Porpora di Tiro Potere Risolutivo Progetto Grande Rilevanza Italia - Messico RGB Rafael Parra Reazioni chimiche Reggia Rendering Repliche Research Riflessione Risoluzione SEM-EDS Sacra Sindone Sali solubili Salvator Mundi Scientia ad Artem3 Seconda Armonica Sheele Sindone Sistina Smaltino Smeraldo Sofia Podestà Solfatazione Spettroscopia FTIR Spettroscopia di Impedenza Elettrochimica Sticky-Shed Syndrome Stonehenge Storia dell'arte Storie dell'arte Storie di Sant'Orsola Street art Strontium isotopes Strumenti ad arco TEM TLS Tecnica EVA Teleri Teoria del Restauro Terahertz The cleaner Titanio Tiziana Pasciuto. Tomografia Computerizzata (CT) Tomografia a Raggi X a Contrasto di Fase Turismo Tutankhamon Università di Bologna Urina VIMP VMP Valentina Risdonne Venaria Reale Venezia Verde Vermeer Victoria and Albert Museum Vinegar Syndrome Vino Violini Viollet-le-Duc Visione Vittore Carpaccio William Turner Workshop XPS XRF Zooarchaeology Zucchero affreschi algoritmo ametista art bagnabilità cera ciclotrone cinabro cloro code colla animale colla di bue colla forte collanti colorante di sintesi cultural heritage dieta escher foglia d'oro formula chimica garavella giallo indiano i colori dell'anima idrogel il gesto dell'arte illusioni ottiche imprimiture liuteria manoscritti medievali marine reservoir effect mauveina minerali mosaico mostra nastri adesivi natura del materiale nerofumo oli siccativi origine animale origine vegetale oro particelle pelle pietre preziose processo fotossidativo proteomica protoni registri mortuari Milano rimozione ritratto rosso significato sintetici solubilità sostanze adesive statistica storia del papiro storico dell'arte tempere tempere polisaccaridiche tempere proteiche tempo di presa tintura tinture triangolo di Teas viola viscosità Ötzi
Mostra di più