Visualizzazioni totali

Machine learning: le macchine apprendono dai beni culturali

“Data Scientist” è stato definito come il titolo per annunci lavorativi più sexy del XXI secolo. Questo perché nell’ultimo decennio si è assistito a una vera e propria esplosione della quantità di dati prodotti e immagazzinati. Questa mole di dati contiene preziose informazioni, che possono essere impiegate dalle società per prendere decisioni e fare predizioni in diversi ambiti: l’analisi dei mercati, il processing delle immagini per il riconoscimento facciale e la biologia computazionale per l’individuazione di tumori sono solo alcune delle possibili applicazioni.

Una delle competenze che caratterizzano il data scientist è il Machine Learning. Il Machine learning (ovvero apprendimento automatico delle macchine) è un insieme di metodi che insegna ai computer ciò che viene naturale agli umani e agli animali: imparare dall’esperienza. Gli algoritmi, infatti, impiegano metodi computazionali per apprendere l’informazione direttamente dai dati senza utilizzare una predeterminata equazione come modello. Il modello, ed eventualmente l’equazione, nascono dai dati stessi e da una loro completa comprensione. La performance dell’algoritmo migliora col crescere del numero di casi a disposizione, esattamente come nella realtà accumulare esperienze pregresse ci aiuta a prendere decisioni in modo più consapevole.

Lo scopo del machine learning è, quindi, quello di trovare degli schemi naturali nei dati, al fine di generare una profonda comprensionee aiutare a prendere decisioni o compiere predizioni nei più disparati campi di ricerca.

Esistono due tipologie di algoritmi.

Il supervised machine learning (appredimento supervisionato) fornisce al sistema un set di dati di cui si conoscono gli input e gli output (le risposte) e, successivamente, viene addestrato a creare un modello per produrre predizioni ragionevoli come risposta a nuovi dati. Questa categoria include le tecniche di classificazione, che predicono risposte discrete (ad esempio se un tumore è cancerogeno o benigno) e le tecniche di regressione, che forniscono risposte di variabili continue (ad esempio fluttuazioni di temperatura).

Il unsupervised machine learning (apprendimento non supervisionato), invece, riesce a trovare dei pattern nascosti all’interno dei dati, che però non presentano l’output della risposta da predire. Il clustering è la tecnica più comune ed è impiegato per analizzare in modo esplicito i dati e individuarne eventuali naturali raggruppamenti.

Ma in che modo avviene l’apprendimento? Quale è il processo a cui sono sottoposti i dati? Le sfide principali del machine learning sono legate al modo in cui trattare i dati e all’individuazione del giusto modello. Possiamo quindi suddividere il processo di apprendimento in 3 passi principali:
1) Data pre-processing: i dati provengono in tutte le forme e dimensioni. I dataset reali possono essere confusi e incompleti: pertanto, il primo passaggio consiste nell’organizzare e pre-analizzare i dati (ad esempio valutare eventuali outliers, ovvero anomalie, e dati mancanti). Il set di dati sarà quindi costituito da un insieme di istanze (gli esempi), a cui sono associate delle caratteristiche, dette attributi, che serviranno a predire l’output (attributo target).
2) Costruzione del modello e training: parte dei dati di partenza costituiranno il training set (dati di addestramento) che il modello prescelto utilizzerà per apprendere la trama e le regole che caratterizzano i dati.
3) Valutazione del modello: una volta individuato il modello, esso verrà testato e valutato su un set di dati di verifica, che consentiranno di comprenderne accuratezza e precisione. In questa fase si potrà valutare se modificare il modello, semplificandolo oppure aggiungendo complessità per rappresentare meglio il caso in esame.

Il grafico mostra l'andamento dell'indice di creatività (asse y) nell'arco storico tra il 1850 e il 1950 (asse x). La figura è stata riadattata da arXiv:1506.00711 

Prendere decisioni e fare predizioni è alla base di innumerevoli campi, dalla finanza alla diagnostica, ma in che modo il machine learning può incontrare il mondo dei beni culturali? Il gruppo di ricerca del Dr. Elgammal presso Rutgers’ Art and Artificial Intelligence Laboratory ha proposto un algoritmo in grado di indicare il livello di creatività di un dipinto considerandone il contesto storico-artistico. Il modello è stato valutato su 1700 quadri e ha riscontrato diversi interessanti risultati. Ad esempio, l’algoritmo associa a “Les demoiselles d’Avignon” di Picasso il più alto punteggio in creatività tra tutti i dipinti analizzati tra il 1904 e il 1911. Questo risultato è in linea con il pensiero degli storici dell’arte, che hanno indicato l’opera, per la sua pittura “piatta” e l’applicazione del Primitivismo, un primo esempio dello stile cubista di Picasso.

Questo lavoro mostra come, attraverso il machine learning, non sono solo gli umani a saper giudicare la creatività, ma anche i computer ne sono in grado e, forse, in modo anche più oggettivo!

Alessandra

Riferimenti bibliografici:

- Tom Mitchell, Machine Learning, McGraw Hill, 1997.
- Ian H. Witten, Eibe Frank, Mark A. Hall, Data Mining: Practical Machine Learning Tools and Techniques, Morgan Kaufmann.
- Ahmed Elgammal, Babak Saleh, Quantifying Creativity in Art Networks, arXiv:1506.00711
- https://theconversation.com/which-paintings-were-the-most-creative-of-their-time-an-algorithm-may-hold-the-answers-43157

Commenti

Etichette

Film&Art Archeologia Emanuele Dell'Aglio Metalli Conservazione Silvia Soncin Chimica Research for Cultural Heritage News from Diagnostic World Analisi Diagnostiche Colore Musei Restauro Degrado Diagnostica non invasiva Spettroscopia Raman Tecniche non invasive Resti Umani UNESCO Carta Spettroscopia Arte Contemporanea Coloranti Datazione Elettrochimica Film Gemme Imaging Medioevo Studi di provenienza Van Gogh autori ospiti Archeometria Ceramica Corrosione Dipinti Egitto Lapidei Pittura Spettrometria di Massa Spettrometro di Massa Vetro arte tecnica pittorica Alessadra Virga Artemisia Gentileschi Audiovisivi Bronzo ENEA Ercolano Laser Leonardo da Vinci Libri Luce Machine Learning Materiali Materiali di origine animale Modeling 3D Museo NfDW Papiri Picasso Piombo Pompei Rame Sincrotrone Tecnologie Voltammetria di Microparticelle calce leganti libro tessuti vegetali ANEDbc ATR Adorazione dei Magi Alimenti Antropologia Archeoastronomia Biodeterioramento Cervello Chiara Lucarelli Cinema Colori Costantino D'Orazio DNA Dagherrotipia Data Science Diagnosta FT-IR Ferro Firenze Fotografia Gaia Piccardi Galleria degli Uffizi Gialli di cadmio Graphic Novel Inquinamento Atmosferico KHA Lacche Legno Leonardo Mass Spectrometry Materiali cartacei Materiali lapidei Memoria Michelangelo Microscopia Modelli tridimensionali Monitoraggio Musei Vaticani Musei virtuali Museo Egizio Nanomateriali Ottica Papiri carbonizzati Parchment Pellicole Prodotti innovativi Proteine Restauro digitale Rinascimento Roma SERS Storia del Restauro Strumenti musicali Termoluminescenza Tomografia Computerizzata (CT) Tomografia a Raggi X a Contrasto di Fase Vermeer Vesuvio Vincent Van Gogh ZooMS acceleratori adesivi biologia cancro del bronzo colla colorante dipinti ad olio doratura inchiostri isotopi stabili microtomografia Raggi X pietre preziose pulitura radiocarbonio raggi-X rosso supporto scrittorio ANEDbc racconta ANOVA Ablation Actinobatteri Adriana Iuliano Affresco Akhenaton Alabastro Alberto Angela Alessandro Guiccioli Amarna3D Project Ambiente Amedeo Modigliani Analisi 3D Analisi degli Isotopi Stabili Analysis of variance Annerimento Antico Egitto Anton Cechov Antonio Ligabue Antonio Stradivari Arazzi Archaeobotanica Archeologia Giudiziaria Archeologia Invisibile Archeologia subacquea Archeology Archeomafie Architettura Argento Arsenico Arte Povera Arte moderna Arte naif Artemisia Gentileschi pittrice guerriera Artista Assorbimento Atacama Attribuzione Autobiografia Avorio Azzurrite Beatrice Luzi Benedetta Vitale Benzotriazolo Bible Bioprodotto Biopulitura Birra Blu Blu Egizio Bolzano Book Brienne Collection British museum CERN CSGI Caffè Calchi Cammeo Campus Ravenna Cantiere Cappella Sansevero Cappella Scrovegni Caravaggio segreto Casa del Bicentenario Cemento Ceprano Chiara Manfriani Christie's Chrozophora tinctoria Ciclo pittorico Cile Cina Cinquecento Cioccolato Claudia Cricchio Claudia Moricca Cleaning Codice dei beni culturali Conservazione Preventiva Coppa di Licurgo Corallo Coronavirus Crimini contro il Patrimonio Culturale Cromatografia DESY DNA antico Danza Datazione U-Th Datazione al radiocarbonio Declorazione Diamanti Dieter Berner Diffrattometria Neutronica Dimorfismo Sessuale Dipinti su tavola Docu&Art Donatello Draka distribution ESRF Edmond de Belamy Egon Schiele Elementi in traccia Elio Giordano Emanuele Imbucci Enrico Lo Verso Erosione Esperto scientifico per i beni culturali Esposizione Espressionismo Eufronio Falsificazione Fata verde Fenici Figure Final Portrait Foro di Augusto Fossilizzazione Fotocatalizzatori Fotoemissione Fotoluminescenza Francesca Gherardi Frida Kahlo Fruizione Gaia Servadio George Byron Gesso Ghisa Giacometti Giallo di Napoli Gioacchino Rossini Gioconda Giorgio Diritti Golden Lilium Gallery Goujian Gran Sasso Heinrich Schliemann Howard Carter INFN IRMS Idrogel Nanostrutturato Il viaggio a Reims Illuminazione Imaging XRF Inibitori Biologici Insetti Internet of Things Intervista Io sono fuoco Isabella Otto Italia Ivano Marescotti Johannes Vermeer John Ruskin LAM LIF Laboratorio Laboratorio Arvedi di Diagnostica Non-Invasiva Lacca Lapislazzuli Laser Scanner Laura Parducci Layer Amplification Method Lazurite Leghe Letterlocking Louvre MIT MIUR Macchina di Antikythera Malte Marcatura ottica Margaret Keane Maria Bernadette Melis Marina Abramovic Marmo Matisse Maya Blu Mercurio Messaggi nascosti MiBACT Michelangelo Buonarroti Michelangelo infinito Microclima Microscopia elettronica ESEM Microstruttura Mikhail Bulgakov Modigliani Modì Monetazione Romana Monna Lisa Mozia Muoni Murex Brandaris Museo Archeologico dell'Alto Adige Nanocellulosa Nanotecnologie Nasiergel Nastri magnetici Neandertal Nero Nopalgel Northumbria University Notre Dame de Paris Obvious Occhio Opera lirica Opera&Art Opere Policrome Opificio delle Pietre Dure Ossidiane Ossido di Zinco Ottica Non Lineare PIXE Padova Palazzo Guiccioli Palmira Percezione Performance Pergamena Perkin Peste Petrografia Philippe Daverio Physically Based Renderer Piogge acide PlayStation Podcast Porcellana Porpora Porpora di Tiro Potere Risolutivo Progetto Grande Rilevanza Italia - Messico RGB Rafael Parra Raggi X Realtà Virtuale Reazioni chimiche Reggia Rendering Repliche Research Riccardo Falcinelli Riflessione Risoluzione SEM-EDS Sacra Sindone Sali solubili Salvator Mundi Scientia ad Artem3 Secessione viennese Seconda Armonica Sheele Sindone Sistina Smaltino Smeraldo Sofia Podestà Solfatazione Sound and Vision The Hague Spettroscopia FTIR Spettroscopia di Impedenza Elettrochimica Spolvero Sticky-Shed Syndrome Stonehenge Storia dell'arte Storie dell'arte Storie di Sant'Orsola Street art Strontium isotopes Strumenti ad arco Syrtos Syrtos a tre passi TEM TLS Tecnica EVA Tel el Amarna Teleri Teoria del Restauro Terahertz Terre rare Tessuti fossili The cleaner Titanio Tiziana Pasciuto. Turismo Tutankhamon Uffizi Università di Bologna Urina VIMP VMP Valentina Risdonne Vantablack Venaria Reale Venezia Verde Victoria and Albert Museum Videogiochi Vinegar Syndrome Vino Violini Viollet-le-Duc Visione Vittore Carpaccio Volevo nascondermi William Turner Workshop XPS XRF Zooarchaeology Zucchero affreschi alcool algoritmo ambra ametista art assenzio bagnabilità cattura del movimento celadonite cera ciclotrone cinabro cloro code colla animale colla di bue colla forte collanti colorante di sintesi cultural heritage dieta documentario escher foglia d'oro folle storia dell'arte follia formula chimica garavella giallo indiano i colori dell'anima idrogel il gesto dell'arte illusioni ottiche imprimiture liuteria malattia mentale manoscritti medievali marine reservoir effect mauveina minerali minio mosaico mostra nastri adesivi natura del materiale nerofumo oli siccativi origine animale origine vegetale oro paleodieta particelle patrimonio culturale immateriale pelle pietre processo fotossidativo proteomica protoni registri mortuari Milano rimozione ritratto rocce significato sintetici solubilità sostanze adesive spettro elettromagnetico statistica storia del papiro storico dell'arte tempere tempere polisaccaridiche tempere proteiche tempo di presa tintura tinture triangolo di Teas viola viscosità Ötzi
Mostra di più