Algoritmo greedy
Un algoritmo greedy o algoritmo goloso[1][2][3] è un paradigma algoritmico in base al quale la ricerca di una soluzione ottimale avviene seguendo una strategia euristica di problem-solving in cui l'algoritmo, a ogni passaggio, opta per la soluzione ottimale a livello locale (come definita in precedenza dal programmatore). Quando applicabili, questi algoritmi consentono di trovare soluzioni ottimali per determinati problemi in un tempo polinomiale; in molti casi, non si può garantire la convergenza verso un ottimo globale. In particolare, questi algoritmi cercano di mantenere una proprietà di sottostruttura ottima, quindi cercano di risolvere i sottoproblemi in maniera "avida" (da cui la traduzione letterale algoritmi avidi in italiano) considerando una parte definita migliore nell'input per risolvere tutti i problemi.
Per fare ciò, di solito, viene applicata una tecnica cut and paste (quindi scelgo l'input migliore per poter risolvere il sottoproblema).
Un tipo di strategia greedy può essere applicata al problema del commesso viaggiatore (che è un problema ad alta complessità computazionale): essa può essere, ad esempio, quella che , a ogni passaggio, obbedisce alla seguente regola euristica: "A ogni passo del tragitto, vai alla più vicina tra le città non ancora visitate". L'adozione di questo semplice approccio euristico non è in grado di garantire la soluzione ottima a questo problema complesso, ma ha il pregio che l'esecuzione termina dopo un ragionevole numero di passi; trovare una soluzione ottimale a un problema così complesso richiede, tipicamente, un numero altissimo di passaggi, circostanza che lo rende un problema praticamente non affrontabile.
Esempi esplicativi
modificaIl problema "Dai il minor numero di monete di resto utilizzando monete da 100, 10, 1 eurocent" è un problema risolubile tramite un algoritmo di tipo greedy: ad ogni passo viene controllato il resto ancora da dare e si aggiunge la moneta con il maggior valore possibile. Quindi per dare un resto di 112 eurocent la macchina farà cadere in sequenza una moneta da 100, poi 10, poi 1, e infine ancora 1 eurocent per un totale di 4 monete.
Il cosiddetto problema del commesso viaggiatore, cioè "dato un numero di consegne e di ritiri con un mezzo che ha una portata massima P, si organizzi il viaggio che consente di viaggiare il minor numero di km con il maggior carico possibile per ottenere il massimo guadagno", non è un problema risolvibile tramite un algoritmo di tipo greedy, ma solo tramite algoritmi per problemi NP-completi.
Il primo esempio è risolvibile grazie ad un algoritmo greedy solo per opportuni insiemi di valori di monete: infatti se ci fossero ad esempio anche monete da 105 eurocent (valori monete: 105, 100, 10, 1), l'algoritmo greedy darebbe un totale di 8 monete (una da 105 e 7 da 1), mentre la soluzione ottima è quella con 4 monete (100+10+1+1).
Un altro esempio noto e ampiamente conosciuto è l'algoritmo di selezione delle attività, il cui pseudocodice è presentato dal Cormen[4].
Tale algoritmo seleziona le attività che sono compatibili da un punto di vista temporale, evitando che si sovrappongano. Piuttosto che selezionare tutte le attività, seleziona il maggior numero di attività tali che non siano sovrapponibili l'una con l'altra, quindi con inizio/fine distinti le une dalle altre. Un altro esempio noto di algoritmo greedy è la codifica di Huffman, normalmente utilizzato nella compressione dei file e che utilizza il medesimo principio, quindi l'ottimizzazione dei dati presenti selezionando le frequenze in maniera ottimale alla posizione e numero dei singoli caratteri.
Definizione formale
modificaIn combinatoria e in ottimizzazione per algoritmo greedy si intende un algoritmo che consente di individuare una base di una matroide finita procedendo in modo notevolmente semplice ed efficiente.
Si consideri l'insieme E e una famiglia F di sottoinsiemi di E ( ) che forma un ideale d'ordine rispetto alla relazione di inclusione:
La coppia E,F forma un sistema di indipendenza. Viene definita inoltre la funzione peso w.
Dato un sistema di indipendenza E,F e una funzione peso w, si ricava un insieme M tale che w(M) sia il massimo.
Descrizione dell'algoritmo
modificaSi consideri un matroide degli indipendenti M = (E,I). L'algoritmo si serve di un insieme variabile X che viene progressivamente ampliato fino a individuare una base.
- Inizialmente si assegna l'insieme vuoto all'insieme variabile X.
- Si procede considerando successivi elementi x in E non contenuti in X;
- Se è indipendente, allora si trasforma il precedente X aggiungendogli x, cioè . In caso contrario il processo si conclude.
Il risultato è un insieme indipendente. Inoltre esso è un insieme indipendente massimale in quanto se B U {x} non fosse indipendente per qualche sottoinsieme B di X, allora non sarebbe indipendente: in caso contrario si andrebbe contro la proprietà di ereditarietà. Quindi se si trascura un elemento non si avrà l'opportunità di utilizzarlo più tardi.
Matroidi pesati e algoritmi greedy
modificaGeneralizzazione di questo algoritmo per risolvere un problema più difficile.
Una funzione peso w : E → R+ per un matroide M=(E, I) assegna un peso strettamente positivo a ciascun elemento di E. Estendendo la funzione ai sottoinsiemi di E attraverso la somma; w(A) è la somma dei w(x) sugli x in A. Un matroide con una funzione peso associata è detto un matroide pesato.
Come semplice esempio, diciamo di voler trovare la massima foresta di copertura di un grafo. Ovvero, dato un grafo e un peso per ogni arco, trovare una foresta contenente ogni vertice e che massimizzi il peso totale degli archi nell'albero. Questo problema si presenta in alcune applicazioni di clustering. Se guardiamo alla definizione del matroide foresta sopra, vediamo che la massima foresta di copertura è semplicemente il sottoinsieme indipendente con peso totale massimo — tale da ricoprire il grafo, poiché in caso contrario potremmo aggiungere archi senza creare cicli. Ma come lo troviamo?
Un insieme indipendente di massimo peso totale è chiamato insieme ottimale. Gli insiemi ottimali sono sempre basi, perché se può essere aggiunto un arco, dovrebbe essere fatto; ciò aumenta solo il peso totale. Si può dimostrare che esiste un banale algoritmo greedy per calcolare un insieme ottimale di una matroide pesata. Procede come segue:
- Sia A l'insieme vuoto.
- Per ogni x in E, preso in ordine (monotonicamente) decrescente di peso
- se A U {x} è indipendente, allora A diventi A U {x}.
Tale algoritmo trova una base, poiché si tratta di un caso speciale del precedente algoritmo. Sceglie sempre l'elemento di massimo peso possibile preservando l'indipendenza (da cui il termine "greedy"). Ciò produce sempre un insieme ottimale: supponiamo che produca e che . Ora per ogni con , consideriamo gli insiemi aperti e . Visto che è più piccolo di , c'è qualche elemento di che può essere messo in mantenendo il risultato indipendente. Tuttavia è un elemento di peso massimale che può essere aggiunto a per mantenere l'indipendenza. Per cui è di peso non inferiore di qualche elemento di , e quindi è of almeno di peso pari a . Poiché questo vale per ogni , è più pesante di .
Il modo più facile per traversare i membri di E nell'ordine desiderato è di ordinarli. Ciò richiede tempo O(|E|log|E|) utilizzando un algoritmo di ordinamento. Abbiamo anche bisogno di test per ogni x per determinare se A U {x} è indipendente; assumendo che il test di indipendenza richieda tempo O(f(|E|)) time, il tempo complessivo per l'algoritmo è O(|E|log|E| + |E|f(|E|)).
Se vogliamo trovare un albero di copertura minimo invece, semplicemente "invertiamo" la funzione peso sottraendola da una grande costante. Più precisamente, sia wmin(x) = W - w(x), dove W superi il peso totale attraverso tutti gli archi del grafo. Molti altri problemi di ottimizzazione su vari tipi di matroidi e funzioni peso possono essere risolti in questo modo banale, sebbene in molti casi possono essere trovati algoritmi più efficienti che sfruttano proprietà più specifiche.
Notare anche che se prendiamo un insieme di insiemi "indipendenti" che è un down-set ma non una matroide, allora l'algoritmo greedy non funzionerà sempre. Poiché in tal caso ci sono insiemi indipendenti e con , ma tali che per nessun è indipendente.
Prendiamo un e tali che . Pesiamo gli elementi di nell'intervallo da a , gli elementi di nell'intervallo da a , gli elementi di nell'intervallo da a , e il resto nell'intervallo da a . L'algoritmo greedy sceglierà gli elementi di , e in seguito non potrà scegliere nessun elemento di . Di conseguenza l'insieme indipendente che costruisce sarà di peso non superiore a , che è più piccolo del peso di .
Note
modifica- ^ Marco Liverani, Programmare in C. Guida al linguaggio attraverso esercizi svolti e commentati, Società Editrice Esculapio, 2020, p. 279, ISBN 9788835807896.«È opportuno sottolineare che quello di Kruskal è un algoritmo che appartiene alla famiglia degli algoritmi "golosi", in gergo greedy.»
- ^ Luigia Berardi e Albrecht Beutelspacher, Matematica discreta. Dai fondamenti alle applicazioni, Franco Angeli, 2003, p. 62, ISBN 9788846449207.
- ^ Mauro Cerasoli, Elementi di matematica discreta, Zanichelli, 1988, p. 244, ISBN 9788808038586.
- ^ (EN) Thomas H. Cormen, Charles E. Leiserson e Ronald L. Rivest, Introduction to Algorithms, 4ª ed., MIT Press, 22 marzo 2022, ISBN 978-0-262-04630-5. URL consultato l'8 gennaio 2022.
Voci correlate
modificaAltri progetti
modifica- Wikimedia Commons contiene immagini o altri file sull'algoritmo greedy
Collegamenti esterni
modifica- (EN) Eric W. Weisstein, Greedy Algorithm, su MathWorld, Wolfram Research.