Wikipedia:Bar/Discussioni/Una proposta di gestione delle pagine generate da basi di dati

Una proposta di gestione delle pagine generate da basi di dati NAVIGAZIONE


Salve a tutti, da qualche tempo sto pensando ad una possibile innovazione del codice mediawiki che potrebbe risolvere un certo numero di problemi, sempre che tali siano visti dalla maggioranza degli utenti. Naturalmente, non mi faccio illusioni: questa innovazione richiede tali cambiamenti che sarà ora scartata come infattibile. Ma intanto si butta l'idea; magari, quando i tempi saranno più maturi ..., e magari qualcuno che conosce quelli che "possono" ... ma veniamo al punto.

La proposta

modifica

Come molti sanno, nelle varie versioni delle vichipedie esistono pagine costruite a partire da materiale tabulare. Tanto per parlare chiaro, sto pensando a comuni, asteroidi, composti, aeroporti, e così via. La gestione di queste pagine, che d'ora in poi chiamerò, mi si passi il termine, "automatiche", a mio avviso non è la migliore possibile. In alcune vichipedie (spesso in quelle "piccole", ma non solo) questo tipo di pagine viene utilizzato per fare massa, con il risultato che la qualità scende a livelli pietosi. In altre, dove queste pagine sono una parte più dignitosa del tutto, si sommano al conteggio delle pagine "fatte a mano", e rendono difficile valutare la crescita dell'enciclopedia. Vorrei chiarire fin d'ora di non ritenere che le pagine automatiche siano di poco valore, anzi; ma credo che una loro gestione "separata" migliori la situazione sotto tutti i punti di vista. Ecco allora come penserei di prendere questo, ed anche un altro piccione, con la stessa fava.

  1. Permettere a mediawiki di gestire delle vere e proprie basi di dati relazionali. Siccome il motore di mediawiki già si appoggia ad un gestore di basi di dati, se non erro, questo non dovrebbe essere difficile. Ma ora bisognerebbe dare la possibilità all'interfaccia php di interrogare queste tabelle ed utilizzare i dati ottenuti per generare pagine automatiche. L'inserimento dei dati, invece, non deve essere necessariamente realizzato attraverso l'interfaccia mediawiki.
  2. Le pagine automatiche non esistono nello stesso senso delle altre. Queste pagine vengono appunto generate automaticamente ogniqualvolta il titolo richiesto non corrisponde ad una pagina esistente, ma appare nella base di dati. Niente più bisogno di robot che creano fisicamente le pagine. Se il titolo nella base di dati collide con il titolo di una pagina esistente, le pagine vengono create con un'apposita estensione del titolo, che può essere usata in una pagina di risoluzione dell'ambiguità (esempio, se già esiste, fiume si può generare Fiume (città della Croazia).
  3. Le pagine automatiche non vengono conteggiate nella dimensione di una enciclopedia, o per lo meno vengono conteggiate separatamente. In questo modo viene a mancare l'incentivo per chi vuole solo ingrassare il numero di articoli.
  4. La base di dati è comune a tutte le vichipedie. Una volta pronte, per esempio, le tabelle contenenti i dati relativi a tutti i comuni italiani, non dovrebbe essere difficile utilizzare questi dati in una vichipedia in una lingua qualsiasi; sarebbe sufficiente che la comunità locale si occupasse di tradurre la cornice di presentazione. Questo presuppone che la base di dati sia gestita un poco come i commons, naturalmente.
  5. Le pagine automatiche possono essere inglobate in pagine manuali. Per esempio, un comune importante, come Roma, che contiene parecchio testo scritto a mano, ingloba i dati dalla tabella dei comuni attraverso un meccanismo di modelli. La pagina viene allora considerata manuale e conteggiata in modo normale. In questo caso, la generazione automatica della pagina viene disabilitata.

Questi sono solo alcuni punti, spiegati molto grossolanamente, e necessitano certamente di parecchie limature per diventare realmente attuabili. Ma l'idea, secondo me, è fondamentalmente giusta. Si lascia fare alle basi di dati il lavoro delle basi di dati, si rende fruibile questa informazione a tutte le vichipedie che voglio impegnarsi ad usarla, si zittiscono le critiche di "gonfiamento" dei numeri, si migliora la qualità dell'opera. Va bene, ho finito, sotto con le critiche, a patto che spariate a salve. Se a qualcuno non va bene questa discussione al bar, che la sposti ove più gli aggrada. Saluti --Tèstaquêdra 23:34, 11 set 2007 (CEST)[rispondi]

Le obiezioni

modifica

C'è un problema: TUTTO allora dovrebbe essere fatto così, a banca dati. Dalle biografie delle persone, ai dati sulle aziende, ai film, gli asteroidi, le città, animali, piante, virus, funghi... scherzi a parte, bisognerebbe valutare attentamente il campo d'opera, limitato soltanto a questioni di interesse globale. --Geminiano 01:26, 12 set 2007 (CEST)[rispondi]

Secondo me la scelta del materiale è molto semplice. Si passa a questo sistema per quelle raccolte di voci che già di per sè provengono da una base di dati completa. I comuni credo siano stati fatti così, gli asteroidi anche. Non so come siano state realizzate le altre categorie che citi, ma il punto dirimente è questo: se le può inserire un robot a partire da una lista esterna completa, allora le può gestire una base di dati. E, naturalmente, non tutte le voci cadono in questo caso. Ma se, dopo avere realizzato lo strumento, ci si accorgesse che può essere usato proficuamente ben al di là del campo per cui era stato pensato, tanto meglio. Non vedo proprio dove stia il problema. --Tèstaquêdra 01:39, 12 set 2007 (CEST)[rispondi]
beh e' evidente che sarebbe comodo per moltissime cose, incluse le biografie, dove i dati numerici dovrebbero essere uguali per tutti e quindi comuni e da inserire 1 sola volta, con l'indubbio vantaggio di evitare i problemi di trascrizione. D'altra parte informazioni eventualmente sbagliate "infetterebbero" tutte le wiki, ma secondo me il gioco varrebbe la candela. 91.122.94.170 10:01, 12 set 2007 (CEST)[rispondi]

Che i progetti che usano Mediawiki possano trarre vantaggi da un sistema più facile per l'estrazione di dati da un db mi sembra chiaro. Wikipedia, dai più indicato come la punta di diamante del Web 2.0, funziona in realtà con un software che da un certo punto di vista è "antidiluviano". Mi spiego :-) Tutti i siti più cool del momento usano tecniche di "relazione" tra i dati basati su solide strutture di db con tag, effetti speciali e tutto il resto del campionario. Mediawiki ha un incredibile db nel quale memorizza le voci, ma i "dati" (cioè quelli contenuti "nelle" voci) vengono scritti di fatto "a manina". Non esistono di fatto interfacce utente per facilitare l'inserimento dei dati "grezzi". Basti pensare al Template:Bio che è un bel accrocchio (del quale non posso che complimentarmi per chi ha avuto la pazienza di realizzarlo) per riuscire, in realtà, a scrivere in modo più veloce i dati grezzi delle biografie e a poterli recuperare per alcune semplici operazioni come la compilazione automatica di liste. In nostri form di inserimento sono nella migliore delle ipotesi i template da copincollare da una pagina di aiuto nella voce e da modificare a mano.

Quello che tu proponi è un contenitore di dati grezzi riutilizzabili a piacere. Sarebbe, forse, il più grande contenitore di dati del mondo. A questo punto Wikipedia (in tutte le lingue) e i progetti cugini conterrebbero solo delle pagine web semplici report del "grande db". Inoltre si complicherebbe molto il percorso contrario. Quello dell'inserimento dai dati "attraverso" le pagine wiki. Se correggo una data da una pagina di it.wiki, ammettendo che questo dato possa essere registrato nel db comune, dovrei mettermi a fare una edit war con un utente della wiki lituana che si vede cambiare la data nelle stessa pagina nella sua lingua? Chi controllerebbe la modifica, come si organizzerebbe il gestore/comunità del db comune?

Tutto ciò sarebbe IMHO molto poco wiki. Il software odierno, con i falsi limiti che citavo prima, risponde perfettamente alla esigenza di "scrivere una enciclopedia" libera (cioè accessibile a tutti), sulla base del consenso e della correzione continua, in progress.

Il db comune, da far gestire agli enciclopedisti di Terminus, diventerebbe "la fonte" e per inerzia i wikipediani diverrebbero degli impaginatori. Omegawiki è un gran bel progetto, mi auguro vivamente che prosperi, ma non è Wikipedia. L'Enciclopedia galattica di Hari Seldon non ha funzionato granché, Wikipedia, così com'è oggi, forse può farcela, purché i wikipediani continuino a scriverla, scriverla veramente, non a compilare form.

Detto questo è ovvio che in certi campi la possibilità di collegare velocemente, con strumenti magari meno "caserecci", Wikipedia a dei db potrebbe aiutare. Purché siano db off line e dei quali "l'inseritore" si assuma la responsabilità della verifica. Ok per gli asteroidi, ok per le immagini libere e i file multimediali (tra l'altro tutta roba prevalentemente di contorno), ok per certi dati geografici, ma contrario alla centralizazione di dati che poi si confonderebbero con il tagging tanto di moda oggi e che ha il preciso limite della non verificabilità. Il tutto, è ovvio, IMHO :-) --Amarvudol (msg) 19:03, 13 set 2007 (CEST)[rispondi]

Alcune importanti informazioni

modifica
  • Da tempo è stato proposto di associare una Ontologia alle pagine di wiki. Esistono anche delle implementazioni particolari di mediawiki che stanno testando questa possibilità.
  • Sono in costruzione, e parzialmente in funzione, bot che controllano e fanno l'update di alcune pagine appoggiandosi su database "esterni" a wiki. Credo che qualcuno potrebeb dare più particolari.
  • La proposta di avere un "commons dei dati", una specie di database wiki, l'ho sentita per la prima volta nel 2005 a Francoforte. Credo però che non sia mai stata implementata.

Draco "Ansia" Roboter 09:20, 12 set 2007 (CEST)[rispondi]

per quanto riguarda il database wiki, non ricordo il nome (wikidata forse) ma la sua prima implementazione è stata wiktionaryz, ora noto come Omegawiki. --bonz l'italiano è un'opinione 09:51, 12 set 2007 (CEST)[rispondi]

That's right, come non detto, qui altri dettagli. Non ho trovato un luogo che spieghi in tre aprole come funziona, se qualcuno ci riuscisse faccia un fischio perfavore. --Draco "Ansia" Roboter 10:40, 12 set 2007 (CEST)[rispondi]

Certo, quello a cui stavo pensando era sicuramente il progetto Omegawiki. Secondo me l'Omegawiki è un'idea fondamentalmente buona il cui tempo è arrivato; purtroppo, la gestione di questo progetto non è affatto trasparente, ed ottenerne informazioni è piuttosto difficile. Ma, queste critiche a parte, quello che temo è che, alla fine del lavoro, l'estensione mediawiki che sarà stata sviluppata sarà molto orientata alla costruzione di un dizionario interlinguistico e forse non sufficientemente flessibile per adattarsi a tutti gli scopi (le priorità nello sviluppo finiscono inevitabilmente per essere le priorità dei suoi sviluppatori). Ritengo che l'integrazione di funzionalità generali di gestione di una base di dati sarebbe un miglioramento enorme del codice mediawiki (secondo me è la sua più grande carenza attuale), e mi stupisco che si continui a considerarla un obiettivo secondario; più tempo passa e più lavoro ci sarà da fare in futuro per convertire le pagine pseudo-manuali in pagine automatiche. --Tèstaquêdra 11:38, 12 set 2007 (CEST)[rispondi]

è una proposta interessantissima, e che avevo in mente anche io tempo fa solo che al contrario non ho le conoscenze per formalizzarla come è stato fatto qui; sono però un po scettico sul fatto che sia condiviso da tutte le wiki, cioè per alcune cose sarebbe la soluzione ottimale, ma il problema sarebbe la gestione dei vandalismi, se diventasse come una specie di commons sarebbero in pochissimi a parteciparci, e d'altra parte un semplice database ultra condiviso da tutti gli utenti, creerebbe il problema della moltiplicazione dei vandalismi no solo limitati alle realtà locali ma a livello globale; forse sarebbe il caso che ogni wiki avesse la sua magari in condivisione con ogni progetto che abbia la stessa lingua.PersOnLine 12:29, 12 set 2007 (CEST)[rispondi]

Visto che va ben oltre Wikipedia in lingua italiana ...

modifica

... parlarne in m:Proposals for new projects potrebbe essere un'idea. --ChemicalBit - scrivimi 15:25, 12 set 2007 (CEST)[rispondi]

Veramente, quella è una pagina per nuovi progetti, come WikiMaoist o Kunkelfruit Wiki. Nell'incipit della pagina viene spiegato che se si sta suggerendo un miglioramento che richiede modifiche al codice MediaWiki, bisogna sottomettere una richiesta per una nuova estensione al MediaZilla. Purtroppo, mi sembra che neanche lì eccellano in spirito di ascolto. Ho visto discussioni sulle parser functions in cui alcuni sviluppatori rispondevano a brutto grugno che il MediaZilla non era un metodo per fare perdere tempo agli sviluppatori con le richieste dei passanti, ma uno strumento di lavoro per gli sviluppatori, e solo per loro, e che per gli altri doveva funzionare come un luogo di osservazione. Comunque, quando avrò un poco più di tempo magari riproverò. Saluti, --Tèstaquêdra 00:11, 13 set 2007 (CEST)[rispondi]
Io pensavo si proponesse un nuovoprogetto, al pari ad es. di Wikispecies o Commons, da cui poi gli altri progetti avrebebro potuto "attingere".
Per cui un nuovo progetto.
(Ovvio che poi per rederlo possiible dovranno modificare Mediawiki, come immagino sia statofatto, quando si è introdotto Commons).
In ogni caso modifiche a Mediawiki, bisogna sì segnlarle su MediaZilla, ma quello penso riguardi più fix di Bug o piccole aggiunte/migliroamenti (cioè "è un quasi-bug che manchi questa cosa). Modifiche più consistenti penso vadano discusse prima. --ChemicalBit - scrivimi 19:04, 14 set 2007 (CEST)[rispondi]