.pier.bot.
In breve: pagine generate dal bot:
- pagine corte
- pagine lunghe
- log (statistiche riassuntive)
Speciale statistiche utenti |
Chi sono?
modificaSono un bot scritto in Python (utilizzo Pywikipedia con alcune modifiche). Sono stato creato per districarmi tra le pagine nuove ( il mio padrone trovava pesante passarsele tutte a mano, ma sono solo 2-3000 voci nuove a settimana, ah gli umani ... ). Il mio manovratore mi fa uscire poco, solo un paio di volte a settimana, così non creo traffico.
Se proprio volete vedermi da vicino qui c'è lo script che utilizzo.
Visto che c'è qualche altro pazzo che vuole farmi girare, ecco anche il manuale d'uso.
Cosa faccio
modificaQuello che faccio esattamente: in base ai dati di partenza (numero giorni da esaminare/numero voci, posizione di partenza, lunghezza per voci lunghe e corte)
- Leggo le voci presenti nelle pagine nuove (partendo dalle più recenti)
- Per ogni voce:
- Controllo da dimensione della pagina:
- inferiore a 1000[1], la seleziono per le pagine corte
- superiore a 4500[2], la seleziono per le pagine lunghe
- tra i due limiti: le scarto
- Controllo i template presenti nella pagina. Scarto le voci con:
- Controllo da dimensione della pagina:
- Template comuni
|
|
- Template specifici
- Pagine corte
|
- Pagine lunghe
- nessuno
- Recupero altri dati (data creazione, autore, presenza o meno di immagini, interwiki/interlink, categorie) e gli dò una sistemata
- Escludo le pagine degli autori in white list (es. bot)
- Recupero altri dati (data creazione, autore, presenza o meno di immagini, interwiki/interlink, categorie) e gli dò una sistemata
- Dopo aver esaminato tutte le voci scrivo il report
- Aggiungo alcune informazioni statistiche
- Seleziono le nuove voci create anche per il progetto architettura (Architettura/Nuove e Architettura/Stub)
A cosa servo?
modificaBoh, me lo chiedo anch'io. Secondo il mio padrone a:
- trovare buone voci (nella pagine lunghe) da usare qui
- aiutare nel patrolling (nella pagine corte)
Altre informazioni
modificaDettaglio versioni
modifica- 1.0 Bot funzionante con scrittura diretta report
- 1.1 Revisione, ottimizzazione. Layout grafico report.
- 1.2 Fix lettura pagine con redirect
- 1.3 Aggiunta pagina log con statistiche
- 1.4 Creata lista template comune + 2 liste specifiche (corte e lunghe)
- 1.5 Utilizza wiki_lib.py per le funzioni di pywikipedia modificate o aggiunte, in questo modo si può aggiornare pywikipedia senza dover riportare le modifiche personalizzate.
- 1.6 Nuovi parametri cleanup (ricontrolla le pagine già selezionate) e append (aggiunge le pagine, non sovrascrive il report)
- 1.6.1 Aggiunta white list autori (e così ci siamo liberati di Gacbot :-D)
- 1.6.2 Bugfix. Gestita eccezione SectionError
- 1.6.3 Nuovi template.
- 1.6.4 Aggiornamento pywikipedia, ora funziona get_redirect?
- 1.6.5 Aggiunte stampe di debug
- 1.7 Nuovo formato di interfaccia per Specialpages:NewPages
- 1.8 Aggiunta selezione voci per Progetto:Architettura
- 1.9 Aggiornamento pywikipedia, usa API
- 2.0 Revisione, ottimizzato recupero parametri pagine (autore, data)
- 2.1, 2.2, 2.3 Aggiunta selezione per progetti; aggiornamenti pywikipedia
- 2.4 Tolte opzioni non più usate, revisione codice
Da fare
modifica- Fatto
gestire i redirect - Fatto
aggiungere statistiche a report - Fatto
lista template comune +2 liste specifiche (corte e lunghe) - Fatto
Nuovi parametri clean-up, append,update - Fatto
ottimizzazione accesso a pagine - Leggere template da pagina wiki
- Pagine escluse -> pagina wiki con lista di pagine da escludere (solo dalle corte?), serve per evitare di ritrovare sempre le stesse pagine già esaminate. Aggiunta ed eliminazione delle pagine a mano.
Bug noti
modifica- Ma dai...
Problemi noti
modifica- Le categorie impostate automaticamente tramite template (es: {{Bio}}, {{Scheda libro}}, {{Film}}) non vengono rilevate.
- Lo stesso per le immagini inserite nel template.
- Questo errore nella serie cronologica:
# 13:50, 4 apr 2007 Pigmalione (teatro) - [10927 byte] - Crabbymole - immagini - interwiki - categorie # 19:54, 19 apr 2007 Paradox (pdx) - [5921 byte] - 82.54.149.234 - immagini - interwiki - categorie # 12:27, 4 apr 2007 Frat Pack - [7355 byte] - Gordo fatto - immagini - interwiki - categorie
- probabilmente dovuto ai vari spostamenti effettuati sulla voce o alla pagina che è stata poi modificata in un redirect (senza spostamento). Lo stesso con ripulitura cronologia (cancellazione+creazione pagina).
- Non rileva i template se la firma inserita contiene parentesi graffe.
Ringraziamenti.
modifica
- Note