Re: Eccomi

cagna

Salutammo Alex! Peccato che tu non voglia fare guai qui; dovrò pensarci da solo a "rovinare" il progetto. Di contro, da Wikimania ho interessanti nuove che ti interessano in prima persona. Volevo fare un post più lungo su it.source, ma il tempo scarseggia. In poche parole, ieri sera abbiamo fatto il meet-up della comunità di Wikisource e deciso di metter su un progetto inter-progetto (probabilmente su Meta, adesso vediamo) per scambiarci i gadget e, sopratutto, per internazionalizzare quelli esistenti. In pratica, un gruppetto di utenti più tecnici, attivi sui progetti wikisource, che si scambi idee e codice e che discuta di eventuali nuovi gadget da usare su tutti i progetti.

Abbiamo anche parlato del formato djvu, ma senza trovare soluzioni nuove, a parte che le statistiche dicono che gli utenti adesso scaricano epub e pdf. Dovremmo adeguarci.

Statte bbuono! --Ruthven (msg) 10:39, 17 aus 2019 (CEST)Rispondi

@Ruthven: Nonostante ne sia innamorato, sto facendo in modo di affrancarmi dal djvu anche come file fonte. La più grave limitazione dei pdf in wikisource, ossia il fatto che almeno fino a poco tempo fa la procedura Match and Split non funzionava, è superata in un mio script derivato e (me stupid a non averci pensato prima!) il semplice trucco di splittare i pdf in pagine singole (es. con pdfsam) permette di trattare le immagini come normali file immagine (es. con XnView). Mi spiace per quel formato sfortunato e spero che non sia condannato a una lenta agonia... ma non mi dispero più. :-) --Alex brollo (chiacchiere) 12:43, 17 aus 2019 (CEST)Rispondi

Innece (o Ennece)

cagna

Ho tradotto l'interfaccia per la pagina Indice, ma mi chiedevo se fosse una buona idea. In teoria, a questo progetto potrebbero partecipare sia napoletani italiani che statunitensi, per cui usare l'italiano ovunque è probabilmente un errore (dato che tutto il progetto mira a mantenere viva la lingua napoletana scritta), ma mi chiedevo se i testi dell'interfaccia sono comprensibili per un locutore non napoletano (es: Ennece:Da lu fronte - Lettere de nu Campuasciane.pdf). Dovremmo forse usare un napoletano "italianizzato", un po' come fanno nella serie Gomorra. Tu che dici? --Ruthven (msg) 20:48, 2 set 2019 (CEST)Rispondi

@Ruthven: Non credo sia un problema. Index ridirige a Ennece, anche dalla casella ricerca. Il problema serio è Author, che coesiste con Autore e non ridirige. Bisognerebbe controllare se succede anche per altri namespaces. --Alex brollo (chiacchiere) 21:49, 2 set 2019 (CEST)Rispondi
Trovato il problema con https://nap.wikisource.org/w/api.php?action=query&meta=siteinfo&siprop=namespaces
Per Autore e Autore chiàcchiera, erroneamente è stato registrato il nome locale anche come nome canonico. Suppongo (adesso verifico) che le pagine Author siano di conseguenza attribuite a ns0. Ho controllato: confermo.
Copioincollo l'output dell'API:
"102": {
                "id": 102,
                "case": "first-letter",
                "subpages": "",
                "canonical": "Autore",
                "*": "Autore"
            },
            "103": {
                "id": 103,
                "case": "first-letter",
                "subpages": "",
                "canonical": "Autore chi\u00e0cchiera",
                "*": "Autore chi\u00e0cchiera"
            },
Nei due "canonical" vanno rispettivamente Author e Author talk. Non so se bastano i "tastini" di sysop per correggere. --Alex brollo (chiacchiere) 22:13, 2 set 2019 (CEST)Rispondi
Grazie dell'analisi. Chiamo a sostegno la cavalleria pesante e ti faccio sapere... Ciao! --Ruthven (msg) 10:11, 3 set 2019 (CEST)Rispondi

Margini e altri CSS

cagna

Ciao, ho notato che qui non abbiamo il rientro dopo un'andata a capo. Vedi ad esempio Paggena:Teatro - Libero Bovio.djvu/189.

Pensavo quindi di importare quanto presente sotto /* --- NAMESPACE PAGINA --- */ in it:MediaWiki:Common.css (e unicamente quello). In particolare il CSS relativo al tag p. Pensi che cambiare lo stile del ns:Page creerà danni a catena? --Ruthven (msg) 15:02, 17 nuv 2019 (CET)Rispondi

Su it.source c'è sia l'indentatura, che un piccolo margine aggiuntivo che "stacca" visibulmente un paragrafo dall'altro(e questo mi piace poco, anche perchè non è un effetto tipografico comune, al contrario dell'indentatura che è estremamente comune) . Certo, l'indentatura è una modifica abbastanza invasiva, soprattutto per il fatto che mediawiki aggiunge elementi p "di default" a tradimento. Per non impazzire, direi di estenderla anche in ns0 sui testi transclusi, se applicata in nsPagina. --Alex brollo (chiacchiere) 18:36, 17 nuv 2019 (CET)Rispondi
Capito. allora mettiamoci d'accordo. Il margine aggiuntivo, presente nei libri stampati per motivi tecnici (la rilegatura), non è necessario per lo strumento elettronico. Mi trovi d'accordo col tuo punto di vista, anche se forse un margine minimo potremmo introdurlo, ma per motivi estetici unicamente (testo troppo incollato al margine sinistro).
Se pensi che l'indentatura sull'elemento p porterebbe ad effetti inattesi, allora lasciamo stare: non voglio ripercorrere tutte le 10 mila pagine di nap.source alla ricerca di indentature errate! Però, se non la introduciamo, dobbiamo creare un {{indent}} che aggiunga un {{gap}} a inizio paragrafo. Quale soluzione pensi sia migliore? --Ruthven (msg) 11:38, 18 nuv 2019 (CET)Rispondi
@Ruthven: Secondo me bisogna cominciare a pensare "in profondità" a templatestyles, ossia a pensare in classi piuttosto che con style inline, alleggerendo moltissimo common.css. Per p io propongo un css minimalista: niente indentatura, niente "stacchetto" con margin-top o margin-bottom. Per nsPagina il testo è già compreso dentro una div classe pagetext; penso sia necessaria anche un'unica analoga classe "contenitore" per ns0 molto semplice (e unica per tutti i tipi di testo); una decisione critica è se sistemare le cose in modo da ottenere i "layout dinamici" di en.source e fr.source o rinunciarci. Il layout di default di questa unica classe ns0 comunque essere semplicissimo. It.source soffre ancora della vecchia scelta di creare vari layout specifici "per progetto" (letteratira, teatro, diritto, perfino Bibbia....); un errore da non ripetere. Classe unica, elementare, e poi templatestyles se si vuole ottenere effetti particolari.
Ma come dico spesso il sono più "tattico" che "stratega".... mi trovo più a mio agio a trovare piccole soluzioni in un contesto generale già definito: quindi lascio la cosa a te e agli altri dotati di "attitudine strategica". --Alex brollo (chiacchiere) 21:40, 18 nuv 2019 (CET)Rispondi
Non so come sono fatti i layout dinamici di en.source e fr.source. Magari vi butto un occhio, ma se me lo puoi riassumere, magari faccio prima.
Rispetto alla classe "contenitore" sia per ns:0 e ns:250, ho notato che mw-content-text e mw-parser-output sono classi che appaiono in entrambi i namespace. Magari possiamo sfruttarle? A questo punto, direi di settare un p solo con un margine minimo e di creare un template per l'indentatura (lo importo, nessun problema).
Qui il common.css deve essere semplice, sono d'accordo, anche perché la base d'utenza è molto limitata. Riguardo ai Templatestyle, io li vedo più come un formato da applicare a un'opera intera, ma non fuori da ns:0 e ns:250 e sicuramente non da impilare (es: uno per il corsivo, uno per indent, ecc...). Di fatto, va fatto uno sforzo nella documentazione dei vari stili (magari con foto per illustrare il tipo di font, indentazione, ecc...). --Ruthven (msg) 22:26, 18 nuv 2019 (CET)Rispondi
Tieni conto che - per la rilettura e anche per postOCR - meno template ci sono e meglio è. Se in una comune opera in prosa tutti i paragrafi sono indentati, è disastroso che ogni paragrafo sia all'interno di un template! E se in un'altra (tipo teatro) quasi tutti i paragrafi (battute) hanno indentatura inversa, idem. D'accordo, stili impilati meno possibile, forse emergerà qualche eccezione ma di regola un templatestyle per opera, ficcato dentro CSS= e fine.
Statistica: nelle opere in prosa l'indentatura è la regola in almeno il 95-99% dei testi. Fanno eccezione i "nati digitali" pdf e recentemente mi è capitato un vecchio testo: it:La virtù sconosciuta, ma è particolare perchè si tratta di un dialogo. Rinunciando all'indentatura di default, significa che nel 95-99% delle prose ci vorrà templatestyle, ossia; che l'uso di questa cosa deve diventare la regola e non l'eccezione. E' una decisione "strategica" :-) quindi.... --Alex brollo (chiacchiere) 23:04, 18 nuv 2019 (CET)Rispondi
Layout dinamici: vedi es en:The Education and Employment of Women. In sidebar trovi una sezione "Display options", clicca su "Layout 1" che è il default e farai un loop fra 4 layouts fra cui scegliere il più gradevole per la lettura. Non ho indagato su come si ottiene nè tantomeno su quali accortezze bisogna applicare perchè tutto funzioni con ciascun layout; temo un bel po' di complicazioni in vari template; ma che sia una cosa carina, è certo. --Alex brollo (chiacchiere) 23:11, 18 nuv 2019 (CET)Rispondi
Mi trovi totalmente d'accordo: creiamo un templatestyle che crei il rientro e via! Lo mettiamo ovunque serva. Magari più tardi faccio una prova proprio con il Teatro di Libero Bovio. Poi va creata questa bella pagina di istruzioni per il templatestyle e il loro uso qui. Strategicamente, l'uso del CSS unificato dichiarato in un solo posto (l'indice) che si applica a tutte le pagine, è la miglior soluzione perché facilita il compito di rilettura ed è semplice per l'utente niubbo.
Studio le impaginazioni dinamiche e ne riparliamo. Ciao! --Ruthven (msg) 13:03, 19 nuv 2019 (CET)Rispondi
Ho studiato i layout dinamici. Si può fare (anche su it.source, nel caso). Non è che sia di prima priorità però: adesso "strategicamente" l'importante è avere il postOCR funzionante, l'unione degli a capi e magari una barra degli strumenti più folta, in vista dell'arrivo dei nuovi utenti. --Ruthven (msg) 09:46, 20 nuv 2019 (CET)Rispondi
@Ruthven: Bene, continuo a lavorare su Utente:Alex brollo/PostOCR.js per verificare la questione dell'unione degli acapi. Guardando la lista dei testi, vedo che i testi in prosa "normale" sono molto rari, mentre sono comunissimi i testi in versi o teatrali; una grossa differenza con it.source. Quanto ai layout dinamici, l'importante è sapere che esistono e cercare di evitare soluzioni che ne ostacolino l'implementazione futura; al momento si tratta di scegliere, fra i layout, quello "di default", alle volte dil default it.wikisource risulta un po' "stretto" in caso di tabelle corpose, quindi lo terrei un pochino più largo. Per il font di default, non sarebbe male, secondo me, tenere anche conto (ragionevolmente) della facilità di lettura (ipovedenti-dislessici); mi pare di ricordare che i "sans serif" dovrebbero essere preferiti; un altro criterio è la copertura quanto più possibile dell'Unicode.
Fra i testi in "pura prosa" in ns0, trovo Lo cunto de li cunte, per esempio il capitolo Lo cunto de li cunte/Jornata I, ha lo svantaggio di pochissime separazioni fra paragrafi, c'è qualcosa di più utile per provare? Alex brollo (chiacchiere) 11:10, 20 nuv 2019 (CET)Rispondi
L'assenza di testi in prosa è una cosa che lamentava anche il dott. Uomovariabile. La ragione storica è, a mio avviso, da cercare nella data del tramonto di Napoli come capitale della cultura europea con la fine di Federico II, che ha coinciso con l'avvento dell'era dei comuni, prevalentemente Toscani e del Nord. Così il fiorentino è divenuto, di fatto, la lingua volgare italica, a spese del napoletano. Dovremmo cercare dei testi del '500, se vogliamo della buona prosa in napoletano. Un lavoro per bibliotecari! La lingua colta è quella in prosa che ritrovi nei saggi, mentre quella popolare a Napoli è quella che ha trovato spazio nelle rappresentazioni per un pubblico più ampio, come teatro e poesia/canzone. Nel frattempo butta un occhio alla Categurìa:Sagge: ci sono due volumi che potrebbero tornarti utili.
Se, una volta testate le funzionalità, puoi riportarle in Utente:Ruthven/PostOCR.js, mi faciliti il compito di tenere traccia delle versioni. Ti volevo anche avvertire che creerò un file MediaWiki:Base.js per tutti quelle funzioni che sono comuni a varie pazzielle, come ad esempio leggibox(). Altre funzioni comuni non ne vedo, ma accolgo suggerimenti. --Ruthven (msg) 13:30, 20 nuv 2019 (CET)Rispondi
@Ruthven: Non posso modificare una tua pagina js... al massimo posso reimportarla nella mia aggiornandola con le modifiche che propongo. Ma possiamo fare una cosa diversa: se ti va, visto che tu puoi modificare le sottopagine del mio account, potresti scrivere tu il codice che elabori in una mia sottopagina, è l'unico modo per operare in modo cooperativo su nap.source. --Alex brollo (chiacchiere) 17:48, 20 nuv 2019 (CET)Rispondi
Dimenticavo: le meraviglie degli admin dell'interfaccia. Ora ho unito le due cronologie e possiamo lavorare su Utente:Alex brollo/PostOCR.js. A presto --Ruthven (msg) 22:07, 20 nuv 2019 (CET)Rispondi

We we

cagna

Buone feste Alex! Oggi mi sono accorto della creazione di nap.ws (!!!!). Ottimo. Ogni tanto facevo translate e niente stress. ^^ Auguri. Come vanno le tools, 'o bat-man, Ciaooo --C.R. (chiacchiere) 17:15, 18 dic 2019 (CET)Rispondi

Ma allora ci sei!!! Ricambio gli auguri. Sono un po' arrugginito e un po' demoralizzato con le tools.... al bivio se fare un deciso salto in avanti nella qualità degli script, o lasciar perdere, sono tentato dalla opzione 2. O meglio: continuare a sviluppare, ma solo strumenti di uso strettamente personale. --Alex brollo (chiacchiere) 20:28, 18 dic 2019 (CET)Rispondi
Sicuramente la robba .js, lua, mediawiki e pythonica ci serve. Se non possiamo fare 'o hacker non è la nostra rivoluzione. :D Forza, troviamo nuovi problemi da risolvere col codice! ^^--C.R. (chiacchiere) 11:11, 19 dic 2019 (CET)Rispondi

Phe-bot non è più mantenuto

cagna

Ciao Alex, mi sembra di capire che Phe non c'è più e quindi ci dobbiamo scordare ogni tipo di aggiornamento del bot. Avevi menzionato di avere il codice del bot. Potresti condividerlo? Vorrei modificarlo per nap.source e farlo girare su un server mio (nessun supporto dalla comunità Wikisource a riguardo: ho deciso quindi di prendere le cose in mano e autogestirmi il progetto). --Ruthven (msg) 00:24, 22 maj 2020 (CEST)Rispondi

@Ruthven: Oddio!!! Mi ero scaricato (e modificato) il codice per il solo M & S (anzi, solo per il Match) che mi interessava molto ma si tratta di cose di molti mesi fa, spero di recuperare (cambio di PC, di sistema operativo e più recentemente di versione python) con un tantino di confusione). La principale modifica era quella di abilitare il Match anche per i pdf (roba semplicissima). Faccio mente locale e di so dire; di certo prevede una versione python 2.6 e va ritoccato; inoltre ricordo che richiamava qualche funzione di altro modulo, ma la cosa era facilmente aggirabile. Ti so dire appena posso. --Alex brollo (chiacchiere) 10:05, 22 maj 2020 (CEST)Rispondi
Fai con calma. Devo prima capire come mettere roba su toolforge, per avere una versione funzionante del Match&Split. Poi, se mi confermi che questo tool sia realmente utile, ci mettiamo e ne facciamo una versione "nostra" che magari legge pure i PDF. --Ruthven (msg) 12:46, 22 maj 2020 (CEST)Rispondi
@Ruthven: Ti ho pingato sulla pagina di discussione di it:Utente:Alex brollo/textAlign.py che contiene lo script di tpt modificato da me per uso offline. In realtà, fatto l'enorme sforzo (ai limiti delle mie possibilità neuronali) per capire l'algoritmo di allineamento, ho abbandonato il progetto (in fase funzionante, e già capace di matchare anche da pdf) per una cosa molto più ambiziosa, che funzionava pure: un "Match and fix", capace di correggere l'OCR sulla base di un testo di edizione diversa con un confronto parola per parola (rispettando tutta, o in parte, la punteggiatura e tutto il testo OCR "aggiuntivo" rispetto all'edizione di riferimento (es. annotazioni, ecc). A quel punto, e ottenuta una versione funzionante..... ho abbandonato il progetto e mi sono convertito all'attività di "editor semplice" :-)
Magari adesso, finito Goldoni, trovo tempo e voglia di rimetterci mano. --Alex brollo (chiacchiere) 00:08, 24 maj 2020 (CEST)Rispondi
Ottimo, grazie. Cosa non ti era chiaro dell'allineamento? --Ruthven (msg) 19:17, 24 maj 2020 (CEST)Rispondi
@Ruthven: Ho avuto grandi difficoltà a capire la logica di difflib. Alex brollo (chiacchiere) 19:52, 24 maj 2020 (CEST)Rispondi

Modulo:Testo

cagna

Buonasera caro, sono incappato su Modulo:Testo (ed il relativo Modello:Testo), che sembra un lavoro in corso. Lo hai lasciato perdere oppure conti riprenderlo in mano in futuro? Te lo chiedo perché pensavo di adattarlo per ottenere l'equivalente di Modeło:Testo e iniziare ad usarlo. --Ruthven (msg) 19:37, 3 lug 2021 (CEST)Rispondi

@Ruthven: Vai pure avanti.... ormai mi è completamente alieno. --Alex brollo (chiacchiere) 16:05, 4 lug 2021 (CEST)Rispondi