venerdì 26 gennaio 2018

Biblos e nuove funzionalità da programmare

La programmazione di nuove funzionalità non è mai un lavoro da iniziare senza una preventiva valutazione, soprattutto in questo periodo in cui ho bisogno di ricaricare le batterie. Perciò scrivo guardando al futuro, cercando di descrivere le funzionalità che ho messo in pausa.

Nella scaletta di programmazione di Biblos 5 ci sono 3 macrofunzionalità che in futuro vorrei/dovrei sviluppare, oltre alle classiche integrazioni o correzioni minori.

  1. Stili del testo
  2. Riconoscimento ottico dei caratteri
  3. Riconoscimento vocale

Lo sviluppo della gestione degli Stili del testo è in pausa sin dall'uscita di Biblos 5. È una funzionalità di media complessità che va a incidere su vari aspetti del documento di scrittura e di tutti gli elementi complessi in esso utilizzabili. La funzionalità è parzialmente programmata, ma di codice da scrivere ce n'è ancora tanto.
I vantaggi che si avrebbero con gli Stili del testo sarebbero diversi. Il più importante sarebbe quello di formattare completamente un documento scegliendo semplicemente uno stile da dargli. Per chi prepara libri per la stampa in braille, per esempio, in pochi click si potrebbe formattare un documento e renderlo immediatamente strutturato, con estrema semplicità. Anziché stampare in braille un documento privo di formattazione specifica, applicando uno stile il documento assumerebbe un altro aspetto e avrebbe tutti quegli elementi utili per una migliore lettura braille.
Sì, lo so, dovrei farlo, sarebbe una bella cosa. La domanda a cui non so darmi ancora una risposta è: nel 2018 il braille è ancora vivo, moribondo o definitivamente morto? Sono consapevole che gli Stili del testo servono anche a fare altro, e perciò temporeggio, al fine di chiarirmi bene le idee e ricevere stimoli da quello che osservo.

Aggiungere un motore OCR in Biblos è stata sempre una funzionalità allettante. Ho cercato contatti, ho fatto delle ricerche in merito, ma non sono mai riuscito a trovare soluzioni qualitativamente accettabili e a basso costo. Con Windows 10 si sono aperte nuove possibilità, in quanto questo sistema operativo possiede internamente un motore OCR che potrebbe essere utilizzato anche da Biblos. L'inconveniente che mi frena un attimo è che legherei Biblos a una funzionalità esterna, soggetta agli umori e alle decisioni di Microsoft. Traduco: da un giorno all'altro Microsoft potrebbe toglierla o inibirne l'accesso e Biblos resterebbe in braghe di tela. Legare una funzionalità di un software a uno strumento prodotto da terzi non è mai una scelta da fare a cuor leggero. In ogni caso mi sono promesso di studiare l'interfaccia di accesso che Microsoft mette a disposizione degli sviluppatori (presumo), per valutarne la stabilità, la qualità e la fattibilità di introdurla in Biblos.

L'ultima funzionalità a cui penso da tempo e che vorrei sperimentare è il riconoscimento vocale. I precedenti Windows possedevano l'interfaccia per poter utilizzare questa funzionalità, ma erano come scatole vuote se non si installavano o compravano appositi software. Windows 10 invece, è una mia ipotesi che non ho verificato, dovrebbe essere corredato di motore di riconoscimento vocale, dato che già a bordo c'è Cortana. Vorrei aggiungere in Biblos la capacità di accogliere comandi vocali o utilizzare la dettatura vocale. Questa è una funzionalità tutta da sperimentare, che mi impegnerebbe un po'. Certo, non avrebbe molta utilità, in quanto un non vedente fa prima a utilizzare la tastiera, ma la penso più per quelle persone che hanno difficoltà alle mani, per le quali dettare sarebbe più immediato che premere dei tasti.

Dal mio punto di vista gli Stili del testo sono la parte più semplice da sviluppare, perché mi muovo in un terreno conosciuto. Confesso che per OCR e riconoscimento vocale mi piacerebbe approcciare il problema in ottica di ricerca e sviluppo, ma sono consapevole che già sviluppare un motore OCR mi impegnerebbe tutto il tempo disponibile, e probabilmente all'inizio non avrebbe neanche la qualità degli OCR che il mercato oggi offre. Discorso ancora più difficile per il riconoscimento vocale, un settore talmente specialistico che mi verrebbe difficile anche solo iniziare una sperimentazione.
Per queste ultime due funzionalità l'approccio migliore sarebbe quello di avvalersi di soluzioni già esistenti. Il problema è sempre la gratuità. Anche quando Biblos era un prodotto shareware, acquistare prodotti simili da includere era una spesa esageratamente alta. Non ho sufficiente forza per poterlo fare. Infatti, fino ad ora ho aspettato che in ambiente free o di sistema apparissero soluzioni stabili e utili. Forse con Windows 10 si sono aperte delle finestre, scusate il gioco di parole, per poter timidamente sondare queste possibilità.

Nessun commento:

Posta un commento