Class AI_OCR

Fornisce AI.functionality.

Remarks

Autore iniziale: Callari, Salvatore (Callari@WaXCode.net) Manutentore: Callari, Salvatore (Callari@WaXCode.net)

Index

Constructors

constructor

Methods

functionality

Constructors

constructor

new AI_OCR(): AI_OCR
Returns AI_OCR

Methods

`Static`functionality

functionality(toLoad: { [key: string]: unknown }, toProcess: Element): void
Questa funzionalità esegue la scansione dei file selezionati di un HTMLInputElement stampa il testo scansionato ed estrae sottostringhe dal testo scansionato o verifica che il testo scansionato corrisponda al modello utilizzando il motore Tesseract AI-OCR.

Supporto PDF: i file PDF vengono rilevati automaticamente. I PDF con testo (>100 caratteri) vengono elaborati lato client senza utilizzando il backend AI. I PDF con testo minimo (documenti scansionati) vengono trasformati in immagini e inviati a Tesseract per l'OCR.

Rilevamento automatico dell'orientamento: Il motore OCR Tesseract rileverà e correggerà automaticamente l'orientamento dell'immagine utilizzando il suo OSD (Orientation e rilevamento script).

Parametro di configurazione:
- Modalità: Stampa, Verifica o Estrai campi.
- Modello: RegEx da utilizzare per estrarre le sottostringhe dal testo scansionato o per verificarlo il testo scansionato corrisponde al modello. Quando la modalità è Estrai campi tutti i campi all'interno del contenitore principale di quello contenente i HTMLInputElement toProcess che hanno la classe CodBi-CSS CodBi_AI_OCR_Receiver sono utilizzato per ricevere i campi estratti. Per ciascuno di questi campi, un parametro corrispondente Pattern_... deve essere definito per specificare RegEx da utilizzare per estrarre le sottostringhe dal testo scansionato per quel campo. Il nome del campo è specificato dopo il trattino e sono abbinato al data-cb-Field del campo per estrarre le sottostringhe dal testo scansionato.
- Separatore: Se Modalità è impostato su Estrai campi, questo parametro definisce il separatore per i risultati di più file. L'impostazione predefinita è una virgola.
- MaxPages: numero massimo di pagine PDF da elaborare (impostazione predefinita: 5). Impostato su 0 per nessun limite. Si applica solo ai PDF.
- RegExFlags: flag regex opzionali da applicare a tutti i modelli (ad esempio, "i" per senza distinzione tra maiuscole e minuscole, "m" per multilinea, "s" per dotall). È possibile combinare più flag (ad esempio "im"). Questi flag vengono trasmessi al Servlet Tesseract e applicato alla corrispondenza dei modelli.
- Preelaborazione: flag booleano opzionale per abilitare la preelaborazione delle immagini prima dell'OCR. Se impostato su true, si applica conversione in scala di grigi, binarizzazione adattiva (metodo di Otsu) e riduzione del rumore da migliorare precisione nel riconoscimento del testo. L'impostazione predefinita è false.
- InvalidImageText: il testo da visualizzare se una o più immagini non sono conformi al Pattern specificato in modalità Verifica.
- WrongFileMessage: il testo da visualizzare per l'etichetta della casella di verifica manuale in modalità Verifica.
- ProcessingImageText: il testo da aggiungere all'etichetta del HTMLInputElement toProcess mentre le immagini vengono elaborati.
- Massimo Il numero di file che possono essere caricati. Se il numero di file selezionati supera questo numero, l'elaborazione viene interrotta e viene registrato un avviso nella console.
- QueueBadge: Se impostato su "true", mostra un badge con la posizione corrente della coda mentre in attesa di deduzioni. Sostituisce la proprietà del plugin "AI_QueueBadge". per questa istanza. Predefinito: determinato dalla proprietà del plugin.
- QueueText: testo aggiunto dopo il numero della posizione in coda nel badge (es. "in coda" → il badge indica "3 in coda"). Predefinito: vuoto.
Classi CSS:
- CodBi_AI_OCR_Receiver: elementi con questa classe all'interno del contenitore genitore di quello che contiene il HTMLInputElement toProcess vengono utilizzati per ricevere i campi estratti quando Mode è impostato su Estrai campi. Ciascuno di questi elementi dovrebbe avere data-cb-Field impostato sul nome del file campo per cui ricevere il testo estratto (vedi parametro di configurazione Pattern_...). Nella modalità Stampa, è previsto che una singola area di testo con questa classe riceva l'intero testo OCR produzione.
Parameters
- toLoad: { [key: string]: unknown }
  Provided by the CodBi.
- toProcess: Element
  Provided by the CodBi.
Returns void
- Defined in packages/form/src_it_temp/Functionalities/ai.ocr.ts:84

Class AI_OCR

Remarks

Index

Constructors

Methods

Constructors

constructor

Returns AI_OCR

Methods

`Static`functionality

Parametro di configurazione:

Classi CSS:

Parameters

Returns void

Settings

On This Page

Class AI_OCR

Remarks

Index

Constructors

Methods

Constructors

constructor

Returns AI_OCR

Methods

Staticfunctionality

Parametro di configurazione:

Classi CSS:

Parameters

Returns void

Settings

On This Page

`Static`functionality