CodBi
    Preparing search index...

    Fornisce AI.functionality.

    Autore iniziale: Callari, Salvatore (Callari@WaXCode.net) Manutentore: Callari, Salvatore (Callari@WaXCode.net)

    Index

    Constructors

    Methods

    Constructors

    Methods

    • Questa funzionalità esegue la scansione dei file selezionati di un HTMLInputElement stampa il testo scansionato ed estrae sottostringhe dal testo scansionato o verifica che il testo scansionato corrisponda al modello utilizzando il motore Tesseract AI-OCR.

      Supporto PDF: i file PDF vengono rilevati automaticamente. I PDF con testo (>100 caratteri) vengono elaborati lato client senza utilizzando il backend AI. I PDF con testo minimo (documenti scansionati) vengono trasformati in immagini e inviati a Tesseract per l'OCR.

      Rilevamento automatico dell'orientamento: Il motore OCR Tesseract rileverà e correggerà automaticamente l'orientamento dell'immagine utilizzando il suo OSD (Orientation e rilevamento script).

      • Modalità: Stampa, Verifica o Estrai campi.
      • Modello: RegEx da utilizzare per estrarre le sottostringhe dal testo scansionato o per verificarlo il testo scansionato corrisponde al modello. Quando la modalità è Estrai campi tutti i campi all'interno del contenitore principale di quello contenente i HTMLInputElement toProcess che hanno la classe CodBi-CSS CodBi_AI_OCR_Receiver sono utilizzato per ricevere i campi estratti. Per ciascuno di questi campi, un parametro corrispondente Pattern_... deve essere definito per specificare RegEx da utilizzare per estrarre le sottostringhe dal testo scansionato per quel campo. Il nome del campo è specificato dopo il trattino e sono abbinato al data-cb-Field del campo per estrarre le sottostringhe dal testo scansionato.
      • Separatore: Se Modalità è impostato su Estrai campi, questo parametro definisce il separatore per i risultati di più file. L'impostazione predefinita è una virgola.
      • MaxPages: numero massimo di pagine PDF da elaborare (impostazione predefinita: 5). Impostato su 0 per nessun limite. Si applica solo ai PDF.
      • RegExFlags: flag regex opzionali da applicare a tutti i modelli (ad esempio, "i" per senza distinzione tra maiuscole e minuscole, "m" per multilinea, "s" per dotall). È possibile combinare più flag (ad esempio "im"). Questi flag vengono trasmessi al Servlet Tesseract e applicato alla corrispondenza dei modelli.
      • Preelaborazione: flag booleano opzionale per abilitare la preelaborazione delle immagini prima dell'OCR. Se impostato su true, si applica conversione in scala di grigi, binarizzazione adattiva (metodo di Otsu) e riduzione del rumore da migliorare precisione nel riconoscimento del testo. L'impostazione predefinita è false.
      • InvalidImageText: il testo da visualizzare se una o più immagini non sono conformi al Pattern specificato in modalità Verifica.
      • WrongFileMessage: il testo da visualizzare per l'etichetta della casella di verifica manuale in modalità Verifica.
      • ProcessingImageText: il testo da aggiungere all'etichetta del HTMLInputElement toProcess mentre le immagini vengono elaborati.
      • Massimo Il numero di file che possono essere caricati. Se il numero di file selezionati supera questo numero, l'elaborazione viene interrotta e viene registrato un avviso nella console.
      • QueueBadge: Se impostato su "true", mostra un badge con la posizione corrente della coda mentre in attesa di deduzioni. Sostituisce la proprietà del plugin "AI_QueueBadge". per questa istanza. Predefinito: determinato dalla proprietà del plugin.
      • QueueText: testo aggiunto dopo il numero della posizione in coda nel badge (es. "in coda" → il badge indica "3 in coda"). Predefinito: vuoto.
      • CodBi_AI_OCR_Receiver: elementi con questa classe all'interno del contenitore genitore di quello che contiene il HTMLInputElement toProcess vengono utilizzati per ricevere i campi estratti quando Mode è impostato su Estrai campi. Ciascuno di questi elementi dovrebbe avere data-cb-Field impostato sul nome del file campo per cui ricevere il testo estratto (vedi parametro di configurazione Pattern_...). Nella modalità Stampa, è previsto che una singola area di testo con questa classe riceva l'intero testo OCR produzione.

      Parameters

      • toLoad: { [key: string]: unknown }

        Provided by the CodBi.

      • toProcess: Element

        Provided by the CodBi.

      Returns void