Automatische documentverwerking · Titel van de presentatie 14-6-2021 | 20. Table Table Query...

Post on 17-Aug-2021

1 views 0 download

Transcript of Automatische documentverwerking · Titel van de presentatie 14-6-2021 | 20. Table Table Query...

ANN DOOMS

Automatische documentverwerking

image

paragraph 1

paragraph 2

paragraph 3

paragraph 4 paragraph 5

paragraph 6

paragraph 7paragraph 8

3

Wiskunde helpt je lezen!

Titel van de presentatie 14-6-2021 | 12

Titel van de presentatie

14-6-2021 | 13

Proximity Similarity Symmetry

Titel van de presentatie 14-6-2021 | 14

Titel van de presentatie 14-6-2021 | 15

Titel van de presentatie 14-6-2021 | 17

Titel van de presentatie 14-6-2021 | 18

Titel van de presentatie 14-6-2021 | 19

Titel van de presentatie 14-6-2021 | 20

Table

Table

Query Answer

Brand HUNTSMAN

Family 2c epoxy adhesive

Processing time 100 minutes

Mixing Ratio[by weight ] under A/B 100:100

Mixing Ratio[by Volume ] under A/B

100:80

Mpa Steel 25

• Input: pdf/scan/foto (jpeg, tiff, …)

• Output: verwerking van aanwezige informatie (“beyond” keyword search)

• Bestaande software: OCR (ABBY FineReader, Tesseract, …), specifieke parsers

• Problematiek: niet accuraat genoeg, geen begrip van inhoud

• Oplossing: herkenning is generiek en accuraat, parser is specifiek dus TBD

VAKGROEP WISKUNDE & DATA SCIENCE - ANN.DOOMS@VUB.BE

Automatische documentverwerking