Aus­zeich­nung, KI-Trai­ning und Vorhersagen

Jetzt geht es an die ei­gent­li­che Da­ten­ex­trak­ti­on, das Aus­zeich­nen, das KI-Trai­ning und die Vor­her­sa­gen. Da­für wer­den die In­for­ma­tio­nen auf ei­nem Teil der Do­ku­men­te aus­ge­zeich­net, das KI-Mo­dell trai­niert und an­schlie­ßend die Da­ten ex­por­tiert. Aber schau­en wir uns das ein­mal ge­nau­er an.

Die Aus­zeich­nung der Datenpunkte

Bei der Aus­zeich­nung wer­den auf ei­nem Teil der Do­ku­men­te die ein­zel­nen Da­ten­punk­te für die KI ge­kenn­zeich­net. Dies pas­siert hän­disch durch ei­nen Men­schen – den KI-Trai­ner. Er zeigt der KI durch die Aus­zeich­nung, wel­ches die zu ex­tra­hie­ren­den In­for­ma­tio­nen auf dem Do­ku­ment sind (z.B. das ist das ge­wünsch­te Da­tum, das ist die ge­such­te Rech­nungs­num­mer, etc.). Hier zahlt sich die gute Struk­tu­rie­rung der Do­ku­men­te vor­ab aus. Denn je bes­ser die Struk­tu­rie­rung ist, des­to schnel­ler geht die Aus­zeich­nung im An­schluss. Wenn sich der KI-Trai­ner nicht auf je­dem Do­ku­ment neu ori­en­tie­ren und die aus­zu­zeich­nen­den In­for­ma­tio­nen su­chen muss, kann er die ge­such­ten In­for­ma­tio­nen schnel­ler fin­den und auszeichnen.

Ein Bei­spiel:

Sie kön­nen sich die Aus­zeich­nung vor­stel­len, wie ei­nem Kind bei­zu­brin­gen, was ein Ap­fel, eine Bir­ne oder eine Erd­bee­re ist. Sie zei­gen dem Kind z.B. ein Bild von der je­wei­li­gen Frucht und das Kind er­kennt spä­ter ei­gen­stän­dig, was um was für eine Frucht es sich in sei­ner Hand handelt.

Datenextraktion 3: Auszeichnung, KI-Training, Vorhersage Magic

KI-Trai­ning – it‘s ma­gic – oder die Er­stel­lung des KI-Modells

Beim KI-Trai­ning pas­siert die ei­gent­li­che Ma­gie au­to­ma­ti­siert in der Ma­schi­ne. Für den Men­schen ist es le­dig­lich ein Knopf­druck: Die KI ver­wen­det die Trai­nings­da­ten, um ein Mo­dell zu er­zeu­gen. Mit die­sem Mo­dell las­sen sich an­schlie­ßend die Vor­her­sa­gen durchführen.

Um bei un­se­rem Bei­spiel zu blei­ben: Jetzt bil­det das Klein­kind das Ge­hirn aus, um das vor­ab ge­lern­te spä­ter ei­gen­stän­dig anzuwenden.

Vor­her­sa­gen oder auch die ei­gent­li­che Extraktion

Die Vor­her­sa­gen sind die ei­gent­li­che Ex­trak­ti­on der Da­ten. Sie bau­en auf dem KI-Trai­ning auf. Auch hier gilt, je bes­ser das KI-Trai­ning, des­to ex­ak­ter die Vor­her­sa­gen. Zur Kon­trol­le wer­den die Vor­her­sa­gen erst­mal nur auf ei­nem Teil­be­stand an­ge­wen­det (Stich­pro­be). Je nach­dem, wie gut das Er­geb­nis ist, wird ggf. nach­trai­niert, be­vor die Ex­trak­ti­on der Nutz­da­ten auf dem ge­sam­ten Da­ten­be­stand durch­ge­führt wird.

Im Bei­spiel un­se­res Klein­kin­des be­deu­tet das die An­wen­dung des Ge­lern­ten. Das Kind be­kommt jetzt eine Kis­te mit Obst und sor­tiert Äp­fel, Bir­nen und Erd­bee­ren in neue Kisten.

Das Er­geb­nis und der Fak­tor Erkennungsleistung

Nach der Ex­trak­ti­on zeigt sich, wie gut die Er­ken­nungs­leis­tung letzt­end­lich wirk­lich ist. Mit ei­ner gu­ten Vor­be­rei­tung kann man den Auf­wand am Ende deut­lich re­du­ziert. Eine 10 % schlech­te­re Er­ken­nungs­leis­tung kann be­deu­ten, dass von 70.000.000 Da­ten­punk­ten 7.000.000 Da­ten­punk­te über­prüft wer­den müs­sen. Letzt­end­lich ge­winnt man nichts, wenn man vor­ne Zeit auf Kos­ten der Er­ken­nungs­leis­tung ein­spart. Die­se Zeit hängt man am Ende um ein Viel­fa­ches wie­der an, wenn man die ex­tra­hier­ten Da­ten ma­nu­ell über Wo­chen be­rei­ni­gen muss.

Datenextraktion 3: Auszeichnung, KI-Training, Vorhersage Fazit

Fa­zit

Durch die­se fle­xi­bel auf­ein­an­der auf­bau­en­den Mo­du­le kann die in­ser­ve IDP-Platt­form mit klei­nen und gro­ßen Da­ten­be­stän­den sehr gut um­ge­hen und am Ende ein op­ti­ma­les Er­geb­nis er­zie­len. Soll­ten Sie Fra­gen zum The­ma au­to­ma­ti­sier­te Da­ten­ex­trak­ti­on ha­ben, gibt Ih­nen un­ser Ex­per­te Diet­mar Nei­dig gern in ei­ner Demo-Ses­si­on Ein­bli­cke in die IDP-Plattform. 

Di­rekt Ter­min vereinbaren!

Mit dem On­line-Tool Calend­ly kön­nen Sie di­rekt on­line Ih­ren Wunsch­ter­min wäh­len. Bu­chen Sie noch heu­te Ihre 15-mi­nü­ti­ge Be­spre­chung bei Diet­mar Nei­dig und er­hal­ten Sie eine Ka­len­der-Ein­la­dung mit Zu­gangs­link zu Ih­rer per­sön­li­chen Teams-Besprechung.

Dietmar Neidig

Diet­mar Neidig

CSO

mail dneidig@inserve.de
fon +49 511 936 857 67

An­wen­dungs­fäl­le fin­den Sie auf un­se­rem Blog!