Căutarea multimedia

Căutarea multimedia se numără printre cele mai eficiente moduri de a utiliza recunoașterea vocală. Cu ajutorul recunoașterii automate a textelor înregistrate și a indexării acestora, obțineți acces la informațiile dintr-o înregistrare fără a fi nevoie să ascultați din nou toată înregistrarea. Acesta este un avantaj foarte mare în special în zilele noastre, când avem la dispoziție mai multe informații și înregistrări în care trebuie să căutăm, dar mult mai puțin timp de alocat acestor activități.

Astfel, veți avea la dispoziție o arhivă prelucrată de înregistrări, dar nu va mai trebui să le ascultați pe toate, să vă limitați căutarea la fragmentul de informație pe care îl puteți căuta cu ajutorul cuvintelor-cheie introduse manual, ci veți putea găsi chiar și informații care apar fugitiv într-un anumit fișier înregistrat și care nu ar fi putut fi căutate cu ajutorul cuvintelor-cheie.

Secțiunea lingvistică

Această tehnologie combină programul de recunoaștere vocală cu căutarea full-text și îl completează cu instrumente pentru căutare morfologică, cu dicționarul de sinonime și cu program de traducere. Poate fi combinat cu căutare vocală pentru a crea un sistem care nu caută doar în vorbire, ci este și comandat vocal.

Soluții pentru programe

La fel ca în cazul tuturor sistemelor de căutare eficiente, mai întâi are loc o indexare a fișierelor în care se caută, apoi se poate efectua căutarea cu utilizarea indexurilor create.

Componenta cheie a acestei tehnologii este programul de recunoaștere vocală care transformă sunetul în text (în cazul unor rezultate neclare în recunoaștere, și textul rezultat poate fi neclar). Această etapă este urmată de prelucrarea textului înainte de indexare (crearea registrului - indexului), de exemplu reducerea la lemă - lemmatisation (la forma de bază a cuvântului) pentru căutare morfologică, eventual traducerea în limba indexului și în cele din urmă intrarea în indexul în care sistemul de căutare efectuează căutarea în funcție de întrebările introduse.

Întrebările sunt, de asemenea, prelucrate. De exemplu, poate avea loc lemmatizarea sau expansiunea formelor (forma unui cuvânt este completată cu toate celelalte forme ale sale, pentru a se găsi incidența acestor forme, nu doar a formei introduse în căutare), precum și expansiunea sinonimelor sau traducerea în limba indexului.

Programul de recunoaștere solicită mediile de calcul, iar operațiunile sale trebuie stabilite astfel încât acesta să poată fi capabil să transforme suficient de repede noile fișiere indexate în text. Timpul necesar pentru prelucrarea fișierului este fracțiunea de timp necesară pentru rulajul programului la viteză normală. Un număr mai mare de nuclee permite prelucrarea mai multor fișiere în paralel. Pentru o sarcină mai mare, programele de recunoaștere trebuie amplasate pe servere dedicate care să corespundă parametrilor. În timpul indexării, celelalte activități sunt în principiu, mai rapide. Atunci când serverul este foarte încărcat, un factor limitativ în procesul de căutare este viteza de citire de pe disc. Soluția poate fi utilizarea unor discuri mai rapide, eventual SSD, sau folosirea unei oglinzi a acestora pe celelalte discuri, eventual alte servere de căutare.