Visszatérés a weboldalhoz
Natural Language Processing: mi az, és hogyan vehetjük hasznát?

Natural Language Processing: mi az, és hogyan vehetjük hasznát?

2018. febr. 27.

Mind a chatbotokban, mind a fordítóprogramokban óriási jelentősége van a természetes nyelvek feldolgozásának. Mai bejegyzésünkben erről kaphattok több információt.

A természetes nyelvek feldolgozása (Natural Language Processing, NLP) olyan mesterséges intelligencia, amely segít a számítógépeknek abban, hogy megértse, tolmácsolja és feldolgozza a természetes emberi nyelveket. Az NLP tulajdonképpen összekötő kapocsként szolgál az emberek és a gépek közti kommunikáció megkönnyítésében.

Az NLP nélkül a számítógépek ugyan képesek lennének megérteni az egyes szavak jelentését, mesterséges intelligenciával pedig még kérdésekre is tudnának válaszolni, azonban az NLP abban segít, hogy a gép a szavakat kontextuson belül tudja értelmezni. Ez azt jelenti, hogy a gépekkel való kommunikáció során nincs szükség arra, hogy az adott szöveget “lefordítsuk” úgy, hogy a gép számára feldolgozható legyen, hanem a saját szavainkkal (természetes nyelven) kommunikálhatunk vele.

Hogy működik?

A természetes nyelvek feldolgozása több elemből és szakaszból épül fel. Az NLP-vel foglalkozó szakemberek többféle tudományterület módszereit és eszközeit használják ahhoz, hogy a gép és az ember közti kommunikációt könnyebbé és zökkenőmentesebbé tegyék. Ezek közé tartozik például a számítógépes nyelvészet, a mesterséges intelligencia vagy akár maga az informatika is.

Az NLP célja az, hogy a természetes nyelveket kisebb egységekre bontsa le, valamint hogy megállapítsa a kapcsolatokat, relációkat ezek között az elemek között. Minél több adat (szöveg) áll rendelkezésre, annál könnyebb megtalálni az összefüggéseket az adatok között, vagyis annál pontosabb képet kaphatunk a nyelvről.

Hogyan alkalmazhatjuk az NLP-t?

A természetes nyelvek feldolgozását számos módon lehet hasznosítani a mindennapokban, illetve az üzleti életben. Nem is gondolnánk, mennyi területen vesszük hasznát a számítógépes nyelvészet ezen formájának: használható többek között chatbotok, vagy digitális asszisztensek létrehozásához, a mindennapi kommunikáció megkönnyítéséhez, vagy éppen gépi fordításhoz.

Korpusznyelvészet

A korpusznyelvészet az alkalmazott nyelvészet egyik ága, melynek lényege, hogy nagy mennyiségű rendelkezésre álló (beszélt vagy írott) szövegből következtetéseket vonjunk le. A hatalmas mennyiségű szöveget mesterséges intelligencia segítségével elemzik, és az NLP módszerével dolgozzák fel, hogy megállapíthassák az összefüggéseket, kapcsolatokat az egyes szövegeken belül, de akár a szövegek között is.

A szövegek elemezhetők többféle szempontból:

  • A tartalom kategorizálása
    Ennek során a szöveg fő kulcsszavait azonosítják, és ezek alapján csoportosíthatók a különféle szövegek.
  • Összegzés írása a szövegből
    Egy nagy volumenű szövegből a mesterséges intelligencia képes egy rövidebb összegzést előállítani.
  • Szentimentális elemzés
    Az NLP akár azt is képes azonosítani, hogy az adott szöveg létrehozásakor az író vagy beszélő milyen hangulatban volt, vagy mi az általános véleménye a világról. Ez a szóhasználatból és a különböző nyelvtani szerkezetekből állapítható meg.
  • Szintaktikai (mondattani) elemzés
    Olyan szövegeknél lehet nagy szerepe, amelyeknek nem ismert a keletkezési dátuma. A mondattani szerkezeteket és a szöveg szavait együtt elemezve meg lehet állapítani, hogy mikor, hol keletkezhetett az adott szöveg.

Természetes nyelvű interfész

A természetes nyelvű interfész (Natural Language Interface, NLI) célja az, hogy az adatbázisokban való lekérdezést könnyítse meg. Ha természetes nyelven szólunk hozzá, képes azt átalakítani lekérdezéssé, amelyre az adatbázis megkeresi a megfelelő adatokat. Ezeket az adatokat aztán természetes nyelvre visszaalakítva kaphatjuk meg.

Gépi fordítás

Valószínűleg az első dolog, amely mindenkinek eszébe jut, ha számítógépes nyelvészetről van szó, a gépi és az automatikus fordítás. A gépi fordítás kihívása nemcsak abban rejlik, hogy a gépnek meg kell értenie a forrásnyelven megadott szöveget, hanem arra is képesnek kell lennie, hogy ezt a szöveget úgy fordítsa le a célnyelvre, hogy az a célnyelv anyanyelvi beszélői számára is érthető legyen. A műfordításról pedig még nem is beszéltünk: ennek során nem csak a szöveg tartalmát kell átadni a célnyelven, de meg kell őrizni a szöveg hangulatát, hatását is. Valószínűleg ettől még mindig távol áll a gépi fordítás.

Ezen a területen a mesterséges intelligencia mellett nagy segítséget jelent a big data is. Fordítással és gépi nyelvészettel foglalkozó tudósok rájöttek, hogy néha a logika helyett a rendszeres előfordulás dönt abban, hogy egy adott kifejezés megfelelő-e bizonyos kontextusban. Ilyenkor úgy döntenek a kifejezés helyességéről, hogy összehasonlítanak több, már lefordított szöveget, és megvizsgálják, hogy az adott kontextusban a kifejezés melyik fordítása bizonyult megfelelőnek.

Chatbotok és digitális asszisztensek

A digitális asszisztensek, mint például a Google Assistant vagy az Amazon Echo kétségkívül az egyik legelterjedtebb formája a mesterséges intelligenciának. Ráadásul a vállalatok is egyre inkább elismerik, hogy szükségük van a hangvezérlésű technológiára ahhoz, hogy ügyfeleiknek a lehető legjobb szolgáltatást és felhasználói élményt tudják biztosítani.

Az eddigi legjobb AI a piacon: kipróbáltuk az Amazon Echo-t

Ahhoz, hogy Alexa minden kérdésünkre tudja a választ, szintén szükség van az NLP-re. Amíg el nem jön az az idő, amikor a mesterséges intelligenciák maguktól illetve más botoktól tanulnak, addig az egyetlen forrás, amire támaszkodhatunk a chatbot fejlesztésekor nem más, mint a természetes nyelv.

Így pedig együtt kell működniük mind a fejlesztőknek, az AI-szakértőknek, valamint a nyelvészeknek, hogy a chatbot végül képes lehessen megérteni azt, amit a felhasználó mondani akar neki (vagy kérdezni akar tőle), azt úgy átalakítani formailag, hogy a saját szoftvere fel tudja dolgozni, valamint hogy szintén természetes nyelven visszajelzést is adjon a felhasználónak.

A Régens és az NLP

Az egyik legizgalmasabb mesterséges intelligenciához köthető technológia természetesen a mi fejlesztőinket is megihlette – célunk az, hogy ezt az innovatív megoldást mindenki számára elérhetővé tegyük. Nemrég vezettük be saját chatbotunkat a Régens weboldalain, valamint egyéb izgalmas ötletek is vannak a tarsolyunkban – ezekkel hamarosan jelentkezünk!

 

Forrás: Wired, SAS, Expert System