2014. július 20., vasárnap

Katonai informatika, könyvtártudomány és mélytanulás

Chris Anderson: A hosszú farok című könyvében arról ír, hogy az internetes kereskedelem megjelenésével, amikor lehetővé vált az, ami a hagyományos boltok esetében helyhiány miatt nem lehetséges, hogy kis költségráfordítás mellett akár több millió terméket tartalmazó árukészletet is a fogyasztók rendelkezésére bocsássanak, hogy válogathassanak közöttük, a kereskedelem jövedelmezéségének szabályai átalakultak. Mivel ezek az áruházak rengeteg sok terméket árusítanak és vásárlóik is rengeteg sokan vannak, mert a föld minden részéről elérik őket, jövedelmük nagy része nem a legnépszerűbb, sokak által vásárolt termékekből származik, hanem a csak egy-egy szűkebb réteg által preferált termékekből, mert nagyon sok ilyen termékük van, és a különféle fogyasztói rétegek is sokan vannak, akik ezeket elérik és vásárolják. Tehát a szerző szerint mivel az internet megjelenésével lehetővé vált, hogy az online áruházak sok termékkel töltsék fel boltjaikat kis költségráfordítás mellett, az jelenti számukra a legjobb stratégiát, ha minél több áruval töltik fel az adatbázisukat, mert így kis költségráfordítás mellett sok kis fogyasztói réteget elérnek, és ez megsokszorozza a bevételüket.

Ez ugyanúgy érvényes a könyv, zene vagy bármilyen más internetes kereskedelemre és nyilvánvalóan a nagyobb könyvtárak szolgáltatásaira is. Éppen ezért szükségesnek tartom egy keresőrendszer létrehozását, ami beazonosítja a különféle fogyasztói rétegeket, és az általuk leggyakrabban vásárolt vagy kölcsönzött termékeket, hogy rákeresve böngészhessünk a különféle fogyasztói rétegek által preferált termékek között, ami egyrészt azért lehet hasznos, mert ezáltal könnyebbé válik a különféle fogyasztói rétegek szociológiai elemzése, másrészt pedig azért, mert ezáltal a fogyasztók egy-egy termékre, vagy egy-egy fogyasztói csoport által preferált termékcsoportra rákeresve rögtön láthatja, hogy akik az általa preferált terméket szintén kedvelik, milyen más termékeket kedvelnek emellett. Tehát ha például egy könyv címére rákeres, rögtön láthatja, hogy mások az általa preferált könyv mellett milyen más könyveket kedvelnek, amelyek ebből következően számára is érdekesek lehetnek.

A keresőrendszer megalkotásához először is egy olyan algoritmust kell írni, amely a termékadatbázisban rögzíti, hogy egy-egy termék esetében milyen más termékeket szokott leggyakrabban vásárolni, vagy kölcsönözni egy-egy fogyasztó. Ezt általában meg is csinálják a különféle online könyváruházak, hiszen egy-egy könyvük mellett feltüntetik, hogy ezzel párhuzamosan milyen más dokumentumokat szoktak leggyakrabban vásárolni. Ezzel kapcsolatokat alakítunk ki a különféle termékek között az adatbázisban, és beazonosítjuk a különféle fogyasztói rétegeket, és az általuk leggyakrabban preferált termékcsoportokat. Ezekre rákeresni viszont csak úgy tudunk, hogy rögzítjük az adott termékcsoporthoz, vagy könyvcsoporthoz, ha könyvkereskedésről vagy könyvtárról van szó, tartozó tárgyszavakat. A tárgyszavak olyan mindenki által használt szavak és szakkifejezések, amelyek a könyv vagy másfajta dokumentum tartalmát írják körül. Például, ha kultúrföldrajzi témájú könyvről van szó, akkor a hozzá kapcsolódó tárgyszavak nyilvánvalóan kultúra és földrajz.

Általában minden könyvtári adatbázisban rendelnek tárgyszavakat a dokumentumokhoz, az elektronikus könyvkereskedelemben nem mindenhol, de ott is megoldható. Tehát ahogy a keresőrendszer beazonosítja a különféle olvasórétegekhez tartozó könyvcsoportokat úgy egy külön adatbázisban egy csokorba gyűjtheti a könyvcsoportokba tartozó könyvekhez rendelt tárgyszavakat, és egy-egy fogyasztói réteghez tartozó könyvcsoportot ezentúl majd ezeknek az összegyűjtött  tárgyszavaknak összessége fog jelölni. Igen ám, de lehetséges, hogy egy-egy különálló fogyasztói csoport egymástól eltérő, de ugyanazokhoz a tárgyszavakhoz rendelt könyvcsoportot preferál, ekkor pedig problémává válik a különálló fogyasztói csoportokhoz tartozó könyvcsoportok megjelölése, mert így ugyanazokból a tárgyszavakból fog összeállni a címük, ez pedig nem szabad, hogy így történjen.

Ezt a problémát úgy oldhatjuk meg, hogy ha a különféle könyvcsoportokhoz véletlenül ugyanazok a tárgyszavak tartoznak, akkor a keresőrendszerbe külön bele kell programozni egy algoritmust, amely megkísérel kikeresni az adott könyvcsoporthoz tartozó dokumentumok címeiből egy releváns kifejezést, ami a legjobban jellemzi az adott könyvcsoportot, és azt a könyvcsoport tárgyszavakból álló címének a végére írja az adatbázisban, létrehozva ezzel egy új címet a könyvcsoport számára. A különféle fogyasztói rétegekhez tartozó dokumentumcsoportok címeire való rákeresést úgy lehetne megoldani a legjobban, hogy adva lesz egy keresőmező, ahova szabadon be lehet írni az általunk keresett könyvhöz, vagy könyvcsoporthoz tartozó tárgyszavakat, vagy címből vett kifejezéseket, illetve a dokumentumok egyéb adatait legyen az megjelenés éve vagy kiadó, egy mellette lévő lenyíló mezőben meg lehet majd adni, hogy hány dokumentumból álljon a könyvcsoport, ami értelemszerűen a könyvcsoporthoz tartozó tárgyszók és címből vett kifejezések körét is szűkítheti, majd entert ütve olyan linkek csoportját adja majd ki, amelyek a könyvcsoportok címeit, tehát a hozzájuk tartozó tárgyszavakat és címből vett kifejezéseket tartalmazzák, és ezekre a linkekre kattintva megtekinthetjük az adott könyvcsoporthoz tartozó dokumentumokat.

Ha például a földrajz tárgyszót ütöm be, akkor azoknak a könyvcsoportoknak a linkjeit adná ki, amelyekhez földrajz tárgyszó tartozik, ha pedig a megjelenési évnek az 1981-et írom be, akkor azoknak a könyvcsoportoknak a linkjeit adná ki, amelyekben szerepel 1981-ben megjelent könyv. A könyvtárak esetében az olvasásszociológiai elemzések végrehajtása céljából az egyes könyvcsoportok mellett fel lehetne tüntetni különféle statisztikákat is mint például, hogy az egyes könyvcsoportokat milyen korú, foglalkozású stb., olvasók preferálják.

Hogyan kapcsolódnak ehhez az osztott rendszerek. Az osztott rendszerek olyan működő számítógépes hálózatok, ahol van egy központi számítógép, továbbá több hozzákapcsolt kisebb számítógép, és a kisebb számítógépeken folyó munkák eredményeit a központi számítógép összegyűjti és egymással szintetizálja, egy fájllá, alkalmazássá gyúrja a pontosabb elemzés kedvéért. Vegyük például erre a katonai alkalmazásokat, ahol a harctéren több egymástól különálló harckocsi harcol, amelyek mind fel vannak szerelve belső számítógéppel, és ezek a belső számítógépek egy műholdas kapcsolattal mind össze vannak kötve egy központi számítógéppel, ami valahol egy katonai központban van.

A harckocsikban található számítógépekre egy szimulációs program van feltelepítve, ami folyamatosan rögzíti a harckocsi helyzetét, és közvetlen környezetének adatait, és matematikai számításokkal megpróbálja megbecsülni, hogy mi a következő legoptimálisabb lépés a harckocsi számára a háborús bevetés további menetében. Így például, hogy térjen e ki az ellenség elől, vagy kezdeményezzen támadást stb.

A harckocsikban található szimulációs programokból a műholdas kapcsolaton keresztül a katonai központban található központi számítógépbe kerülnek az adatok, ahol egy újabb program szintetizálja ezeket az adatokat, és egy nagy szimulációvá alakítja őket, ami az egyes harckocsik állapotain keresztül az egész hadsereg állapotváltozásait rögzíti és elemzi, továbbá az elemzések eredményeinek segítségével parancsokat juttat vissza az egyes harckocsiknak, hogy mik a teendőik a többi harckocsi állapotváltozásainak esetében, tehát hogy siessen e a segítségére egy másik harckocsinak, vagy támadjon meg egy másik ellenséges harckocsit, ha valamelyiket egy baráti harckocsi már kilőtte. Tehát ebben az esetben a harci mozgások koordinálását segítik ezek az osztott rendszerek.

A könyvtárügy esetében, ha már azonosítva vannak a fent leírt fogyasztói csoportok, olvasói rétegek a könyvtári adatbázisokban, akkor szintén lehetne írni ezek számára a katonai alkalmazásokhoz hasonló osztott alkalmazást, ami mindig rögzíti és követi, ha például új dokumentum kerül a könyvtári adatbázisba, és az egyik olvasói csoport érdeklődni kezd iránta, vagy újabb olvasói csoport jön létre egy adott dokumentumcsoport körül, és ha a könyvtárnak van egy konkrét célja az olvasókkal kapcsolatban, mint például a minden oldalról művelt és tájékozott olvasók kinevelése, akkor ezzel az osztott alkalmazással lehetne automatikus elemzést végezni, hogy az egyes olvasókat, olvasói csoportokat a jelenlegi olvasottsági, műveltségi és érdeklődési szintjükön milyen más dokumentumok olvasása felé lehetne terelni, hogy egyszer majd elérjék a sokoldalúan művelt állampolgárok szintjét.

Tehát ez az osztott alkalmazás minden olvasói csoportnak felmérné az érdeklődési, műveltségi és olvasottsági szintjét, továbbá a könyvtári adatbázisban már meglévő, és újonnan felvett dokumentumok olvasmányi értékét és beépített mesterséges intelligencia alkalmazások segítségével olyan olvasmányok felé terelné az olvasó figyelmét, amelyekkel a jelenlegi műveltségi szintjéről kiindulva egyszer majd elérhető lesz a sokoldalúan művelt olvasó ideálja például úgy, hogy a könyvtári rendszer minden héten kiküldi az olvasó  e-mail címére a rendszer által neki javasolt könyvek listáját.

Beépített mesterséges intelligencia alkalmazásnak pedig az úgynevezett mélytanulás alkalmazásai lennének a legmegfelelőbbek ebből a szempontból. A mélytanulás olyan mesterséges intelligencia alkalmazásokra alapuló új informatikai módszer, amely nagyméretű számítógépes adatbázisokat átfésülve tud felismerni és azonosítani szöveges, multimédiás, vagy egyéb más formátumú adatokat és fájlokat, mint például képeket, vagy matematikai képleteket. Készítettek már olyan mélytanulási alkalmazásokat, amelyek nagyméretű rendőrségi adatbázisokban tudják felismerni a bűnözők fényképeit, vagy egyéb más adatait, illetve olyan programokat is, amelyek kémiai adatbázisokból tudják kiszűrni az új gyógyszerek készítésére alkalmas molekulákat stb. A mi esetünkben olyan mélytanulási alkalmazásra lenne szükség, ami az azonosított olvasói csoportok dokumentumai közül kiszűri, hogy egy-egy dokumentum elolvasása melyik másik olvasói csoport tagjainak jelentene továbbfejlődést a művelődés terén, és ezután már ezeket a dokumentumokat lehetne ajánlani nekik.

Ez a módszer nem csak a könyvtári alkalmazások területén, hanem az internetes marketing területén is alkalmazható lenne természetesen, hiszen ma már a Google keresője, vagy a facebook sem más, mint egy online marketing rendszer, ahol az érdeklődésüknek megfelelő termékeket és szolgáltatásokat ajánlanak a fogyasztóknak. Ahogy a könyvtárakban a műveltség fejlesztésére, úgy az online marketing rendszerekben a fogyasztói ízlés fejlesztésére lehetne használni ezt a módszert.

Felhasznált Irodalom:

Chris Anderson: Hosszú farok A végtelen választék átírja az üzlet szabályait, HVG KIADÓI ZRT, 2007.

Dr. Munk Sándor: Katonai informatika a XXI. század elején, ZRÍNYI KIADÓ, 2007.

Ígéretesek a mélytanulást segítő szoftverek http://sg.hu/cikkek/94136/igeretesek-a-melytanulast-segito-szoftverek

Nincsenek megjegyzések:

Megjegyzés küldése