Érdekesnek vélt házi dolgozataim

Multimédia rendszerek és alkalmazások (A "MICRO PROFESSOR-ral a PC körül" című progink bő leírása, ami egyben a 2000/2001-es tavaszi félévi önálló labor foglalkozásunk beszámolója)
COLOR mixer - Additív és szubtraktív színkeverést bemutató program (Számítógépes Grafika és Animáció labor házi feladat, 2001. május)
Kameramozgatási technikák a vizuális hatások és utómunkálatok tükrében (Vizuális kommunikáció - média c. tárgy házi dolgozata néhány filmforgatási trükkről)
A Budapesti Műszaki és Gazdaságtudományi Egyetem interaktív internetes térképe (a "kereső"-ben lévő BME-térkép dokumentációja, ami az Internet elemei és hozzáférései c. tárgy házi feladataként készült)
A három dimenziós és sztereoszkópikus képek megjelenítésének módszerei és lehetőségei (Híradástechnika házi feladat a térbeli megjelenítés néha még otthon is megvalósítható lehetőségeiről)
A virtuális valóság, a mesterséges intelligencia és kapcsolatuk (Számítógépes kultúrára írt nem túl tudományos inkább hétköznapi nyelven megfogalmazott értekezésem)

Lap tetejére

Következő

Multimédia rendszerek és alkalmazások

Önálló labor beszámoló

1. Bevezető

   A huszonegyedik század embere egy olyan világot épített ki magának, ami a legkülönbözőbb környezetben is a legkényelmesebb módon szolgálja ki őt. A kényelem egyik alapvető feltétele, hogy az információk a legegyszerűbb módon legyenek feldolgozhatók. Ha a látást vesszük alapul, mint érzékelő eszköz, a képi világ által teremthetünk kapcsolatot a célközönséggel. Ha sikerül ezt viszonylag egyszerűen feldolgozható formába önteni, gondolok itt a nem túl bonyolult látványos és így beszédes képekre illetve figurákra, elértük, amit akartunk. Ha a képeket hangokkal is kiegészítjük, természetesen a célközönségnek megfelelő fülbemászó dallamokkal, figyelemfelkeltő vagy érdekes zajokkal, akkor már több csatornát nyitottunk meg, elősegítendő az információ lehető legpontosabb célba érkezését. Minél több médiát veszünk igénybe, annál nagyobb eséllyel lelünk befogadókra.
   A technika fejlődésével immár a hétköznapi ember számára is elérhetővé vált, hogy hangját a multimédia segítségével a legkülönbözőbb formában hallassa a nagyvilággal. Így egyre többen és többen fogják az információcsere e kényelmes és egyszerű módját választani. Ha az ember vásárol egy asztali számítógépet, amelyre az árusító cég ráragasztotta a "multimédiás" jelzőt, talán nem is sejti, hogy ezáltal már nem csak fogadni vagy lejátszani lesz képes a körülötte bolyongó végtelen sok multimédiás üzenetet, de újakat is létre tud majd hozni. Interaktivitással megfűszerezve a dolgot, lehetővé teheti, hogy egyes célcsoportok válogatni tudjanak az általuk érdekesnek vagy kevésbé érdekesnek vélt részinformációk között. Ekkor viszont már jóval több tennivalója akad, hiszen nem csak egy egyszerű statikus forrást készít, hanem egy többféle beavatkozásra is reagálni képes multimédiás alkalmazást.
   Féléves munkánk folyamán olyan kész, piacon kapható szoftverrendszerekkel ismerkedtünk meg, amelyek együttes, jól szervezett felhasználásával változatos multimédiás alkalmazásokat lehet készíteni. Ennek demonstrálására egy oktatóprogram fejlesztésébe kezdtünk bele, mely inkább a látványosabb módon való tanítást helyezi előtérbe, mintsem a monoton magolást. Lényege, hogy bemutassa a fiatalabb vagy a témában kevésbé járatos felhasználónak, hogyan is működik napjaink egyik legszélesebb körben használt munkaeszköze (így szórakoztatóeszköze is), a számítógép. Minden lényegesebb alkatrész, mint különálló témakör kerül bemutatásra, ahol a látványos animációktól a részletesebb leírásokig elég információval találkozhat a "tanuló", hogy alapszinten elsajátítsa, amit az eszközről tudni érdemes.

2. A megismert és alkalmazott szoftverrendszerek

2.1. Macromedia - Director

   
Alkalmazásunk motorjaként a Macromedia Director 8 Shockwave Studio nevű programot használtuk, amivel többek közt figyelemfelkeltő üzleti prezentációk, reklámfelületek, valamint interaktív szórakoztató és oktató csomagok is készíthetők. Ezen mozik (a gyártó cég nevezi így a programmal készített alkalmazásokat: movie) futtathatók az Internetről böngészőkben vagy azoktól függetlenül, de készíthetünk belőlük önálló programfájlt is, amit aztán helyi hálózaton vagy CD-n meg is oszthatunk másokkal. Érdemes még észrevenni, hogy az előbb felsorolt példák mindegyike felruházható azokkal a jellemzőkkel, amiket a bevezetőben egy hatékony multimédiás alkalmazás szükséges részének tekintettem.

2.1.1. A Director felépítése

   A szoftver voltaképpen egy objektumorientált, eseményvezérelt fejlesztőkörnyezet. Kezelésében megtalálhatók a manapság nagy népszerűségnek örvendő vizuális fejlesztői eszközök, de természetesen ezek kiegészíthetők (sőt, a hatékony működés érdekében ki is kell egészíteni) hagyományos programírási lehetőségekkel. Ez utóbbiak a szoftver saját programozási nyelvén történik, amit Lingo-nak nevezett el a gyártó.
   Ha összehasonlítanánk az objektumorientált programozási szakzsargont a Director-ban használatossal, akkor objektumok alatt azokat a médiákat értenénk, amiket a mozi folyamán meg kívánunk jeleníteni vagy szólaltatni. Pontosabban fogalmazva: ha egy képet, animációt vagy hangeffektet fölveszünk az alkalmazásunkba, akkor azt Cast Member névvel illeti a Director, és egy Cast-be helyezi el. (Cast-ből egy moziban többet is létrehozhatunk.) Tehát olyan, mintha az egy film forgatása során az egyik stáb egy tagja lenne. Ezen Cast Member-öknek hasonló a szerepe, mint az osztályoknak az objektumorientált programozásban (továbbiakban: OOP). A program látható felülete egy színpad (Stage), amire sorra felhelyezhetjük a Cast Member-ök klónjait, az ún. Sprite-okat. Talán ezek azok, amik megfelelnek az objektumoknak az OOP-ben. A Stage egy többrétegű terület, ami azt jelenti, hogy az egyes Sprite-ok takarásban is lehetnek egymással. Sőt ez egyfajta kényszer a Director-nál, hiszen egy bizonyos időpontban egy Sprite-ra azzal a rétegnek a sorszámával hivatkozhatunk, amelyikben az helyet foglal. Ebből következik, hogy egy rétegben egy időben csak egy Sprite-ot helyezhetünk el. És itt jön be a képbe egy következő eleme a Director-nak, a kotta (Score), ami egy időegyenes függvényében ábrázolja a Stage egyes rétegeit és azok tartalmát. Az idő mérésére itt a szintén filmes körökből átvett keret (frame) szót használják. Minden Sprite - és természetesen minden Cast Member is - rendelkezik egy csomó tulajdonsággal (properties), ami az alapvető (fajtájára vonatkozó) paramétereket tartalmazza. Ezen kívül a Sprite-oknak definiálhatunk viselkedéseket (behavior) is, amik viszont már a Stage-en elfoglalt helyüktől és ottani működésükről szól. (Tehát egy Cast Member-nek ilyenje nem lehet.) Behavior az a függvénycsoport, ami rögzíti egy Sprite-ról, hogy miképp viselkedjen, amikor mondjuk, fölé érkezik az egérmutató, kattint rajta egyet a felhasználó, vagy megkezdődik egy frame képének kirajzolása. És itt már, mint eseményvezérelt program beszélünk a Director moziról, ugyanis ezek azok az események, amikhez egy-egy függvényt rendelve megadjuk, hogy mi mit csináljon. Létrehozhatunk olyan függvényeket is, amik objektumtól függetlenül egy bizonyos idő bekövetkeztekor hívódnak meg, ezeket Frame Script-eknek nevezik.

2.1.2. A Director-ban használatos médiák és az alkalmazások szállíthatósága

   A Macromedia a két legnépszerűbb személyi számítógép típusra készítette el a Director-t: az Intel (Windows OS) valamint az Apple (Macintosh OS) processzoros gépekre. Oda figyelt arra is, hogy a különböző helyeken készült alkalmazások (Director-forrás formában) könnyedén áttelepíthetők legyenek egyik helyről a másikra. Csupán újra kell fordítani a forrást. Ez viszont megkövetelte, hogy a médiák is szállíthatók legyenek. Ezért a Director-ban a legismertebb média formátumokat tették felhasználhatóvá, elsősorban azokat, amik e két rendszer mindegyikén régóta ismertek. Ilyenek például az Adobe és a QuickTime kép és animáció formátumai. Természetesen a legjobb kihasználhatóság érdekében implementáltak néhány nem átszállítható, operációs rendszertől függő fájltípust is, mint az AVI, FLC, FLI (Windows) vagy a PICS, Scrapbook (Macintosh). Ugyanakkor a Director lépést is tart a korral, és a viszonylag új típusokat is kezel, pl.: MP3, PNG. Az meg szinte teljesen egyértelmű, hogy a "házon belüli" formátumokkal is kompatíbilis: beimportálhatók a Flash animációk is, amik a Director mozikhoz hasonlóan interaktív, akár önálló életre is képes de elsősorban WEB-es (böngészőkben futtatható) médiák.

2.2. Kinetix - 3D Studio MAX

   A programunkban bemutatandó képek és animációk szinte kivétel nélkül a Kinetix 3D Studio MAX R3 nevű programmal készültek. Több okunk is volt, hogy így választottunk. Első és legfontosabb tényező, hogy a választott téma (mind a laborfoglalkozásé, mind pedig alkalmazásunké) bizonyos tárgyak három dimenziós lemodellezésére és azok fotorealisztikus megjelenítésére épül. Továbbá az animációk elkészítéséhez rengeteg olyan lehetőséggel bír, amik azt a lehető legvalósághűbbé teszik. És végül, de nem utolsó sorban, ehhez a modellezőrendszerhez rendelkeztünk annyi alapvető ismeretanyaggal, amiből ki tudtunk indulni, és amit a félév során tovább tudtunk bővíteni.

2.2.1. A 3D Studio MAX felépítése és működése

   A program követi a térbeli modellezéshez szükséges mérnöki szemléletmódot. A felhasználó több különböző és egyénileg testre szabható vetületi és perspektivikus nézeti kép segítségével tud létrehozni térbeli modelleket. Ezek a modellek több féleképpen is elkészülhetnek. A teljesség igénye nélkül: alapobjektumok (téglatest, gömb, ...) összeépítésével (boolean, link, group eljárások), görbék (spline, ...) kihúzásával és torzításával (extrude, loft, bevel eljárások), matematikailag leírható görbékkel vagy felületekkel (surface, ...), pontokból összeállított térhálóval (mesh) stb. Görbéket alkalmazva sokkal simább felületeket hozhatunk létre, melynek finomsága a felbontástól vagy a nézeti távolságtól szinte egyáltalán nem függ. Előnyük még, hogy tárolásukhoz nem kell sok információt tárolni. Azonban további modellezési és képszintézises műveletek végrehajtásához elég nagy számítási teljesítmény szükséges. Más a helyzet a térhálókkal, hiszen azokat diszkrét pontok és az azokat összekötő egyenesek definiálják. Így azokat túlságosan közelről tekintve nem tudjuk a valósághűen görbe felületek látványát visszaadni. Ezeket a pontokat és éleket aztán tárolni is kell, ami sokkal több információval jár, mint az görbék esetében volt. Előnye viszont a rendkívül jó kezelhetőség mind renderelés (a kész kép elkészítése), mind további modellezési eljárások alkalmazása esetén. Elkészített alkalmazásunk modelljeinek elkészítéséhez mindkét módszert alkalmaztuk, attól függően, hogy hol mik voltak a megjelenítés követelményei.
   A modellekre ezután az élethű látványhoz megfelelő anyagmintákat kell húzni. Ezek az anyagok szinte csak és kizárólag a tárgyak optikai tulajdonságainak beállítására használhatók. Másra nem is nagyon van szükségünk, hiszen a pl. mechanikai vagy hőtani tulajdonságok megjelenítéséhez már inkább valamiféle mozgásra de legalábbis látványváltozásra (animációra) van szükség. Az anyagok készítésének főbb mozzanatai pl. szín és árnyalás, csillanás mértéke és színe, textúra, átlátszóság, saját fénykibocsátás, felületi egyenetlenség, fényvisszaverés, fénytörés stb. beállítása. Az anyagválasztás fő szempontja itt is a számítási teljesítményigény (pl. Phong kontra Goraud árnyalás - ld. irodalom [1], [2], [3]) és a látvány közötti kompromisszum megtalálása volt.
   A valóság érzetének mind tökéletesebb visszaadásához szükség van a modellek mozgatására vagy torzítására, melyre igencsak nagy hangsúlyt kell fektetni. A 3D Stuido MAX lehetőséget biztosit valódi fizikai rendszerek szimulációjára is. Így például lehetőség van arra, hogy figyelembe vegyünk olyan környezeti tényezők hatását is, mint a gravitáció, a szél vagy például testek egymással való ütközése. Ezenkívül mód van arra is, hogy képlettel megadjunk különböző paramétereket, és ezzel folytassuk a szimulációt. Ezáltal megvalósításra került többek között a mágneses erőtér valamint egy fogaskerekekből álló egyszerű mechanikai rendszer szimulációja is.
   Alkalmazásunk főhőse egy emberke, akinek mind kinézetét, mind pedig mozgáskultúráját nagy fejtörést okozott kidolgozni. Mivel egy ember mozgása igen összetett, nagyon sok szabadságfokkal rendelkezik, így szó sem lehetett hagyományos animálási technikák alkalmazásáról. Ezért fel kellett használni a Character Studio nevű programot, mely egyfajta kiegészítése (része) a 3D Studio MAX-nak. E rendszer lényege, hogy egy alaknak csupán a virtuális csontvázát mozgatjuk előre megszerkesztett vagy a valós életből felvett mozgásinformációkkal (esetleg ezek összevágásával), majd azt logikailag összekapcsoljuk az emberi test modelljével. Mi is mozgathatjuk a csontvázat, ekkor ugyan egy kicsit több dolgunk lesz, de ezt is megkönnyíti a jelen esetben alkalmazható inverz kinematika (ld. irodalom [2], [4]). Természetesen a csontváz az elkészült képen vagy videoklipen nem látszik, hiszen ez csak a mozgás kialakításához szükséges.
   Ahhoz, hogy az elkészült modellekből animáció kerekedjen, a tárgyak paramétereit és transzformációs mátrixait kellett időfüggővé tenni. Ennek elérésére több módszert is felhasználtunk. Az egyik és legtöbbet használt technika a keyframe animáció. Ennek lényege, hogy a modellek változtatandó paramétereit meghatározott időpontokban rögzítjük, a fennmaradó időpontokra pedig interpoláljuk azokat. Ez utóbbi művelet már a modellező program feladata, de természetesen ezt mi is befolyásolhatjuk. Egy másik animációs technika a path (útvonal) animáció, aminek lényege, hogy a testek mozgását előre definiált görbék segítségével írjuk le.
   A kész jelenetből ezután képeket készítünk, esetleg további effektekkel látjuk el (pl. csillogás, fénysugárzás stb.). Animáció esetén ezeket a képeket megfelelően megválasztott formátumú videoklipekké fűzzük össze, amik így már beilleszthetők a multimédiás programba.

3. Az általunk készített alkalmazás

3.1. Hardver- és szoftverigény

   Programunkat Microsoft Windows 9x/NT4/2000 környezetre terveztük, ahol különösebb telepítési procedúrák elvégzése nélkül futtatható. Minimális hardverigénye egy 200 MHz-es Intel Pentium MMX processzoros vagy azzal kompatíbilis PC minimum 32 MByte RAM-mal, 640x480 képpont felbontású legalább 16 bit színmélységet kezelni képes videó vezérlővel (24 bit színmélység - truecolor javasolt), CD-ROM meghajtóval (de futtathatjuk a programot merevlemezről is), hangkártyával (sztereó javasolt), egérrel. Szoftveres támogatást tekintve hasznosak lehetnek a DirectX kiegészítők, de mivel a program Windows NT alatt is kiválóan működik (sőt jobban, mint az inkább multimédiás használatra szánt Windows 95 - legalábbis néhány teszteredmény ezt mutatja), nem létfontosságúak. Viszont annál inkább szükséges a videoklipek lejátszásához egy bizonyos Codec, hiszen e nélkül az animációk egyike sem lesz látható. Ez pedig vagy a Main Concept MJPEG Codec (ld. web [10]) vagy a PIC-Video MJPEG Codec (ld. web [11]).

3.2. Leírás és kulisszatitkok

   Induláskor egy kezdő animációt (intro) láthatunk, ami után egy laboratóriumban találjuk magunkat. Itt egy tudós fogad bennünket - név szerint Mikro Professzor -, aki itt dolgozik a laborban. Az ő feladata lesz, hogy megismertessen minket a technika csodálatos vívmányával, a számítógéppel. Miután bemutatta munkahelyét, felkínálja, hogy előadja tematikusan összeállított tananyagát. Ha elfogadjuk, akkor sorban végigveszi a lehetséges témaköröket fűszerezve némi kommentárral. Ekkor csupán annyi dolgunk van, hogy figyeljünk, és végrehajtsuk azt, amire a professzor felszólít minket. El is utasíthatjuk azonban a segítségét, ekkor rajtunk múlik, hogy milyen sorrendben vesszük az egyes témaköröket. Ebben az esetben a professzor kissé háttérbe szorul, de bármikor kérhetjük a segítségét. Sőt, menet közben felkérhetjük arra is, hogy "vegye át a gyeplőt", vagy ha már ő kalauzolt minket, akkor hagyjon magunkra.
   A programban szereplő képeket és jeleneteket (a labor, a professzor, az egyes témakörökben bemutatandó számítógép-perifériák stb.) szinte kivétel nélkül a 3D Studio MAX-szal készítettünk. A képeket és animációkat, a felhangzó zenéket, zörejeket és szövegeket a "Director-motor" vezérli, melyet a saját belső nyelvén (Lingo) programoztunk fel.
   Minden témakör tartalmaz egy kisfilmet, mely az első lépés ahhoz, hogy egyáltalán elképzelhessünk egy-egy eszközt belülről vagy egy nem megközelíthető nézőpontból. A voltaképpen legtöbb energiát felemésztő munkafázis az egyes alkatrészek megfelelő részletességgel történő háromdimenziós lemodellezése volt. Ehhez nem egyszer szét kellett szerelni a szóban forgó eszközt, vagy ha ez nem volt lehetséges, megfelelő mennyiségű és minőségű irodalmat kellet róla felkutatni. Természetesen, a modellezés csak a működés megértéséhez szükséges részletességig történt meg. Nem egyszer pedig olyan látványbeli torzításokat, trükköket, hasonlatokat alkalmaztunk, amik messze elütnek a valóságtól, viszont könnyebbé teszik a magyarázat feldolgozását. Szintén nagy figyelmet igényelt a film jeleneteinek kidolgozása, a cselekmény megtervezése, majd azok hangosítása. A fent említett trükköknek szerves részét képezik azok a hangeffektusok, amik lehet ugyan, hogy a valóságban nem fordulnak elő, viszont nagyban segítenek a filmek élvezhetőségében de elsősorban érthetőségében. E filmek tárolására a Windows környezetben népszerű AVI fájlformátumot választottuk. Ez sajnos keresztbe tesz a program Apple gépekre való átírásának, de QuickTime formátum alkalmazásával ez a probléma már nem jelentkezne. Ezt azonban elvetettük, mert a fejlesztés során az AVI-val gördülékenyebben haladhattunk. Motion-JPEG kódolással megfelelő lejátszási képminőséget tudtunk elérni viszonylag kis processzor-igénnyel és jó tömörítési faktorral. Működőképességének biztosításához a fentebb már említett Codec-et telepíteni kell a rendszerre.
   A hangokról még nem esett szó. Azért kell róluk külön beszélni, mert tárolásuk és lejátszásuk is a képanyagtól függetlenül történik. Ennek oka, hogy terveink között áll a programot többnyelvűre elkészíteni. Ilyenkor pedig csak a hanganyagot kell átírni, majd megfelelő szinkronban lejátszani a képanyaggal. Szerencsére a Director nem csak a szabványos Windows-hangformátumot (WAV) tudja kezelni, hanem elboldogul a sokkal nagyobb tömörítési arányt nyújtani képes MPEG Layer-3 (röviden: MP3) típusú állományokkal is. Ezek hátránya viszont az, hogy lejátszásuk nagyobb számítási teljesítményt igényel, mint az egyszerű PCM-ben kódolt WAV-oké, viszont közel ugyanolyan minőség mellett jóval kevesebb helyet foglalnak el. Így vagy a processzort terheljük, vagy úgy állítjuk össze a programot, hogy ne valós időben játssza le az MP3-at, hanem lejátszás előtt "csomagolja ki" a memóriába. Ekkor viszont jelentősen megugrik a program memóriaigénye, a kicsomagolásra szánt időről már nem is beszélve. Így a hangok optimális rendszerezése és tárolása is nagy fejtörést okozott.
   Akinek a film nem nyújtott elegendő információt az éppen aktuális eszközről, az folytathatja annak megismerését egy kicsit részletesebb, bővebb és már sokkal reálisabb leírás átböngészésével. Az elsőre kissé száraznak tűnő szöveget képekkel is illusztráltuk. Itt olyan dolgokról esik szó, ami már több odafigyelést igényel, vagy ami már nem fért bele a kisfilmek által meghatározott "tananyagba". Ezáltal mindenki kiválaszthatja, hogy milyen részletességgel óhajt megismerkedni az aktuális perifériával. A szövegkijelzés szintén támogatja a többnyelvűséget, hiszen átálláskor itt sem kell mást tenni, mint a szöveg tartalmát kicserélni.
   Vállalkozó szellemű "játékosok" ki is próbálhatják az éppen vizsgált alkatrészt, vagy az annak működési alapját képező folyamatot. Ilyenkor megjelenik az eszköz egy részlete vagy egy lényeges részének sematikus ábrája, amit néhány gombbal vagy tolókával aktivizálhatunk. A program ilyenkor egyszerű bittérképeket, vagy Flash állományokat jelenít meg. Előbbieket a Director-motor segítségével vezérelhetjük, utóbbiak önállóan képesek kezelni az interaktivitást. (A Flash szintén a Macromedia fejlesztése, mellyel nagyfokú interaktivitással rendelkező kis helyigényű animációkat készíthetünk. Előnye, hogy állományai beágyazhatók egy Director generálta programba, így azok még kommunikálni is képesek lesznek egymással.) Lévén, hogy minden bemutatásra kerülő számítógép-periféria különböző, itt minden "applet-et" külön meg kell írni, nem nagyon van mód klisékkel dolgozni.
   Végül, ha valaki úgy érzi, hogy annyira ismeri már az eszközt, mint a saját tenyerét, próbára teheti tudását egy teszt által. Minden témakörben más és más kérdést tesz fel a program, melyre felkínál néhány válaszlehetőséget. A felhasználónak ezek közül kell kiválasztania a jó választ, amire pontokat kap. A "tanulás" befejeztével összesítésre kerül sor. Itt a program minden kérdéscsoportnál ugyanazokat az eljárásokat alkalmazza, csupán a kérdések és válaszok szövegét cserélgeti. Minden kérdésnél tárolva van a helyes válasz sorszáma, így azt csak össze kell hasonlítania a játékos által leütött válaszgomb sorszámával. Ez a programrész szintén teljes mértékben támogatja a többnyelvűség megvalósítását.

4. További tervek

   Jelen pillanatban a programnak egy nem teljesen működőképes verziója van megtekinthető állapotban. Azonban szándékunkban áll ezt a szorgalmi időszakon túl is továbbfejleszteni, aztán ha sikerül határidőre befejezni, benevezni egy a nyáron megrendezésre kerülő európai szintű multimédiás versenyre. Reméljük, sikerrel járunk, és kedvező színben képviselhetjük Egyetemünket e nem mindennapi eseményen. (Ez azóta már nem aktuális, hiszen a program elkészült, és be is lett nevezve a versenyre.)

Irodalom- és WEB-jegyzék

[1]   Dr. Szirmay-Kalos László: Számítógépes grafika http://www.iit.bme.hu/~szirmay
[2]   Aurum-Boca: 3D Studio MAX http://www.aurum.hu
[3]   Ted Boardman, Jeremy Hubbell: Inside 3D Studio MAX - volume II: Modeling and Materials
[4]   George Maestri, et al: Inside 3D Studio MAX - volume III: Animation
[5]   http://www.macromedia.com
[6]   http://www.shockwave.com
[7]   http://www.ktx.com
[8]   http://www.the3dstudio.com
[9]   http://www.3dcafe.com
[10]   http://www.mainconcept.com
[11]   http://www.jpg.com

BME-VIK, 2001. május

Lap tetejére
Előző
Következő

COLOR mixer - Additív és szubtraktív színkeverést bemutató program

Számítógépes Grafika és Animáció labor házi feladat
dokumentációja (részlet)

A programról általában

   
Alkalmazásommal az additív (RGB - fényszínekkel történő) és szubtraktív (CMY - festékszínekkel történő) színkeverési eljárások bemutatását és gyakorlását szeretném lehetővé tenni. A programban mindkét eljárással lehetőség nyílik az előállítható 1003 féle szín kikeverésére mind RGB, mind CMY komponensekből. A két eljárás között átjárásra is van mód. Magyarul, ha beállítottunk az egyik módszerrel egy színt, akkor megtekinthetjük, hogyan jön létre az a másik színrendszerben. Sőt, az is lehetséges, hogy mondjuk a CMY színkeverést az RGB komponensekkel vezéreljük, és fordítva.

A programról bővebben

   Az alkalmazás egy objektumorientált eseményvezérelt környezetben fut, melyet a fejlesztőrendszer (Macromedia - Director 8 Shockwave Studio) saját script-nyelvén (Lingo) tudunk programozni. Az objektumok az egyes képelemek (pl.: nyomógomb, tolóka, vezérlőpanel, vezérelt grafikák), amiket viselkedéssel (behavior) ruháztam fel. Ezek a viselkedések határozzák meg, hogy az objektum bizonyos eseményekre hogyan reagáljon. Ezek a reakciók (actions) eseményhívott függvények képében vannak definiálva.

A grafikáról bővebben

   A programban használt grafikák (a feliratok és a nyomógombok kivételével) a Kinetix - 3D Studio MAX nevű háromdimenziós modellező programmal, az utómunkálatok (feliratok generálása, képek méretre szabása) a Jasc - Paint Shop Pro nevű grafikai programmal készültek. A látványról:
   A vezérlőpanel és a tolókák mind egy-egy bittérkép. Utóbbiak érdekessége, hogy rendelkeznek árnyékkal, amit a kép átlátszóságával tudtam létrehozni. A Director pedig képes kezelni az alpha-channel-t, így azoknak megfelelően szűri össze az egymást takaró képrészleteket.
   A CMY-keverést bemutató kép tulajdonképpen több rétegből áll, a felhasználó ennek csak egy rétegét módosítja. Van egy passzív háttér, ami az asztalt és a tubusokat ábrázolja, erre kerül a festékpaca képe. Ez utóbbi is több rétegből áll össze: a színeket ábrázoló réteg árnyalások nélkül, az árnyékok és az árnyalásból eredő sötétedések, valamint a spekuláris csillanások. E három réteg együtt adja a festék teljes képét, de ebből kizárólag a szín-réteg vezérelhető. A tolókákkal tulajdonképpen e kép RGB komponenseit tudja befolyásolni a felhasználó. Eme képhármas megfelelően illesztve a háttérrel, adja vissza a megtévesztően valósághű látványt. Az RGB-keverés képe hasonló, csak egyszerűbb. Ott mindössze két rétegből áll a kép: a fénysugarak rétege (ezt vezéreljük), és a lámpák képe (ez statikus).

BME-VIK, 2001. május

Lap tetejére
Előző
Következő

Kameramozgatási technikák a vizuális hatások és utómunkálatok tükrében

Vizuális kommunikácó - média
házi dolgozat

   Tegyük fel, hogy készíteni akarunk egy filmet. Legyen az játékfilm, filmdráma, vígjáték, akciófilm vagy sci-fi, rengeteg olyan jelenettel fogunk találkozni, ahol főhősünk érzelmeit ki kell vetítenünk a nézőre. Ehhez elengedhetetlen a jó színészi játék, a hatásos zene, a megvilágítás, de ezek megvannak egy színházi előadáson is. Ami mégis mássá teszi a filmet az az, hogy a néző érzelmeit a látószög, a nézőpont, és ezek folyamatos változtatása által is befolyásolni tudjuk. Arról nem beszélve, hogy innentől kezdve trükköket is alkalmazhatunk, amikkel még elképesztőbb hatásokat gyakorolhatunk a vászon előtt ülőkre.

Leláncolva

   Képzeljünk el egy jelenetet, melyben egy tájkép látható hajnalban, vagy naplementekor. Semmi mesterséges zaj nem hallható, csupán az érintetlen természetet hallani. Természetes, hogy egy hirtelen változó jelenség megtörné a kép által sugárzott nyugalmat, tehát ezeket ki kell küszöbölni. Ezt a legegyszerűbben a kamera stabil állványra helyezésével, és lerögzítésével tehetjük meg. Az eredmény egy olyan kép, amiben minimális többletinformáció csak az idő elteltével keletkezhet. Például lassan besötétedik. Ha ennél többet akarunk közölni a nézővel - mondjuk bővebb leírást a tájról -, sajnos fel kell oldanunk kameránk rögzítő csavarjait, és szépen lassan körül kell vele tekinteni. Mivel helyet még mindig nem változtattunk, a nyugalom érzete továbbra is megmarad.
   Még bővebb képet adhatunk a tájról, ha több ilyen felvételt készítünk különböző nézőpontokból, majd ezeket lassan sorban átmossuk egymásba. Ez utóbbi azonban már vágói feladat, úgyhogy ennek részleteire nem térnék ki.
   A teljesen lerögzített kamera az utómunkálatok elkészítését is könnyebbé teszi. Vegyük azt a példát, amikor technikai vagy anyagi korlátaink nem engedik meg bizonyos díszletek életnagyságú felépítését. Ekkor szükség lehet makettek, grafikák, vagy számítógéppel generált modellek képeinek beillesztésére az eredeti jelenetbe. (A továbbiakban utómunkálatok alatt erre a műveletre gondolok.) Ehhez viszont tudnunk kell mindent az élő felvételről kezdve a táj méreteitől, a kamera pozícióján és beállításain át a fényviszonyokig, hogy akár műteremben, akár a virtuális szerkesztőkörnyezetben létrehozhassuk azt a világot, ami a valódi táj tökéletes reprodukciója, és azt a nézetet, amit annak filmezésekor használtunk.
   Ha a fent említett nyugodt tájra szeretnénk valamit rámontírozni, de forgattuk az állványon a kamerát, akkor természetesen a beillesztendő kép készítésekor is figyelembe kell venni a kamera minden apró mozdulatát. Mivel esetünkben ez szögelfordulás volt, csak ennek mértékét, esetleg időbeli változását kell feljegyezni.

Megmozdult!!!

   Tény, hogy a rögzített kamerával vajmi kevés gondunk van, hiszen alig kell bármihez is hozzányúlnunk, és az elkészített felvételen is könnyen elvégezhetjük az utómunkálatokat. A világ azonban sokkal izgalmasabb annál, hogy egyszerre csak egy arcát lássuk. A nézőpontok időbeli változtatgatása vagy a látószög növelése-csökkentése (zoom-olás) sem ad vissza annyi információt, mintha valamit folyamatosan változó irányból néznénk. Itt az ideje tehát, hogy megmozduljunk. Ennek következtében a néző elvesztheti a mozdulatlanság nyugalmát, de cserébe sokkal többet láthat az őt körülvevő világból. A kérdés már csak az, hogyan mozogjunk?

Zsinóron rángatva

   A filmkészítés hőskorában a kamerák még meglehetősen robosztus példányok voltak. A technika fejlődésével az emberiségnek rengeteg mindent sikerült összezsugorítania vagy kisebbre cserélnie - elősegítve így a mobilitást -, de sok esetben ezek nem tettek eleget a minőségi elvárásoknak. Így nem csoda, hogy a mozifilmek vagy stúdiófelvételek forgatásakor mégis inkább a sokkal precízebb, de nagyobb méretű kamerákat használják, amik néha elérik a 20-30 kilót is. Az pedig, ugye nem mindig várható el az operatőrtől, hogy ne csak figyeljen arra, amit vesz, hanem még cipekedjen is. A legegyszerűbb és legkézenfekvőbb megoldás az volt, hogy ha kereket szerelnek a kameraállványra, így az operatőrnek már csak tologatnivalója van. A filmeket viszont gyakran külső helyszíneken forgatják, ahol nincs mindig olyan sík járófelület, ahol a guruló állványt mozgatni lehetne. Egyértelmű tehát, hogy ez a megoldás csak speciális esetben alkalmazható. Azokon a helyszíneken, ahol nagyon göröngyös a talaj, sínpályákat építenek ki. Erre a sínre helyezik azt a kocsit, amire nemcsak a kameraállvány van felszerelve, hanem az operatőrnek is biztosított a hely. Így ő csak a felvétellel van elfoglalva, a kocsit pedig a stáb többi tagja tolja. Külön érdekesség, hogy az ilyen állványokon a kamera nemcsak vízszintes, hanem - korlátozottabb mértékű -függőleges irányú mozgatására is lehetőség van.
   Egy ilyen képességekkel felruházott kamerával már jóval több érzelmi hatást tudunk közvetíteni, és a vizuális effektusok terén is több lehetőségünk nyílik. Ha egy helyszínt bejárunk, tehát bemutatjuk a nézőnek, még nyugodt körülmények között is azt az érzetet kelthetjük, hogy valami éppen történik vagy nemsokára történni fog. Egy szereplőre való lassú vagy hirtelen közelítéssel feszültebb hangulatot teremthetünk. Akárhogy is, a kamera egy már ismert útvonalon mozog, de legalábbis olyan korlátok között, amiket figyelni, mérni és így rekonstruálni tudunk. Ennek pedig az utómunkálatok készítésekor van nagy jelentősége.
   Sokkal kevesebbet kell mérni, ha nem engedjük meg az operatőrnek, hogy szabadon mozgathassa a kamerát. De ha ő nem mozgatja, akkor ki? A kérdés pontosabban: mi. Két legyet üthetünk egy csapásra, ha egy számítógéppel vezérelt daruállványra szereljük a kamerát. Így megnő a mozgásterünk, és a kamerát is egy előre megtervezett pályán mozgathatjuk. Előnye az előre ismert mozgáspálya, hátránya az útvonalhoz való kötöttség. Ha mégis interaktívvá szeretnénk tenni a mozgást, úgy elegendő a kezelőszerveket figyelni, és nem kell érzékelőkkel teleaggatni az állványt.

Megszabadulva a béklyóktól

   Hihetetlenül megnő a mozgásterünk, ha egyszerűen kézbe vesszük kameránkat (nagyobb darab esetén vállunkra emeljük) és úgy forgatunk. Ilyenkor azonban megszűnik alattunk minden stabil pont, és ha nem vagyunk elég ügyesek, a felvétel zavaróan billegő és mozgó lesz. Na jó, de hát erre találták ki az állványokat, akkor mégis miért így dolgozunk? Ilyen kameramozgatást jobbára csak akkor alkalmaznak, amikor valami egészen feszült hangulatú jelenetet készítenek. Például együtt szaladunk a főhőssel az üldözői elől. Ezzel egyértelműen bevontuk a nézőt is a jelenetbe, hiszen ő is egy futó vagy legalábbis nem egészen kiegyensúlyozott ember szemével látja a környezetet. Megfelelő zenei aláfestéssel egy nagyon izgalmas jelenetet kaphatunk.
   A hatást elértük, csak hát az utómunkálatok terén merülnek fel majd gondok. Az ilyen jelenetekhez lehet a legnehezebben hozzáadni még több varázst. Ekkor a kamerán rögzített kép teljesen szabálytalanul és meglehetősen gyorsan mozog, követni csak akkor tudnánk, ha pontosan ismernénk a kamera által bejárt utat, annak minden bukkanójával. Ez pedig nem határozható meg előre, hiszen minden mozgást az operatőr végez teljesen kötetlenül. Akkor hát nincs megoldás? Természetesen van, de arról majd kicsit később. Nézzük inkább azt az esetet, amikor ismét szabadon mozoghatunk, azonban a kamera mégis mintha sínen gurulna. Sín pedig sehol...

Kolumbusz tojása

   Mint általában minden bonyolult problémát, ezt is egy pofon egyszerű megoldással orvosolták. A szabadkézi felvételekkor a rángató, billegő hatást a kamera különböző irányú sokszori, kis mértékű, de hirtelen elforgatása eredményezi. Ez attól van, hogy az operatőr a kamerát egy, a tömegközéppontjától jóval távolabb lévő külső ponton fogja, így egy véletlen kis erő is elég ahhoz, hogy az hirtelen elbillenjen vagy elforduljon. Ezen erők hatása csökkenthető, ha a kamerát minél közelebb a tömegközéppontjához fogjuk meg, ami viszont sajnos a szerkezet belsejében van, így nem hozzáférhető. Nosza csalogassuk ki! Képzeljünk el egy súlyzót! Ennek ugyebár a tömegközéppontja a rúd felénél található. Cseréljük le az egyik felén a nehezéket a kamerára, a másik felére pedig egy kamerával azonos súlyt állítsunk be! És már ott is van a rúd felénél a hőn áhított tömegközéppont, amit megragadva nehezebben tudunk billegetni. Óriási előnye, hogy nagymértékben megnöveli a kamera stabilitását, és mégsem vagyunk odakötve semmihez. Hátránya viszont, hogy felvétel közben nem emelhetjük a fejünkhöz, hiszen tőlünk már-már teljesen függetlenül mozog. Erre is találtak megoldást. A szerkezet egyik végére egy kisebb képernyőt szereltek, amin az operatőr végig figyelemmel kísérheti a kamera által vett képet.
   Ez a megoldás a sínen való mozgás biztonságát ötvözi a kézi mozgatás változatosságával. Oda megyünk, ahova akarunk úgy, hogy az operatőrnek "már nem remeg a keze". Ugyan jelen esetben még mindig az a gondunk, hogy nem ismerjük a kamera mozgását, de legalább a hirtelen mozdulatok okozta elmosódottságot sikerült kiküszöbölni, így legalább már ez nem nehezíti az utómunkálatok elvégzését. A kérdés már csak az, honnan fogjuk megtudni, merre járt a kamera.
   A megoldás precíz és odaadó munkát igényel, de az eredmény egy felülmúlhatatlanul érdekes és látványos jelenettel tesz minket gazdagabbá. Mielőtt bármibe is belekezdenénk, a legaprólékosabban fel kell mérni a forgatás helyszínét, ahol referenciapontokat kell elhelyeznünk. Ezek a pontok lehetnek bármilyen könnyen észrevehető pontszerű tárgyak (pl. golflabdák), amiket aztán a felvett anyagról könnyen kiretusálhatunk. Az elhelyezésnél csak arra kell figyelnünk, hogy a kamerával végighaladva mindig kerüljön a képbe 4-5-6 vagy több darab (ez a feldolgozó számítógépes programtól függ). Ezeknek a pontoknak fel kell jegyezni az egymáshoz és a környezethez képesti elhelyezkedését, majd az így kialakított helyszínt reprodukálni kell az erre szánt virtuális műteremben. A forgatás befejeztével a felvett anyagban azonosítani kell a képen látható referenciapontokat, így a program azok térbeli elhelyezkedéséből ki tudja számolja a kamera minden időpontbeli pozícióját. Ezzel megkapjuk a kamera mozgásának teljes leírását.

Derült égből villámcsapás...

   ...mondjuk, amikor valami egészen váratlan dolog történik. Hogyan tudnánk szereplőink döbbenetét érzékeltetni szöveg nélkül és nem csak a zenére hagyatkozva. Gondoljunk bele, mit éreznénk, amikor valami hatalmas csalódás érne minket! Többen úgy éreznék, hogy most itt a vég, a világ kivet magából vagy elrobog előlem. Vagy egyszerűen elkezd forogni iszonyatos sebességgel, és mi nem tudjuk követni. Akármelyiket is választjuk, egy rendkívül hatásos módszert találtak ki ennek érzékeltetésére. A képen a szereplőt látjuk, aki egyhelyben áll, majd a háttér egyre gyorsabban elkezd távolodni (vagy közeledni, ez tőlünk függ). Hogy lehetséges ez például akkor, amikor a díszlet egy élő és létező város? A válasz szintén elég egyszerű. Vegyük a háttér távolodásának esetét. Kezdetben a kamera megfelelően nagy távolságra van a szereplőtől, majd elkezd közeledni. Eközben az operatőr növeli a látószöget is, hogy a szereplő a képen ugyanakkorának látsszon. Ennek következtében viszont egyre többet látni a háttérből, ami annak távolodásaként hat. Ez a művelet visszafelé is működik, hogy melyiket használjuk, csak rajtunk múlik.

A méret a lényeg

   Előfordulhat, hogy filmünk szereplői között megbújik néhány óriás, titán, vagy más hatalmas egyed, esetleg a felhasznált makettek, modellek azok, amiket nagyobbnak kell bemutatni. Akárki beláthatja, hogy a nagyobb mérettel nő a testek tehetetlensége, és kissé lomhábbaknak is tűnnek. Legyenek azok élőlények vagy tárgyak, ha kicsit lelassítjuk mozgásukat, a megfelelő nézőpont megválasztásával kiváló hatást érhetünk el. Ezt hogyan tegyük? Nem lehet "egyszerűen" lelassítani a filmet, hiszen akkor olyan lenne, mint egy sportközvetítés eseményének visszajátszása. A lassított film képváltási sebességének meg kell egyeznie a film többi jelenetének képváltási sebességével (ez általában 24, 25, 30 kép másodpercenként). A megoldás tehát az, ha az ominózus jelenetet egy nagyobb sebességű kamerával forgatjuk, ami ugyanannyi idő alatt több képkockát rögzít, mint a hagyományos kamerák (pl. 70 kép másodpercenként). Ezt a felvételt lelassítjuk a hagyományos sebességre, így beilleszthető a többi jelenet közé.

Megáll az idő

   Mint azt már fentebb beláttuk, a részletek akkor tűnnek elő igazán, amikor valamit mozgó kamerából filmezünk. Ha emellett sikerül azt a valamit teljesen mozdulatlanná is varázsolni, fantasztikus látvány tárul elénk. Képzeljük csak el: bedobunk valamit egy medencébe, és a kifröccsenő víz egyszer csak megáll a levegőben. Mi pedig betekinthetünk a legapróbb részletekbe is. Hogyan? Természetesen ez sem ördöngösség, inkább aprólékos és precíz munka.
   Lássuk az előkészületeket! Tervezzük meg, hogy a "lefagyasztás" megtörténtekor milyen úton mozogjon a kamera. Ne nagyon legyen bonyolult a pálya, egy egyszerű körüljárás is kellő hatást tud előidézni. Mivel az idő "megáll", a kamera mozgásának időtartama nulla. Ez viszont azt jelentené, hogy bármekkora utat is járunk be, a kamera sebessége végtelen. Ha ezt valóban teljesíteni szeretnénk (ami amúgy sem sikerülne), eszeveszett tempóban kéne mozgatni a kamerát, ami viszont a kép elmosódásával járhat. Vegyük át még egyszer! A feladat tehát az, hogy nulla időtartam alatt, tehát egyazon pillanatban kell rögzíteni a kamera pályáján az összes odaeső képkockát. Meg kell tehát határozni, hogy hány képkocka készülne el a felvétel alatt, és azok a pálya mely részéről nézve készülnének. Ezekbe a pozíciókba - kamera helyett - fényképezőgépeket kell elhelyezni, melyek mindegyike abba az irányba kell hogy nézzen, amerre a kamera nézne azon a helyen. Kezdjük hát el a forgatást! Tulajdonképpen ez csak annyiból fog állni, hogy abban a pillanatban, amikor "megállítjuk az időt", egyszerre elsütjük az összes fényképezőgépet. Ezután nincs más dolgunk, mint az így elkészült képkockákat összefűzzük egy filmmé.

   Az élet azonban nem áll meg. Idővel újabb és újabb módszereket dolgoznak ki a filmkészítés mágusai, hogy meghassák, megijesszék, megnevettessék vagy elképesszék a moziba járókat. Csak bírjuk őket követni!

BME-VIK, 2000. december

Lap tetejére
Előző
Következő

A Budapesti Műszaki és Gazdaságtudományi Egyetem interaktív internetes térképe

Internet elemei és hozzáférései
házi feladat dokumentációja

   Aki járt már a Budapesti Műszaki és Gazdaságtudományi Egyetem területén, tapasztalhatta, hogy a hatalmas területen elhelyezkedő épületek között nem nehéz eltévedni. Az ifjú gólyáknak megkönnyítik a helyzetét a dékáni hivatalok által kiadott térképek. Azonban elég sokszor kerülnek megrendezésre előadások nem egyetemi polgárok részére is, akiknek így sokkal nehezebb dolga van. Házi feladatommal rajtuk és a hozzájuk hasonló kevesebb helyismerettel rendelkező vendégen szeretnék segíteni.
   Egy épület felkereséséhez nem kell mást tenni, mint leülni egy internetkapcsolattal rendelkező számítógép elé és meglátogatni az interaktív BME térkép honlapját. Itt nemcsak az épületek hollétéről kaphatunk információt, hanem arról is, hogy milyen tömegközlekedési járművekkel lehet megközelíteni őket, melyikben van nyilvános telefon, bankautomata vagy működik büfé, fénymásoló.

A térkép működéséről bővebben

   Maga a program egy HTML nyelven megírt honlapba ágyazott (660x360 képpont területen elhelyezkedő) Macromedia Flash (4-es verzió) animáció. Előnye, hogy a nagyfokú interaktivitással tarkított rajzokat és animációkat vektorgrafikusan lehet benne létrehozni, így igen látványos elemeket tudunk tárolni egy megfelelően kis méretű fájlban.
   A program egy kezdő animációval nyit, mely után a TOVÁBB gombra kattintva feltűnik előttünk Budapest térképének egy részlete az egyetem főbb épületeivel, mely fölött egy munkalap helyezkedik el a kezelőszervekkel. Legfelül egy gombsort láthatunk az egyes épületek betűjelöléseivel. Mivel nem fért ki minden épület, kollégium és étterem neve egy képernyőnyi területen, a gombsor továbbgörgetéséhez kattintsunk a munkalap jobb alsó szélén lévő nyíl alakú gombra! (Visszagörgetéshez a gombot a bal szélen keressük!) Ha rákattintunk valamelyik épület nevét ábrázoló gombra, a keresett épület körül egy fekete, egyre szűkülő körvonal rajzolódik ki.
   A gombsor alatt további lehetőségeket találunk az épületek kijelölésére különböző kategóriák alapján. Mindjárt az első, a kijelölés megszüntetésére szolgál. A többi, balról-jobbra a következő: fénymásoltatás lehetőségét, nyilvános telefont, bankautomatát, büfét rejtő épületek megjelölése, a buszvonalak, villamosvonalak valamint utcanevek kijelzése vagy eltüntetése.
   Ha az egérmutatót az épületek fölé visszük (amik valójában aktív gombok), láthatóvá válik az aktuális épület neve. Amikor pedig rákattintunk egy épületre, olyan érzésünk lesz, mintha a nagy magasságból leereszkednénk az épület fölé, azután pedig megjelennek az épület adatai. Ezzel egy időben újabb gombok jelennek meg a munkalapon (a térkép mozgatására való nyilak, az adatlap eltüntetését valamint az épületektől való eltávolodást előidéző gomb), míg néhány eltűnik. Ha a munkalap legszélén lévő jobboldali gombot megnyomjuk, visszatérünk az eredeti madártávlatba, innen elölről kezdhetünk mindent.

   A program úgy lett elkészítve, hogy lehetőleg bárki képes legyen kezelni. A funkcióval rendelkező gombok sematikus ábrákból állnak, melyek mellett segítő szöveg jelenik meg, ha az egérmutatót a gomb fölé toljuk. Ez az épületeknél kissé más, ahol nem a gomb jelentése, hanem az épület neve jelenik meg a segédszövegek megszokott formájától eltérően.

Tippek és trükkök

   Ha a program egy képrészletét jobban szemügyre kívánjuk venni, ki akarjuk nagyítani, akkor kattintsunk rá a képrészletre a jobb egérgombbal. Egy helyi menü tűnik fel, ahol a "Zoom in" parancsot kiválasztva, erősebb nagyításban láthatjuk a képet. Visszaállítása a "Show all" vagy "100%" paranccsal. A közelítés nem megy a végtelenségig. A program csak egy bizonyos maximális nagyítást engedélyez.
   Ha gépünk teljesítménye nem elegendő az animációk megfelelő sebességgel való lejátszásához, a megjelenítés minőségének redukálásával orvosolható a probléma. Alapesetben a program maximális minőségben rajzol. Ezt visszavehetjük a fent említett helyi menü "Quality > Medium" vagy "Quality > Low" parancs aktivizálásával. Előbbi kisebb mértékben, utóbbi teljesen visszavesz a megjelenítés minőségéből.

   Ezeken kívül sok más egyéb is elérhető ebből a menüből, de ezen részletekre már nem térnék ki.

BME-VIK, 2000. december

Lap tetejére
Előző
Következő

A három dimenziós és sztereoszkópikus képek megjelenítésének módszerei és lehetőségei

Híradástechnika házi dolgozat

   Írásommal be kívánom mutatni a három dimenziós látás és képalkotás lehetőségeit, módszereit és eszközeit, kezdve a látással kapcsolatos alapfogalmak körülírásával. Mindezt a hétköznapi ember számára is érthető módon a túlzott részletesség mellőzésével.

1. Alapfogalmak

1.1. A látás mikéntje

   Egyik elsődleges érzékszervünk a szemünk, mellyel a környezetünkből érkező fényeket érzékeljük. Ezek lehetnek kibocsátott (emittált), vagy a különböző tárgyakról visszavert (reflektált) fények. A fénysugarak a pupillán át, a szemlencsén keresztül jutnak be szemgolyónkba, melynek hátsó részén lévő retinahártyára vetítődnek. A retinán lévő látóidegsejtek (csapok és pálcikák) a fényhullámoknak megfelelő információkat az agyba küldik. A látott képet már agyunk képezi le és értelmezi.
   Mint minden érzékelő, látóidegeink is csak bizonyos fényeket képes érzékelni. Ezeket mi, hétköznapi emberek két tulajdonsággal jellemezhetjük: a fény erősségével (a fény, mint elektromágneses hullám intenzitása) és színével (frekvenciája). A túlságosan kis intenzitású fényeket a szem nem, vagy csak kis mértékben képes érzékelni, míg a túlságosan nagy intenzitású fényekkel szemben a pupilla összeszűkülésével "védekezik". A színek terén nincs ilyen alkalmazkodó képességünk: a látható fényeket látjuk, ezen frekvencia tartományon kívül eső fényeket nem.
   A retinára vetített képek a környező világ különböző térbeli pontjaiból érkező fénysugarak összességeként áll elő. Ahhoz, hogy egy tárgyat vagy más alakzatot fel tudjunk ismerni, nem elég egy elemi fénysugár (vegyük ezt annak, amekkora egy látóidegsejt felülete), hanem egy kicsit nagyobb, mondjuk akkora, amekkora több idegsejt együttes felülete. Ebből adódik az emberi szem felbontóképessége, ami két, még megkülönböztethető pontból a szemlencsén át húzott egyenesek által közrezárt szög. Ez egy dimenzióban kb. 2' (fokperc). Tehát ahhoz, hogy a közeli és a távoli képek retinára eső vetülete egyaránt éles kép legyen, megfelelően kell a fénysugarakat fókuszálni. Ezt a feladatot a szemlencse végzi el.

1.2. Távolságok érzékelése és reprodukálása két dimenzióban

   A térlátás alapvető feltétele, hogy érezzük a környezetünkben elhelyezkedő tárgyak egymáshoz és hozzánk képesti távolságát. Ennek egyik módja a különböző távolságokból érkező képek fókuszálása a szemlencse által. Ha ránézünk egy tárgyra (próbáljuk ki fél (!) szemmel), akkor az a mögötti és az előtti tárgyakat már homályosan látjuk. Ugyanez a helyzet, ha például egy állítható fókuszú fényképezőgéppel vagy kamerával akarunk felvételt készíteni.
   Abban az esetben, ha nem tudunk (vagy nem akarunk) olyan felvételt készíteni, ami "homályosodás-képes" (pl. kezdetleges három dimenziós számítógépes modellező programok esetében), a távolság érzékeltetésének egyetlen módja az, hogy a perspektivikus (távlati) ábrázolás szabályait betartjuk. Ilyen képek születnek, ha például egy ún. szabad fókuszos (free-focus) fényképezőgéppel készítünk képet. Ezeknél a gépeknél semmit nem kell beállítani, a lencse kialakítása és jellemzői olyanok, hogy bármilyen távol lévő objektum képe elfogadható élességű.

1.3. Távolságok érzékelése és reprodukálása kétszer két dimenzióban

   Az előzőekben arról volt szó, hogy milyen lehetőségünk van akkor, ha csak egyik szemünkkel vizsgálódunk. De ugyebár az embernek két szeme van, így sokkal több és jobb lehetősége van arra, hogy érzékelje a térbeliséget. Ez abban nyilvánul meg, hogy a vizsgált tárgyat nem egy, hanem mindjárt két oldalról nézheti meg. Két szemünk középpontjai átlagosan 6 cm-re vannak egymástól, így a nem túlságosan messze lévő tárgyakat érezhetően különböző szögből látják. Ez annyiban javítja térlátásunk lehetőségeit, hogy két szemünk tengelyének összetartásából is már következtethetünk a nézett objektum többihez viszonyított távolságára. Egy közelben lévő pontot nézve a két szemtengely által bezárt szög nagyobb, mint egy távoli pont esetében. Szemünk ezen tulajdonságát használják ki az ikerkamerával felvett háromdimenziós filmek valamint a sztereoszkópikus képek, és ez az, ami hiányzik a normál kamerával vagy fényképezőgéppel készített felvételekből.

2. A három dimenziós megjelenítés módszere

   Mind a fénykép, mind a videó felvétel a valós világ egy bizonyos nézőpontból vett kétdimenziós vetülete, tehát a rögzített kép egy sík lapon helyezkedik el. Éppen ezért a térhatás érzékeltetése e két módszerrel nem, vagy csak különleges eszközök segítségével (és még így sem tökéletesen) lehetséges. Van viszont egy eljárás, ami ugyan picit bonyolultabb elméleti és technológiai alapokra épül, mint a fotográfia, de igen-igen pontosan és valósághűen örökíti meg a három dimenziós világ képét: a holográfia.

   A holográfiát Gábor Dénes magyar származású, Angliában élő fizikus dolgozta ki 1948-ban. E kép-rögzítési technika neve a görög "holosz" és "graphosz" szavakból lett összeállítva, jelentése "teljes üzenet / teljes kép", mert az így előállított kép a tárgyat teljes térbeliségében, a tárgyról szóródó fényt pedig összes infor-mációjával együtt rögzíti.
   Az eljárás alapja a fény hullámtermészete, melynél így - mint minden más hullámtermészetű jelenségnél (hanghullámnál, vízhullámnál stb.) - szintén megfigyelhetőek az ún. interferencia jelenségek. Ezekről akkor beszélünk, amikor két hullám találkozásukkor (szuperponálódnak = összeadódnak) erősítik vagy gyengítik egymás hatását. A kioltás víz esetén sima vízfelszínnel (pillanatnyi csendesebb hullámzás), hang esetén csönddel (halkulással), fény esetén sötét folttal (kisebb fénnyel) jár. Nem tökéletes kioltás esetén tapasztalhatunk fennmaradó hullámokat (kissé rojtos vízfelszínt, halk zajt, enyhe pislákolást). Ezek akkor jelentkeznek, ha nem teljesen tiszta, nem homogén vagy zajos (a szóban forgó két hullámon kívül más hullámok is jelen vannak) a közeg. A napfény például ilyen: majdnem minden hullámhosszú komponens megtalálható benne. Hologram készítésekor viszont egy interferenciaképet rögzítünk, melyet természetes fénnyel meglehetősen nehéz elkészíteni. Valahogy tehát elő kellett állítani egy homogén, erős, tiszta, monokromatikus (egyszínű, csak egy hullámhosszú komponenst tartalmazó) fényt. Erre 1960-ban került sor, mikor Theodore H. Maiman amerikai fizikus feltalálta a lézert (Light Amplification by Stimulated Emission of Radiation), aminek működési elvét most nem részletezem.
   Maga a hologram készítésének elve egyszerű, realizálása viszont rettentően precíz munkát igényel. Mindenek előtt szükségünk van egy teljesen elsötétíthető műteremre, hogy minden zavaró fényforrást kizárjunk. Mivel egy interferenciaképet akarunk rögzíteni (ami fény esetében egy mikroszkópikus méretű foltokból álló minta), munka-asztalunkat úgy kell elkészítenünk, hogy az teljességgel rezgésmentes legyen. Szükségünk lesz egy lézer-fényforrásra, egy fotólemezre (ez fogja megörökíteni a hologramunkat), néhány speciálisan kiképezett tükörre és lencsére (ezeket rendkívül stabilan kell rögzítenünk), és végül a megörökí-tendő tárgyra. Ez utóbbit úgy kell elhelyeznünk, hogy a lézer-fény őt is és a fotólemezt is megvilágítsa, és a fotólemezre a tárgyról szóródó fények is eljussanak. Ezt több féle beállítással lehet elérni:

Az egysugaras transzmissziós (a) és reflexiós (b) hologram elkészítésének beállítása
1. ábra: Az egysugaras transzmissziós (a) és reflexiós (b) hologram elkészítésének beállítása

Természetesen felmerülhet a kérdés, hogy ha a tárgyról szóródó fények és a referencia fény ugyanabból az irányból érkezik a fotólemezre, akkor jól fog-e látszani a tárgy a hologramon. Nos az efféle problémák orvoslására kitalálták azt, hogy a referenciasugarat kettéosztva két különböző irányú, de teljesen azonos tulajdonságú fénnyel világítjuk meg a tárgyat és a fotólemezt. Az ábrákon látható beállítások között az a különbség, hogy a képek előcsalogatásakor az egyik esetben a fotólemezt mögüle (transzmissziós), a másik esetben a nézőpont oldaláról (reflexiós) kell megvilágítani. A transzmissziós onnan kapta a nevét, hogy a rekonstruáló nyaláb (ez lézer kell hogy legyen) átmegy a fotólemezen, a reflexiós esetben pedig visszaverődik róla (itt természetes fény mellett is meg lehet nézni). Mindkét esetben a rekonstruáló fény az elkészült hologramon - mint optikai rácson - megtörik, szóródik.
   De hol látjuk ezeket a 3D-s képeket? Tényleg kilépnek a síkból? Nos a válasz igen is meg nem is. A képek a rekonstruáláskor lehetnek látszólagosak és valóságosak. Az igaz, hogy mindkét esetben érzékelhető a térhatás, tehát kilépnek a síkból. A különbség csak az, hogy a látszólagos esetben a kép a film síkja mögött (mint ahogy magunkat látjuk reggelente a tükörben), valóságos esetben a film és közöttünk lebeg a semmiben. De amikor azt mondjuk, hogy kilép a síkból, nem arra kell gondolni, hogy a kép mint egy valódi tárgy mindenki számára látható módon egy meghatározható helyen lebeg. A tárgy képe mindig szubjektív; csak akkor látható, ha a filmet is teljes szélességében valamint a megfelelő oldaláról látjuk. (Tehát a filmet az éle felől nézve semmit nem látunk a hologramból.) A képek elhelyezkedése valami ilyesmi érzetet kelthet a megfigyelőben:

Transzmissziós hologram látszólagos (a), transzmissziós hologram valódi (b) és reflexiós hologram látszólagos képe (c)
2. ábra: Transzmissziós hologram látszólagos (a), transzmissziós hologram valódi (b) és reflexiós hologram látszólagos képe (c)

   A holográfiával tehát egy teljes mértékben három dimenziós képmegjelenítési módszert ismertünk meg. Egy ily módon létrehozott képen a megfigyelő arra a térbeli pontra fókuszál rá, tehát azt a pontot látja élesen, amelyiket akarja. A továbbiakban ismertetendő eljárásokban erre nincs lehetőség, mert a látott képek rögzített távolságban vannak tőlünk.

3. A térhatás érzékeltetése kétdimenziós képekkel I.

   Ebben a részben tehát egy kétdimenziós képen kíséreljük meg érzékeltetni a különböző objektumok távolságát. Viszont egy ilyen kép minden pontja adott (és majdnem egyenlő) távolságra van tőlünk. Így tehát nem marad más hátra, a különböző távolságokat csak a két szemtengely közt bezárt szög változtatásával tudjuk érzékeltetni. Ez viszont csak úgy valósítható meg, hogy ha a két szem két különböző képet lát, méghozzá olyanokat, amik az ábrázolandó tárgy(ak)ról a szemgolyóknak megfelelő irányból készültek. Ezeket a képeket a legtöbb esetben ikerkamerákkal veszik fel, vagy 3D-s szerkesztőprogramoknál két irányból renderelik le a modellt.

3.1. A képek célba vetítése

   A legegyszerűbb megoldás, ha a két képet rendre a szemgolyók elé helyezzük úgy, hogy a jobb szem nézze a jobb képet, a bal a bal képet. Ehhez viszont szükséges a képek oly kicsi mérete, hogy elférjenek egymás mellett. A kis képek azonban kevésbé látszanak kényelmes olvasási (kb. fél méter) távolságból. Akkor tegyük őket olyan közel a szemhez, hogy kivehető méretű legyen rajta minden. Ekkor viszont már a szemlencse nem képes a képekre ráfókuszálni, vagy szemünket kell nagyon megerőltetni, ami huzamosabb ideig egészségtelen. Ilyenkor van szükség egy optikára, mely a közvetlenül a szem előtt elhelyezkedő képeket megfelelően a szemgolyóra vetíti. Ilyen módon működnek például a számítógépekhez kapható "virtuális valóság" szemüvegek, melyekben a lencse helyén kis (pár cm2 felületű) folyadékkristályos kijelzők vannak. A két kijelző azt a képet adja vissza, amit a felhasználó a monitoron látna, azzal a különbséggel, hogy itt a két szem által látott kép külön készül el. Előnyük, hogy mobilak (igaz korlátozottan, de lehet velük mozogni) és csak programozás kérdése a három dimenziós képszerkesztés megvalósítása. Hátránya viszont a nem túl jó felbontása, ami azonban a technika rohamos fejlődésével megoldódhat.
   Ha csak egy felületen tudjuk a képeket megjeleníteni (ez lehet egy papírlap vagy televízió, számítógép képernyője), akkor egy másik optikára van szükségünk, amely a két képet a megfelelő szembe vetíti. Erre a célra megfelelő eszköz lehet egy rendkívül egyszerű tükörrendszer, mely a 3. ábrán látható:

Célba vetítő tükörrendszer
3. ábra: Célba vetítő tükörrendszer

Ha a két kép túl nagy, nem biztos, hogy elfér egymás mellett úgy, hogy a képeken lévő azonosnak ítélt pontok szemgolyó-távolságra legyenek egymástól. Ezért ezeket a pontokat (a két képet) e tükrük segítségével a szem által kényelmesen látható távolságra hozzuk. E módszernek hátránya, ha például egy monitor vagy TV a megjelenítő, akkor a két képet csak úgy tudjuk kirajzolni, hogy a képernyőt félbevágjuk. Ekkor viszont egy (általában) 4:3 oldalarányú képen (a képernyőn) két darab 2:3 arányú képet tudunk csak elhelyezni, ami nem a megszokott oldalarány, így zavaró lehet. Ha azonban ragaszkodunk a 4:3-as arányhoz képeink külön-külön a megjelenítő képernyő területének negyedei lennének, ami igen nagy veszteség.    Ugyanez a megoldás használható, ha a "virtuális valóság" szemüveghez hasonlóan több megjelenítőnk van (két papír vagy két képernyő), de ezek mérete és/vagy távolsága túl nagy ahhoz, hogy a szem számára kényelmesen közelre tehessük őket egymáshoz. Ekkor szintén megoldást jelenthet a fent bemutatott tükörrendszer. Előnye, hogy a felbontása csak a képet előállító forrástól függ (ez papírkép vagy képernyő esetén éppen megfelelő), viszont sokkal érzékenyebb a mozgásra. Itt ugyanis a szerkezetet mindig pontosan a képek és a szemgolyók között kell tartani.

3.2. A megfelelő képek kiszűrése

   Ahhoz, hogy igazán jó minőségű térhatást tudjunk elérni, megfelelően nagy felületen és nagy felbontásban kell tudnunk képeinket ábrázolni. Mondjuk a mozi-minőség éppen optimális lenne. Igen ám, de elég bonyolult lenne a két szemnek külön-külön egy mozivászonnyi területet fenntartani. Ekkor jelenthet megoldást az a eljárás, amikor a képeket egy felületre vetítjük, majd utólag minden nézőnél (itt már lehetnek többen is) egy egyszerű optikával szelektáljuk a képeket.
   Mozikban bevett szokás a fény - szintén hullámtermészetéből adódó tulajdonságának - a polarizálhatóságnak a kihasználása. Ez azt jelenti, hogy az ikerkamerákkal felvett filmanyagokat külön vetítőgéppel vetítik ugyanarra a vászonra. A két vetítőgép elé behelyeznek egy-egy polárszűrőt, amik a két fénysugarat egymáshoz képest merőleges rezgéssíkban engedik át. Tehát, ha az egyik kép függőlegesen polarizált (csak a függőleges irányban rezgő fényhullámok haladhatnak tovább), akkor a másik vízszintesen. Ekkor a vásznon egy olyan látvány fogadja a nézőt, mintha két képet egymásra vetítettek volna. (Ez így is van, de szabad szemmel nem lehet észrevenni a polarizációbeli különbözőséget.) Most már csak egy kis kiegészítésre van szükség: egy szemüveg, aminek két lencséje helyén a vetítők előttivel egyenként azonos irányban polarizáló szűrő van befogva. Így az egyik szem (a fenti példából kiindulva) a függőlegesen, a másik a vízszintesen polarizált képet látja.
   Egy másik megoldás színek szerint bontja szét a két képet. Annyiban egyszerűbb a dolgunk, hogy nem kell a polarizáció beállításával bajlódni, viszont így sokkal gyengébb minőségű képeket hozhatunk létre. Ebben az eljárásban általában a vöröst és a türkizt választják alapszíneknek, mert egymás kiegészítőszínei (a fehér fényből kivonva a vöröset türkizt kapunk), és azonos sugárzási teljesítménynél e két színnek közel azonos a láthatósága. (Ugyanez például nem működik a sárga és a kék színekkel. Egymást ugyan kiegészítik, de messze nem egyenlő a láthatóságuk.) A szétválasztandó képet most majdnem úgy kell elkészítenünk, mint az előző esetben (egymásra vetítve), azzal a különbséggel, hogy a (mondjuk) bal oldalról készült képet vörössel, a jobb oldalról készült képet türkizzel rajzoljuk ki. A közös tartományokat (tehát azokat, amiknek vörösnek is és türkiznek is kéne lennie) viszont nem e két fényszín összegével (tehát fehérrel - éppen ezért nem is beszélhetünk vetítésről), hanem egy olyan színnel, amihez akár vörös festékszínt, akár türkiz festékszínt adva (szubtraktív módon) hasonló színt kapunk, tehát egyfajta szürkével. (vagy valami hasonlóval, ez a körülményektől, a fényviszonyoktól és a megfigyelő szubjektív színérzékenységétől függ). A kép tehát készen áll, most már csak szelektálni kell. A szemek elé egy vörös és egy türkiz színű szűrőt kell elhelyezni, a kérdés már csak az, hogy melyiket, hova. Azt mondtuk példánkban, hogy a bal nézőponti kép készült pirossal, tehát a piros képrészleteket kell a bal szemnek látnia. A piros szűrő a fehér fényt "bepirosítja", a pirost viszont (ideális esetben) teljes mértékben átengedi. Így egy piros szűrőn keresztül a fehér és a piros képrészletek megkülönböztethetetlenek. Ugyanez igaz a türkiz szűrőre, tehát a rajta keresztül nézett türkiz képrészlet a fehér mellett eltűnik. Viszont az ellentétes színek (vörös szűrő esetén a türkiz, türkiz szűrő esetén a vörös) a szűrőkön keresztül hasonlóan sötét lilás árnyalatot adnak, épp úgy, mint a közös színnek használt szürke. Így már egyértelmű, hogy a vörös szűrő kerül a jobb szem elé, a türkiz szűrő kerül a bal szem elé. E technológiának előnye, hogy nem kell polárszűrő, hátránya viszont a képek színkiválasztásának bonyolultsága.
   Az utolsó és talán legegyszerűbb megoldás a időbeli szelektivitás. Ez azt jelenti, hogy egy megjelenítő eszközön (ez általában valamilyen gyors képváltási lehetőséggel bíró képernyő) a két oldalról felvett képeket egymás után megfelelő sebességgel váltogatjuk. Az emberi szem ilyenkor szintén egy összemosódott képet fog látni. Azonban ha egyenként eléjük teszünk egy megfelelő időközönként felváltva elsötétülő szűrőt, akkor a nem kívánt képek eltakarhatók. Ezt általában egy folyadékkristályos szűrővel oldják meg, mely szinkronban "villog" (sötétül el) a képpel. Tehát ha éppen a jobb oldalról felvett kép jelenik meg, akkor a bal szem előtt lévő szűrő, ha a bal oldalról felvett kép jelenik meg, akkor a jobb szem előtt lévő szűrő sötétül el. Ahhoz, hogy ez élvezhető képet biztosítson, a képváltás sebességét a szem tehetetlenségénél (ami általában 24 váltás másodpercenként) gyorsabbra kell választani, tehát minimum 48 kép másodpercenként. Ez a mai technológiákkal bőven teljesíthető (elérhető akár a 70 kép/másodperces sebesség is).

4. A térhatás érzékeltetése kétdimenziós képekkel II. - sztereószkópia

   Ahhoz, hogy a két szem más képet lásson egyazon papírlapon, nem feltétlenül szükséges mindenféle optikai szerkentyű. Alapesetben ha ránézünk egy képre, a két szem ugyanazon helyen lévő képrészletet lát. Viszont ha van egy mintasorozatunk (mondjuk egy négyzetháló), akkor kisebb erőlködéssel kancsalíthatunk, aminek eredményeképp ugyanazt látja a két szem, mégis különböző helyekről. Ha most a mintasorozat néhány egymás melletti elemének vízszintes irányú méretét vagy helyét kis mértékben módosítjuk, akkor a szabályos sorozatról áttekintve erre a képtartományra, a két szem tengelye által bezárt szög a kezdeti kancsalsághoz képest változni fog. Tehát máris elértünk egy normális esetben távolságkülönbség által eredményezett szemmozgást, jóllehet a kép egyáltalán nem közeledett felénk és nem is távolodott tőlünk. Minél kisebb az ismétlődő minták távolsága, annál kisebb a megerőltetés, viszont annál kevésbé tudunk létrehozni ilyesfajta eltéréseket. Így a szemtengelyek csak kis szögtartományban mozoghatnak. Ha viszont nagy a minták távolsága, akkor "nagy mélységű" képeket is el tudunk készíteni, azonban nagyon nehéz egy ilyen rendhagyó állapotba való "beállás", mert a szemtengely és a szemlencse eddig megszokott teljesen szinkronizált működése ez idő alatt megszűnik. Arról nem beszélve, hogy a szem ilyesfajta nem normális működése azok károsodását (végleges kancsalság) eredményezheti. Úgyhogy ezzel a módszerrel ajánlatos vigyázni. Próbaképpen egy egyszerű ábra:











Célba vetítő tükörrendszer










Ennél az ábránál, ha el tudjuk érni hogy a jobb oldali kép a jobb szembe kerüljön, a bal a balba, akkor úgy érezhetjük, hogy a kis négyzet a téglalapok fölött (felénk), a középső téglalap a négyzet és a nagy téglalap között, a nagy téglalap pedig tőlünk legtávolabb helyezkedik el. Ha viszont fordítva "állítjuk be" a szemünket, akkor pont ellenkező a helyzet, tehát a kis négyzet van legtávolabb, a nagy téglalap pedig legközelebb.

Irodalom- és WEB-jegyzék:

[1]   Hajós Gábor: Holográfiáról alapfokon
[2]   Reader's Digest válogatás: Hogy is van ez?
[3]   http://www.3dimagery.com

BME-VIK, 1999. december

Lap tetejére
Előző


A virtuális valóság, a mesterséges intelligencia és kapcsolatuk

Számítógépes kultúra házi dolgozat

"Úgy látjuk, mintha... és úgy halljuk, mintha..." - A virtuális valóság

   Tegyük fel, hogy egy tudós feltalált valamit, egy cég kifejlesztett egy új berendezést, a gyógyszeriparban kitaláltak egy új készítményt, de kipróbálásuk, működés közbeni vizsgálatuk túlságosan veszélyes vagy költséges lenne. Vagy ha csak egy prototípussal rendelkezik a szóban forgó alkotó és nem biztos a sikerben, megkockáztathatja-e, hogy rögtön bevesse a gyakorlatban, vagy egyszerűen kipróbálja egy kísérleti nyúlon azzal a kockázattal, hogy az esetleg végleg tönkremegy? Valamilyen módon meg kell győződnie arról, hogy alkotása megfelel-e az elvártaknak; mindezt persze teljes biztonsággal és lehetőleg nem túl nagy kiadással. Ugyanez a kérdés merülhet fel olyan helyeken, ahol a megfigyelés és az esetleges módosítások túl körülményesek lennének. Például túl kicsi (gyógyászat), túl veszélyes (fizika, kémia) vagy más megközelíthetetlen (pl. űrkutatás) térben. Vagy olyan esetben, amikor egy művelet végrehajtása túl sok időt venne igénybe. Mit tehet ilyenkor az ember? Létre kell hoznia egy olyan mesterséges környezetet, amely teljes mértékben hasonlít a valósághoz, úgy is viselkedik, de mégsem az. Ha ennek a környezetnek a létrehozása, folyton ismételt alkalmazása nem veszélyes a vizsgálatot végzőkre és még olcsó is, akkor egy rendkívül hatásos módszert dolgoztunk ki abból a célból, hogy teremtményünk és a virtuális valóság egymásra hatását megismerjük.
   Ezen környezetnek a lehető legvalósághűbbnek kell lennie, ami nemcsak bonyolítja, hanem egyben költségesebbé is teszi az előállítását. Mindez persze attól is függ, hogy milyen célra készítjük ezt a szimulátort. Természetesen a tudományos kísérletek megkövetelik a megfelelő részletességet és precizitást. De akkor hol lehet hanyagolni? Mint a legtöbb hétköznapi használatban lévő dolog, a szimuláció is kilépett a laboratórium falai közül a lakosság körébe. Itt elsősorban - és majdnem mindig - a szórakoztatóipar az, ami nagy előszeretettel alkalmazza ezeket a találmányokat. Vegyük csak a legegyszerűbb dolgok egyikét, a vidámparkot. Ez az a hely, ahol az ember a legvadabb vágyait is kielégítheti. Nem kell hozzá fegyverviselési engedély, hogy a céllövöldében kipróbálja célzóképességét, és nem fogja más vérét ontani, ha lelövi barátját az elektronikusan ellenőrzött és szabályozott játéktéren. Nem kell asztronautának lennie ahhoz, hogy megtudja, milyen a centrifugában. Átélheti mindazt, amit egy űrhajós a kilövéskor. Még jogosítványra sincs szüksége ahhoz, hogy beüljön egy rallyautóba, és 200 kilométeres sebességgel végigszáguldjon a városon. Vagy, hogy valami népszerűt említsek, űrhadjáratot indítson a Galaktikus Birodalom ellen. Mindegyik játéknak az a lényege, hogy a játékost egy nem hétköznapi, számára nem megszokott környezetbe helyezi, ahol megteheti mindazt, amit a valóságban nem tudna, vagy - akár fizikai adottságai, akár anyagi helyzete miatt - nem lenne rá lehetősége.
   Játékoknál maradva, milyen szintek léteznek? Az egyik legegyszerűbb és talán legközismertebb a szerepjáték. Itt a játékosok egymás közt megbeszélik, ki, milyen szerepet alakít, milyen tulajdonságokkal bír stb. A játékot - a szereplők megismerése után - a játékvezető (játékmester) irányítja, és kénye kedve szerint hozza a játékosokat a legkülönbözőbb helyzetekbe, amiket meg kell oldaniuk. Az ilyenfajta játékban egy tényező van, ami meghatározza a játék sokszínűségét és élvezhetőségét: a fantázia. Elképzeljük azt a világot, amelybe a játékvezető helyez minket, és mi esetleg tovább is alakíthatjuk azt. Mivel itt minden kitalált, de a szereplők bármilyen helyzetbe kerülhetnek (ami a valóságban eléggé extrém lenne), ez is egyfajta virtuális valóság. Ezt továbbszínezheti a társasjáték, mely már egy előre leírt helyszínre kalauzol minket, ahol például több milliós üzleteket köthetünk, megküzdhetünk a hétfejű sárkánnyal, bekerülhetünk egy televíziós vetélkedőbe vagy bebarangolhatjuk az óriási piramist. Mindezekre a valóságban nem biztos, hogy lehetőségünk lenne. Kisgyermekkorunk talán legnépszerűbb játéka, amikor kint rohangálunk fel-alá az udvarban mint hős lovagok, cowboyok, vakmerő zsaruk vagy űrharcosok kezünkben az ehhez szükséges segédeszközökkel mint például a pengeéles fakard, a műanyag hatlövetű, a csillogó rendőrjelvény papírból vagy az elektronikus, hangokat kiadó lézerpisztoly. Itt ezek a tárgyak azok, amik fantáziánkat kiegészítve még hitelesebbé teszik a nem igazi, de számunkra tökéletesen valósághű középkori küzdőteret, texasi kisvárost, bűnözőktől nyüzsgő metropoliszt vagy a végtelen űrt. Hasonló helyzet, amikor a porban kúszva, berregve tologatjuk magunk előtt a kisautót, amivel néha - mikor felállunk - még repülni is tudunk, vagy három másodpercen belül eljutunk (a konyhából a nappaliba) egyik városból a másikba. Az eddig felsorolt játékok mind olyanok, ahol nagymértékben a fantáziánkra vagyunk utalva. - Kialakult azonban egy olyan változat is, ahol adott a helyszín, nem nekünk kell gondoskodni a durranásokról, nyikorgásokról, esetleg aláfestő zenéről, hanem - potom egy százasért - mindezt megkapjuk 120 decibelles hangerővel, valósághű sikátorokban vagy egy másfél méter széles képernyő előtt. És mindössze két méterrel kell odébb állnunk, ha valami más kelti fel érdeklődésünket. Ezzel párhuzamosan berobbantak azok a játékok is, ahol egy teljesen kompakt kivitelű dobozkával autóversenyezhetünk, mászkálhatunk egy vízvezeték szerelővel vagy különböző alakú és méretű dobozokat pakolhatunk egymásra, amíg be nem telik a képernyő. Ezek a játékok már komolyabb technikai háttérrel rendelkeznek (csodás kivitelű rajzok és izgalmas hangeffektek), éppen ezért áruk borsosabb. Viszont bárhová magunkkal vihetjük, csak legyen nálunk három adag tartalék elem, és egy fülhallgató. Szegény szülőknek még nagyobb kiadást kell állnia, ha csemetéjüknek a legújabb számítógépre fáj a foga. Ez persze legyen multimédiás (a maga 100-szoros sebességű CD meghajtójával), legyen benne háromdimenziós videokártya, négydimenziós hangkártya és szinte végtelen kapacitású adattároló. Ha ez megvan jöhetnek a szintén nem túl olcsó játékprogramok, melyek rohamos fejlődése miatt a jelenlegi hiperszuper számítógép éveken belül elavul. És akkor még nem beszéltünk az olyan tartozékokról, melyek használata még élvezetesebbé teszi a játékot: úgy mászkálhatunk kedvenc figuránkat, mintha egy kvarcjátékot tartanánk a kezünkben; olyan joystick-kal irányíthatjuk az űrhajót, melynek van 32 gombja, saját memóriája, saját tápegysége, és még ki is tudja csavarni a kezünket; valódi kormánykerékkel és valódi pedálokkal vezethetjük versenyautónkat, melyek szintén rángatóznak, ha rámegyünk egy buckára; lézercélkeresős pisztollyal lövöldözhetünk ellenfelünkre a teljesen háromdimenziós világban, fejünkön a nem túl könnyű és hányingerkeltő Virtuális Realitás-sisakban. Meg kell hagyni viszont, hogy ez utóbbi már tényleg elég részletességgel adja vissza a valóság érzetét, azonban hátránya ismét a nem túl alacsony árfekvés. És végül, de nem utolsó sorban, olyan tartozék is létezik, mely úgy mozgatja a játékost, hogy az testestül-lelkestül beleélje magát a játékba. Ez azonban tényleg nagyon drága lehet, hacsak nem veszi valaki a fáradságot, hogy otthon összeeszkábálja.
   A szórakoztatóipar másik nagy hatású aduja a film. Az emberi képzelőerő rendkívül nagy. Olyan dolgokat is kitalálhatunk, amelyeket más azelőtt még nem látott. Az persze más kérdés, hogy az ilyen fiktív dolgok összetevőit megtalálhatjuk a természetben, a már létező teremtmények részeiként. Legyenek ezek élőlények, már korábban megalkotott berendezések, vagy helyszínek. Mégis, a néző ezt nem veszi észre (vagy nem akarja észrevenni), mert ez az összeállítás számára még új. A filmbéli szereplők lehetnek különleges adottságúak, velük olyan is megtörténhet, ami egy átlagemberrel soha (vagy nagyritkán), olyan helyeken járhatnak melyen ember még soha, és még sorolhatnám. Főleg a mai filmtechnika segítségével ezek a helyzetek rendkívül egyszerűen előállíthatók. Legyen az a dinoszauroszok újrateremtése, a Marson való élet kialakítása, csillagközi háborúk elbeszélése, földönkívüli lények látogatása; az ötletek és megoldások tárháza kifogyhatatlan. Hogyan kapcsolódik ez a témához? Úgy, hogy amikor az ember beül a moziba, hogy megnézzen egy filmet, azonosul a főszereplővel, és - főleg a vizuális és akusztikus effekteknek köszönhetően - ő maga is úgy érzi, mintha ott lenne a filmben. Nem azt akarom mondani, hogy a színészi tehetség nem számít, sőt! Van úgy, hogy semmi extra nincs a film kép- és hanganyagában, mégis tökéletes a film összhatása. A néző ekkor együtt izgul a hőssel, drukkol neki a harcban, és sír, ha történik vele valami. Pedig ő csak ott ül egy kipárnázott székben, szürcsöli az üdítőt, és ropogtatja a pattogatott kukoricát. Mégis az egész olyan, mintha valóság lenne. A moziból kijövet aztán izgatottan beszéli meg társával a látottakat, és még mindig a film hatása alatt van. Olyan ideges, mintha vele történtek volna meg a filmbéli események. A másik, még hatásosabb változat, amiből ugyan világszerte még elég kevés van: a háromdimenziós mozi. Mindegyik néző egy-egy polarizációs szűrővel ellátott szemüveggel nézi a filmet, melyet eredetileg ikerkamerával vettek fel. Így a két szem különböző irányból felvett képeket lát, melynek a térhatás lesz az eredménye. (Ilyen elven működik a fent említett VR-sisak is, csak ott két külön kijelző szolgáltatja a két szem által látott képet.) Ezekben a mozikban a néző joggal érezheti úgy, mintha benne lenne a filmben, mert néha előfordul, hogy egy motorkerékpár kicsúszik a vászonról a nézőtér közepére, vagy átrepül a nézők fölött egy hatalmas repülő. Természetesen elég veszélyes lenne, ha mindez valóban megtörténne, de ezt csak úgy látjuk, mintha... és úgy halljuk, mintha... Éppen ezért ez is virtuális valóság.
   Az üzleti életben is visszaköszön a technika ilyen téren való újítása: bankautomaták, hitelkártyát elfogadó üzletek, internetes bevásárlás, internetes vagy telefonos konferenciák stb. A hétköznapi életben is megtalálható a virtuális realitás, gondoljunk csak a legegyszerűbb és leghétköznapibb dologra, a telefonra. Ezen kívül: televízió, videotelefon, manager calculator, telefonregiszteres óra... Elterveztek már jövőbeli dolgokat is, mint például a kommunikatív autó, a hűtő, mely "mindent tud", az intelligens ház, már-már mesterséges intelligenciák. Ezen fejlesztések fő forrása és támogatója a hadsereg. Érdemes belegondolni, hogy rengeteg napjainkban használt hétköznapi tárgy egy katonai újításból alakult ki.
   Visszakanyarodva a dolog tudományos részéhez, rengeteg olyan probléma adódik, melyet csak a virtuális valóság segítségével tudnak megoldani. Ide kell sorolni például az autógyártásban a töréspróbát. Mivel ezt a való életben nem lehet végrehajtani, kialakítottak erre a célra egy olyan tesztpályát, ahol a műszerekkel és próbababával felszerelt autót olyan ütközés hatásnak teszik ki, mely az életben is előfordulhat. A műszerek adatai és a próbababák esetleges deformációi alapján meghatározzák, hogy hol kell módosítani az autó szerkezetén. Persze lehet, hogy sokan úgy gondolják, ennek semmi köze sincs a virtuális valósághoz, mert egy valódi autó csapódik neki egy valódi falnak. Ez tény, viszont átvitt értelemben mégsem valóság, mert az ütközés nem az autópályán és nem figyelmetlenség miatt történik meg, hanem egy műteremben és azért, mert a szakemberek így állították be a helyzetet. E példával felvezetve elmondhatjuk, hogy majdnem minden technikai vívmány kifejlesztésének tesztfázisa a valóság szimulálásán alapszik, tehát ezek mind a virtuális realitást hívják segítségül. Vannak olyan tervezők, melyek ún. végeselemes programokat használnak. Ezek a programok a megtervezett tárgyról készített térhálós ponthalmazt felhasználva figyelik a különféle mechanikai erők vizsgált objektumra gyakorolt hatását. Segítségükkel megtudhatók az esetleges deformációk mértéke, vagy hogy az objektum egyes részei milyen mértékben vannak terhelve. Itt tehát még nem is létezik a tárgy, de már kísérleteket hajtanak végre rajta. Mindezt abból a megfontolásból teszik, hogy a gyártósor drága alkatrészeit ne kelljen minden egyes újításnál kicserélni. A program segítségével a lehető legtökéletesebbre tervezik a tárgyat, és csak akkor készítik el a gyártósort, ha minden szoftveres teszt eredményes volt.

"Virtuális intelligencia ... Mesterséges valóság ???" - Kapcsolat/átmenet

   A virtuális realitásnak van azonban egy kis hiányossága. Mint ahogy arról az elején szó volt, nem lehet olyan virtuális környezetet kialakítani, mely mindenre reagál. Honnan tudjuk, hogy melyik az a legkisebb hatás, amely már elhanyagolható? Figyelembe vettünk-e a kialakításkor minden hatást, ami szóba jöhet? Mi van, ha van még valami, amivel nem számoltunk? És ha van, akkor mi az? Van egy közmondás, mely szerint az ember a saját hibáiból tanul. Ezt viszont nem lehet megengedni egy olyan berendezés tervezésénél, amely működésén esetleg életek múlhatnak. Egy ember agykapacitásának csak kis részét használja ki, tehát bőven lenne még mit kitölteni információval. Ennek ellenére nem tudunk mindent fejben tartani. Éppen ezért századunk egyik nagy (talán legjelentősebb) vívmányát, a számítógépet hívták segítségül: tartsa fejben ő az új információkat! Igen ám! De akkor ez azt jelenti, hogy minden újdonságot közölnünk kell neki. Milyen formában tegyük ezt? Rengeteg olyan dolog van, amit tudatni kell vele esetenként rendkívül gyorsan. Tehát az a verzió, hogy minden egyes új információt egy programozó a megfelelő formátumban tudat a géppel, elvetendő, mert nincs olyan ember aki ezt a sebességet követni tudná. Megoldás lehet, ha a gépet a legkülönbözőbb érzékelőkkel szereljük fel, melyek gyorsak, és rendelkeznek egy fordítóegységgel, mely a gép nyelvére konvertálja az információt. A kérdés itt az lehet, hogy mennyire legyenek az érzékelők gyorsak, és mennyire legyen gyors a gép? Egyáltalán, mennyi érzékelőre és mekkora adattárra van szükség? Ha ezeket a kérdéseket megválaszoltuk, és találtunk egy optimális kialakítást, akkor azon kell elgondolkozni, hogy a gép környezetből vett információit hogyan dolgozza fel, és hogyan tanuljon belőlük. Tehát az információfeldolgozás után már ezen új dolgoknak megfelelően járjon el. Egyáltalán, mi az az információtömeg, amivel kiindulásként fel kell őt ruházni? Tud-e majd improvizálni, és ha igen, helyesen dönt-e? Ezen kérdések megválaszolásával, és az ezzel kapcsolatos fejlesztésekkel a mesterséges intelligencia kutatás foglalkozik.

"Kelj fel, és járj!" - Robotokkal körülvéve

   A mesterséges intelligencia kutatás nagyon régi időkre nyúlik vissza. Már az ősember is arra törekedett, hogy munkáját minél könnyebben és fáradság nélkül tudja elvégezni. Elkezdett hát gépeket készíteni (itt a legegyszerűbb dolgokra kell gondolni, mint pl. a kerék), melyek segítették őt a munkában. Ezzel elkezdődött a civilizálódás, mely az évezredek során jelentősen fejlődött. Az egyszerű gépeket követték a már összetettebbek, majd azok melyek már nem az erőátvitel elvén működtek, hanem rendelkeztek saját erőforrással (pl. gőzgéppel, belsőégésű, majd villanymotorral hajtott berendezések) Ezek fejlesztése, automatizálása nagy előrelépés volt a technika vonalában, de még mindig nem voltak tökéletesek. Az embernek több kellett. Olyan gépet akart, mely nemcsak automatikusan végez el bizonyos műveleteket (ilyenek már voltak: pl. óraművek, ipari gyártósorok), de az előre kiszámíthatatlan dolgokra is reagál. Például mi van, ha a munkadarab fél centivel odébb kerül a futószalagra? Ekkor még nem állhat le az egész gyár. (Igaz ez még mindig nem mesterséges intelligencia, csupán hibakorrekcióval ellátott automatikus gépsor. Itt ugyanis előre tudjuk, mi az amivel számolni lehet, a nem várt események előfordulásának valószínűsége rendkívül csekély.)
   Aztán elkezdtek foglalkozni a robotok fejlesztésével. (Itt már nem az ipari alkalmazásokra kell gondolni.) Rengeteg film dolgozta fel a témát, melyben a robot általában emberszabásúnak volt ábrázolva. Pedig az akkori tudás még messze nem volt olyan szinten, hogy emberhez hasonló robotot tudjanak készíteni. Most koncentráljunk kizárólag a mozgásra! Érdemes belegondolni, hogy egy emberi test egyensúlyban tartásához milyen érzékelők és milyen mechanikák szükségesek. Először az volt a nagy feladat, hogy egy aránylag egyszerű gép (pl. kisautó) állandó haladás közben tájékozódni tudjon a környezetéről, és ne menjen neki a falnak. Majd következtek a bonyolultabb feladatok: menjen el egy bizonyos pontig úgy, hogy ne menjen neki a falnak; hajtson végre bizonyos feladatokat menet közben stb. (Ez utóbbira példa az MIT-ben kifejlesztett robot, melynek feladata az egyetem parkjában összegyűlt szemét felszedése volt.) Később olyan robotokkal is kísérleteztek, melyek megfigyelték egymás helyzetét és vigyáztak, nehogy összeütközzenek (hangyafarm). Ezeket aztán más programokkal is ellátták, pl. mindegyik kövesse a kijelölt vezért stb. Készültek olyan robotok is, melyeknek egyszerűen csak az volt a feladatuk, hogy egy bizonyos tereppályán át tudjanak menni. Ők még mindig csak úgy néztek ki, mint egy lánctalpas vagy egy svábbogár. Olyan fejlesztésekről is tudunk, melyek szövegesen kérdeznek a környezetükről. A kérdésekre emberek adnak megfelelő formátumban választ , ami általában a leegyszerűsített angol nyelv. Ezeket a gép feldolgozza és tanul belőlük. (Például megkérdezi, hogy most éppen milyen irányban áll. Megmondjuk neki, hogy "arccal" a falnak, de jobbra van az ajtó. Ha ezek után azt a parancsot kapja, hogy menjen ki az ajtón, akkor jobbra fog fordulni, és nem fog nekimenni a falnak.)
   Csak hogy a filmekről is szó essen: Már az ötvenes években készítettek olyan filmeket, ahol az űrhajós kutatócsoportot az ember legjobb barátjaként robotok segítették (Tiltott bolygó, 1956). A nyolcvanas években olyan robotok is cellulózra kerültek, melyek öntudatra ébredtek, teremtőik ellen fordultak és sokéves háborút vívtak velük (Terminator, 1984). Ezek - szintén csak a filmtechnika segítségével - már teljesen emberszerűek voltak. Nem beszélve azokról, melyek még át is tudtak alakulni (Terminator 2, 1992). A beszélő autó pedig mindenki kedvence lett (Knight Rider, 198x). A filmekben megismert mesterséges intelligenciák persze mind kitalációk. Egy emberi test méretű dobozba nehezen tudnánk olyan tanulni is tudó számítógépet elhelyezni, mely megtévesztően úgy mozog, mint egy ember. (Bár ki tudja, mire képes a mai technika?) Nem csak a tárolókapacitásra kell gondolni, hanem a sebességre is. ("Nézzünk azonban egy egyszerű sétáló robotot. Igen gyorsan kiderül, hogy tud-e járni a gép vagy sem, azaz felborul-e vagy sem. S hogy ne boruljon föl, a robot nem tehet ki a képernyőjére egy homokórát, míg kiszámolja, hogy hova is fog most lépni, hogyan mozduljon, mert ha elkezdett dőlni, akkor azonnal cselekednie kell." - Új Alaplap 1996/9) És itt persze nem csak a számolási sebességre, hanem a mechanikák gyorsaságára is gondolni kell.
   És van még egy dolog, mely a mesterséges intelligencia kutatás nagy kérdése: Tud-e egy gép úgy gondolkodni, mint egy ember? A mozgástól most tekintsünk el! Vizsgáljuk csak az "észjárást"! Sokan úgy vélik, hogy az általános intelligencia megvalósítható fizikai jelek és szimbólumok segítségével, ezek kapcsolatai és a közöttük fennálló összefüggések pedig leírhatók és egyértelműen megfogalmazhatók. Ily módon ez megoldható egy bizonyos formális nyelvvel, mely lehet akár egy programozási nyelv is. Tehát használhatunk erre a célra számítógépet! Ez idáig rendben is volna, de milyen "gondolkodó algoritmust" válasszunk? Legyen a gépnek az a feladata, hogy kitalálja, mi legyen a környezeti hatásoknak megfelelő következő végrehajtandó mozzanata (pl. mozgó robot új haladási iránya, sakkprogram következő lépése stb.). Továbbá nevezzük sémának azt a referenciaadatbázist, aminek alapján dönt. Rengeteg féle algoritmus létezik. Nézzük például azt, amely kevés sémát tartalmaz, viszont meg tudja vizsgálni, mi(k) lesz(nek) ezen mozzanatsorozat(ok) következménye(i). Miután megvizsgálta az összes lehetséges variációt, a legszimpatikusabbat kiválasztja. A másik algoritmus az lehet, ha már rengeteg séma ismeretes, ezért csak minimális utánjárásra van szükség ahhoz, hogy döntésre kerüljön sor. Míg az előbbi esetben kevés referencia anyagra de a sok számolás miatt nagyon gyors gépre van szükség, addig a másodikban sok sémát kell eltárolni, de kevesebbet kell számolni. Konkrét példa erre az az eset, amikor a "keveset tudó" de rendkívül gyors számítógép (IBM: Deep Blue) sakktudását összemérték egy sokat tudó de (a géphez képest) viszonylag lassan gondolkodó ember (Garri Kaszparov) teljesítményével. Itt a gép győzött. Néhányan persze arra gondolhatnak, hogy a sakk csupán matematika, minden megoldható, ha tudjuk az alapszabályokat. De mi van akkor, ha egy másik esetben a mester veszít mindössze azért, mert a kezdőnek volt egy jól sikerült lépése. Ez a lépés lehet akár a (gépeknél teljességgel kizárható) intuíció, a hetedik érzék vagy a véletlen következménye is. - Ha egy ember gondolkodásmódját meg akarjuk ismerni, akkor leülünk vele beszélgetni. Meg tudjuk-e tenni ugyanezt egy géppel? Végeztek olyan kísérleteket, hogy két külön szobába beültettek egy embert és egy gépet. Kívülről nem lehetett tudni, hogy ki hol van. Egy külsősnek kérdésekkel kellett őket bombáznia, majd el kellett döntenie, hogy melyik szobában van a gép, és melyikben az ember. A kérdések persze itt is megfelelő formátumban lettek megfogalmazva, épp úgy, mint a válaszok.
   Végül is mi az, ami annyira megnehezíti a mesterséges intelligencia kutatók dolgát? Sokan elmélkedtek azon, hogy az ember döntéseit nem csak a racionalitás, hanem az érzelmek is befolyásolják. A számítógép számok alapján dönt, számítását semmiféle érzelmi hatások nem befolyásolják. El lehet-e dönteni pusztán számok alapján, hogy most a vanília vagy a csoki fagyit szeressem? Esetleg az ár, az összetevők, a hőmérséklet, a halmazállapot, a szín alapján. De miért van, hogy valakinek ez ízlik, valakinek meg az? - A másik nagy kérdés a "derült égből villámcsapás" esete. Váratlan eseményekre mindenki másképpen reagál annak ellenére, hogy alapvetően minden ember egyforma felépítésű. Egyedül a gének és a felnevelkedés körülményei azok, amik megkülönböztetnek minket. Mi különbözteti meg a gépeket egymástól? Azonosak, amióta legördültek a futószalagról. Esetleg, ha olyan mesterséges intelligenciáról van szó, amely tanulni képes, akkor az általa tanult dolgok (felnevelkedési körülmény) teszik mássá a többi, szerkezetileg ugyanolyan géptől. Ez hasonlít az ikrek helyzetére, akik genetikailag szinte teljesen megegyeznek, mégis két külön emberként - még ha minimálisan is, de - különböző környezetben nőttek fel.

"Na most akkor mi van?" - Kérdések válasz nélkül

   Mi az tehát, ami a gépet emberszerűvé teheti olyannyira, hogy ne lehessen megállapítani róla, hogy csupán egy gépsor végterméke? Hogyan tudjuk a leghitelesebben leutánozni a természetet úgy, hogy minden apró mozzanatra odafigyeljünk, és minden befolyásoló és nem várt tényezővel számoljunk? És ha esetleg sikerül valamit teremtenünk, az úgy fog-e működni, ahogy elterveztük? Meg fog-e torpanni teremtményünk, ha valami olyannal találkozik, amire nem volt felkészítve? Fel tudjuk-e készíteni őt (azt(?)) a lehető legjobban? - Ezek a kérdések ma még megválaszolatlanok. Folynak a kutatások, de előre senki nem tud mondani semmit. Csupán jóslatokba bocsátkozhatunk az elmúlt évek eredményei alapján, amik - meg kell hagyni - nem rosszak. Viszont lehet, hogy a legegyszerűbb megoldás, ha továbbra is figyelemmel kísérjük a tudományos-fantasztikus műveket - legyen az könyv vagy film - elvégre a Hold utazás is meg volt írva jóval a történtek előtt. Elképzelhető, hogy ami most filmre kerül, vagy megjelenik a könyvesboltok polcain, a jövő évszázad technikai újításait tartalmazza. Most ezt persze nem tudjuk. Nincs mit tenni: tanulunk, kutatunk, építünk, várunk...

BME-VIK, 1999. június



Jelen internetes honlap és az innen hozzáférhető saját készítésű
önálló munkák szerzői joga Czuczor Szabolcs tulajdona.
Copyright© 1998-2005 Czuczor Szabolcs