Dlaczego widzimy przestrzennie? - www.gimnazjalisty.info(rmator) - Portal Gimnazjalistów

WyszukiwanieSzukaj
Szukane wyrażenie:

Przeszukaj:

 
AnkietyAnkiety
Sugestie dotyczące strony:

Sugestie dotyczące informatorów:

Jak oceniasz naszą stronę:
Jest Super!!
Całkiem całkiem :)
Może być
Wymaga dopracowania
Nie podoba mi się :(
Zdejmijcie ją!!

Ankiety są anonimowe

 
LicznikLicznik

Odwiedzin łącznie: 2854473
W tym dzisiaj: 1486

Unikalnych odwiedzin: 396281
W tym dzisiaj: 133

W naszej bazie znajduje się:
507 uczelni wyższych
656 wydziałów

 

gimnazjalisty.info » Dlaczego widzimy przestrzennie?

 

Dlaczego widzimy przestrzennie?

Dlaczego widzimy przestrzennie?

W pierwszym kwartale 2010 roku oczy wszystkich (nie tylko kinomaniaków) były zwrócone na super produkcję Jamesa Camerona pt. Avatar wyświetlaną w technice trójwymiarowej (3D). Nawet osoby, które jako sposób spędzenia wolnego czasu rzadko wybierają obejrzenie seansu w kinie, zachęcone szumem medialnym wokół tego obrazu, zdecydowały się spędzić prawie trzy godziny przed srebrnym ekranem.


Film okazał się spektakularnym sukcesem finansowym – jest pierwszym filmem, którego zarobki przekroczyły 2 mld dolarów. W konsekwencji także producenci urządzeń wyświetlających treść multimedialną zachęceni sukcesem Avatara zaczęli wprowadzać na rynek konsumencki sprzęt umożliwiający rejestrację czy prezentację treści 3D (telewizory, monitory, notebooki z wyświetlaczami 3D, smartfony, tablety, aparaty fotograficzne i kamery z podwójnymi obiektywami), natomiast dostawcy treści zaczęli oferować usługi wideo 3D na żądanie (ang. Video-on-Demand 3D, VoD-3D) czy serwisy podobne do YouTube3D. Jednak film Camerona nie był pierwszą w historii próbą wprowadzenia techniki 3D do powszechnego użytku. Po raz pierwszy seanse 3D zaprezentowano szerszej publiczności już w latach ’50 ubiegłego wieku. Niestety, producenci wycofali się po kilkunastu miesiącach prosperity ze względu na spadek zainteresowania wywołany niskim komfortem widzów spowodowanym niezadowalającą jakością obrazu w trakcie projekcji. Wydaje się, że obecny poziom rozwoju w tej dziedzinie i skala w jakiej jest finansowany zagwarantuje sukces. Obecnie, w ważnych ośrodkach naukowych na świecie, prowadzone są badania naukowe mające na celu tworzenie narzędzi pozwalających dostawcom treści prognozować i weryfikować jakość postrzeganą przez użytkownika końcowego (ang. Quality of Experience, QoE), ponieważ to od satysfakcji odbiorcy zależy sukces komercyjny usług i produktów. Punktem wyjścia dla takich badań jest identyfikacja zjawisk wywołujących wrażenie przestrzenności (efektu 3D) a następnie analiza czynników wpływających na percepcję. Zatem w jaki sposób wywołać złudzenie trójwymiarowości? Co wpływa na komfort oglądania filmów 3D?

Widzenie przestrzenne

Układ wzrokowy człowieka jest złożony z oddzielnych, współpracujących ze sobą podukładów. W procesie umożliwiającym postrzeganie naturalnych scen, zawierających wiele różnorodnych wskazówek wizualnych dotyczących głębi, informacje o przestrzeni, kolorze czy ruchu są przekazywane do mózgu niezależnymi od siebie połączeniami nerwowymi. Podobnie jest w przypadku widzenia przestrzennego, ponieważ jest ono możliwe dzięki integracji dwóch rodzajów uzyskiwanych informacji - percepcyjnych i kognicyjnych. Mózg ludzki tworzy wyobrażenie obserwowanego otoczenia interpretując informacje uzyskiwane za pomocą oczu, jak również na podstawie doświadczeń (funkcje kognitywne). O tym, że dla konkretnej sceny wartość (znaczenie) poszczególnych informacji zmienia się, świadczy fakt, że do percepcji wrażenia głębi wystarczy jedno oko. Wskazówkami (sygnałami), które są dostępne podczas takiej obserwacji są akomodacja, okluzja, perspektywa geometryczna i powietrzna, relatywny rozmiar oraz paralaksa ruchowa (ang. motion parallax). Z kolei wskazówkami, które są dostępne w przypadku, gdy do obserwacji wykorzystywane jest oboje oczu, są stereopsja i zbieżność.
Wyróżniona się cztery grupy wskazówek, które składają się na widzenie przestrzenne:

- wzorkowe,
- stereopsyjne,
- obrazowe (graficzne)
- dynamiczne

Wskazówki wzrokowe są gromadzone dzięki zjawiskom konwergencji i akomodacji. Pierwsze z nich związane jest z ruchem zbieżnym gałek ocznych. Obserwacja obiektów znajdujących się bliżej powoduje większą zbieżność wzroku niż obserwacja obiektów oddalonych. Akomodacja natomiast odpowiada za dostosowanie się oka (dobór ostrości widzenia) do obserwacji przedmiotów znajdujących się w różnych odległościach. Jakkolwiek zarówno akomodacja jak i konwergencja nie są głównymi źródłami informacji o głębi, mają kluczowy wpływ na ocenę odległości przedmiotu od obserwatora. Ich znaczenie diametralnie spada dla odległości większych niż około 10 m.
Stereopsja jest najzasobniejszym źródłem informacji o głębi. Średnia odległość pomiędzy gałkami ocznymi wynosi 63 mm, dlatego - ze względu na różny kąt obserwacji sceny - obrazy widziane przez oczy nieznacznie różnią się między sobą. Proces dokonywany przez mózg polegający na specjalnym scaleniu tych obrazów nazywamy stereopsją. Zjawisko stereopsji umożliwia wytworzenie sztucznej sceny trójwymiarowej i dlatego jest wykorzystywane przez producentów urządzeń do wyświetlania treści 3D.

Wskazówki obrazowe (graficzne) to grupa informacji, wśród których możemy wyróżnić: okluzję (obiekty położone dalej w przestrzeni są przesłaniane przez obiekty położone bliżej), wysokość w polu widzenia (obiekty poniżej linii horyzontu wydają się być bliżej im niżej znajdują się w polu widzenia), relatywny rozmiar (obiekty o podobnym rozmiarze im dalej się znajdują, tym mniejsze obrazy generują na siatkówce oka), cienie (każda część obiektu odbija inną ilość światła - cienie dostarczają informacji o kształcie obiektów), perspektywa powietrzna (odległe obiekty są mniej nasycone barwą i mniej ostre w wyniku zanieczyszczenia i wilgotności powietrza), perspektywa geometryczna. Dla większych odległości znaczenie wskazówek obrazowych wzrasta, ponieważ zarówno wskazówki wzrokowe jak i stereopsyjne tracą na znaczeniu.

Kolejną grupą są wskazówki dynamiczne uzyskiwane w wyniku poruszania się względem obserwowanego obiektu (ang. motion parallax) - obiekty, które są bliżej poruszają się względnie szybciej niż obiekty oddalone.
Reasumując, warto wskazać na doniosłą rolę mózgu w postrzeganiu głębi. Otóż wrażenie trójwymiarowości jest także wspierane przez tak zwane funkcje kognitywne. Wśród nich można wymienić między innymi oczekiwania dotyczące obiektów będących elementami obserwowanej sceny, wnioskowanie na podstawie aranżacji przestrzeni, pamięć, wiedzę o kształcie obiektów oraz wpływie otoczenia na interpretację głębi.

Naturalnie widzenie przestrzenne jest możliwe dzięki ścisłej współpracy mechanizmów okoruchowych - akomodacji i konwergencji oraz stereopsji. Niemniej jednak większość z obecnie dostępnych stereoskopowych technik prezentacji nie respektuje powiązania mechanizmów akomodacji i konwergencji zmuszając obserwatora do skupienia wzroku na z góry ustalonej odległości bez uwzględnienia faktycznego położenia obserwowanego obiektu w przestrzeni wynikającego z informacji stereopsyjnych. Takie rozstrojenie wskazówek pochodzących z mechanizmów okoruchowych podczas oglądania obrazów za pomocą wyświetlaczy stereoskopowych jest uznawane za potencjalną przyczynę zmęczenia oczu (ang. visual strain).

Czy każdy widzi przestrzennie?

Na postrzeganą jakość obrazu mogą wpływać również pewne indywidualne cechy obserwatorów. Szacuje się, że około 5 – 10 % populacji cierpi na specyficzny rodzaj ślepoty (ang. stereoblindness), która uniemożliwia postrzeganie głębi na podstawie stereopsji.

Kolejną wadą wzroku i jednocześnie przyczyną ślepoty, o której mowa wyżej, jest zez, czyli niezgodność kąta patrzenia pomiędzy gałkami ocznymi. Ponadto badania wykazały także, że osoby starsze są mniej czułe na dostrzeganie głębi (stereoskopowo), w szczególności, gdy rozbieżność obrazów jest wysoka.

Jakie są przyczyny dyskomfortu?

Na zniekształcenia prezentowanej treści mogą mieć wpływ kolejne elementy systemu dostarczania treści 3D: urządzenia służące do rejestracji wideo 3D, kodowanie/kompresja, sposób transmisji, konwersja sygnału i prezentacja. Wybór odpowiedniej konfiguracji poszczególnych elementów systemu 3DTV i jej precyzja ma fundamentalne znaczenie, ponieważ nawet niewielkie zaniedbania mogą powodować u uczestników prezentacji treści 3D takie dolegliwości jak: zmęczenie oczu (ang. eyestrain, visual strain), trudności w percepcji głębi, a czasem mdłości lub zawroty głowy. Dla komfortu użytkownika, w przypadku pobierania informacji o scenie ma znaczenie wybór konfiguracji kamery (ustawienie obiektywów względem siebie), następnie wybór metody kompresji, wybór sposobu renderingu (w szczególności gdy dokonywana jest rekonstrukcja na podstawie sygnału kolor + informacja o głębi) i wreszcie wybór metody prezentacji. Należy także uwzględnić czynniki zależne od samego użytkownika takie jak: jego pozycja względem urządzenia wyświetlającego, oświetlenie otoczenia i inne.

Wskazuje się na następujące czynniki powodujące dyskomfort:
- zakrzywienie płaszczyzny w głębi (ang. depth plane curvature),
- zniekształcenia geometryczne (trapezowe) obrazu (ang. keystone distortion),
- nieliniowość głębi (ang. depth no-linearity),
- efekt skracania głębi (ang. shear distortion),
- efekt teatru kukiełek (ang. puppet theatre effect),
- efekt tekturowy (ang. cardboard effect),
- przesłuchy (ang. crosstalk),
- efekt płotu sztachetowego (ang. picket fence effect),
- drzenie obrazu (ang. image flipping).

Zakrzywienie płaszczyzny w głębi jest spowodowane zastosowaniem zbieżnego układu obiektywów (ang. toed-in camera configuration) kamer pobierających treść 3D, czyli gdy prawy i lewy obiektyw są ustawione pod kątem względem siebie. W efekcie obiekty znajdujące się w rogach obrazu wydają się bardziej oddalone niż te znajdujące się w jego centrum. Taka konfiguracja sprawia, że błędnie postrzegane są względne odległości między obiektami.

Kolejnym źródłem dyskomfortu spowodowanym zastosowaniem zbieżnego układu obiektywów są zniekształcenia geometryczne (trapezowe) obrazu. Przyczyną występowania pionowej paralaksy jest pobieranie obrazu za pomocą czujników znajdujących się w odmiennych płaszczyznach. Na rysunku 3 zilustrowano złożenie obrazów z obu obiektywów (są to nałożone na siebie przeciwnie zwrócone trapezy równoramienne). Łatwo zauważyć, że paralaksa pionowa jest większa przy narożnikach obrazu (dodatkowo występuje także paralaksa pozioma - źródło zakrzywienia płaszczyzny w głębi). Zwiększa się ona wraz ze zwiększaniem odległości między obiektywami, zmniejszeniem odległości do punktu konwergencji oraz zmniejszaniem długości ogniskowej. Należy także zaznaczyć, że zniekształcenia geometryczne nie występują w przypadku konfiguracji równoległej.

Gdy system pobierania obrazu 3D przemieszcza się, zjawisko nieliniowości głębi może być przyczyną błędnej oceny prędkości. Przykładowo, jeśli układ kamer porusza się na wózku ze stałą prędkością, z chwilą zbliżania się do filmowanego obiektu na odległość mniejszą niż odległość do punktu konwergencji, wystąpi złudzenie, że wózek zaczął przyspieszać. Taka sytuacja może spowodować błędy w kontrolowaniu ruchu takiego wózka.
W przypadku stereoskopowych metod wyświetlania może wystąpić efekt skracania głębi. Kiedy użytkownik zmienia miejsce obserwacji przemieszczając się na boki, ma wrażenie, że obraz za nim podąża, ale perspektywa ulega zniekształceniom - skraca się. W efekcie błędnie mogą zostać ocenione względne odległości pomiędzy prezentowanymi obiektami, a także sam ruch obserwatora może prowadzić do błędnej oceny ruchu własnego obiektów.
Efekt tekturowy to nienaturalne spłaszczanie elementów prezentowanej repliki. Wyświetlane obiekty wydają się płaskie jakby były wycięte z tektury i obserwator ma wrażenie płaszczyznowej dyskretyzacji głębi. Efekt teatru kukiełek jest związany z wyolbrzymianiem lub miniaturyzowaniem obiektów. To zjawisko jest wywołane niezgodnością pomiędzy głębią i przesadnością rozmiarów - polega na irytującej miniaturyzacji np. ludzi powodując, że wyglądają jak kukiełki.

Przesłuchy (ang. crosstalks) występują, gdy informacje przeznaczone dla jednego oka w sposób niezamierzony są odbierane również przez drugie. Zjawisko to jest powszechne, ponieważ żaden system prezentacji nie gwarantuje idealnej separacji obrazów adresowanych do lewego czy prawego oka. S. Pastoor pokazał, że percepcja przesłuchów wzrasta wraz ze wzrostem kontrastu i rozbieżności pomiędzy obrazami dostarczanym do oczu. Przesłuchy są przyczyną takich zniekształceń obrazu jak: efekt duchów, dodatkowych cieni oraz podwójnych konturów. Taka sytuacja może się zdarzyć przede wszystkim w przypadku metod wyświetlania polegających na multipleksacji koloru, polaryzacji, czasu oraz refrakcyjnych wyświetlaczy autostereoskopowych (czyli takich, które nie wymagają użycia specjalnych okularów). W przypadku systemów składających się z projektorów DLP i okularów migawkowych przesłuchy mogą występować w wyniku wadliwego zanikania światła w okularach oraz braku synchronizacji. Dla metod bazujących na polaryzacji liniowej znaczenie ma pionowa pozycja głowy obserwatora - przechylenie na bok zawsze jest przyczyną przesłuchów. Także wyświetlacze autostereoskopowe nie są odporne na przesłuchy. Ich przyczyny są różne, w zależności od metody dostarczania obrazów do odpowiedniego oka. W przypadku wyświetlaczy z systemem śledzenia ruchu głowy użytkownika przesłuchy mogą być spowodowane opóźnieniem w dostarczaniu odpowiednich informacji o położeniu, jak również opóźnieniem w sterowaniu soczewkami kierunkującymi obraz.

W przypadku wyświetlaczy autostereoskopowych wielowidokowych źródłem dyskomfortu może być także tzw. efekt płotu sztachetowego (ang. picket fence effect) oraz efekt drżenia obrazu (ang. image flippping). Oba zjawiska występują, gdy użytkownik zmienia strefy obserwacji. Efekt płotu sztachetowego - jak sama nazwa wskazuje - powoduje, że użytkownik ma wrażenie jakby oglądał obraz znajdujący się za pionowymi liniami. W przypadku tego typu wyświetlaczy czarne maskujące kolumny to sąsiadujące piksele.
Efekt drżenia obrazu odnosi się do zauważalnej zmiany stref obserwacji, która powoduje dyskretyzację widoków. Takie zjawisko jest irytujące, ponieważ naturalnym jest jedynie doświadczenie ciągłej paralaksy.

Co dalej?

Trzy lata od premiery filmu Avatar, na rynku konsumenckim można zakupić urządzenia, w szczególności telewizory i monitory 3D o coraz wyższej jakości wyświetlanego obrazu. Oprócz dużej liczby filmów można nabyć także gry komputerowe obsługujące prezentację stereoskopową. Także twórcy treści 3D doskonalą warsztat i efekty widać w kolejnych produkcjach filmowych. Można ocenić, że użytkownicy powoli oswajają się z nowym, trójwymiarowym sposobem wyświetlania. Trzeba przecież pamiętać, że przez wiele setek lat jako gatunek przyzwyczailiśmy się do tworzenia i oglądania utworów 2D – malowideł, obrazów, rysunków, szkiców, potem także fotografii i filmów, które nie angażowały stereopsji w takim zakresie jak ma to miejsce w przedmiotowej technice. Teraz przyszedł czas by zdobyć nowych entuzjastów treści trójwymiarowej. Pewne jest również, że wynalazcy nie powiedzieli jeszcze ostatniego słowa w rewolucji multimedialnej.

mgr inż. Dawid Juszka jest doktorantem w Katedrze Telekomunikacji Akademii Górniczo-Hutniczej.

Artykuł został dodany przez: Akademia Górniczo-Hutnicza » Wydział Informatyki, Elektroniki i Telekomunikacji » Katedra Telekomunikacji

04/06/2013 17:41:59
 
Komentarze

Brak komentarzy

Aby dodać komentarz musisz się najpierw zalogować!