FSK 12


1 Multimedia czyli systemy
wielomodalne.
1.1 Co to takiego?
 Modalność , w sensie filozoficznym, oznacza charakterystykę stanu rzeczy i zjawisk
pod względem sposobu, w jaki one zachodzą. Wielomodalność oznacza więc używanie
różnych technik, takich jak tekst, grafika, obrazy, mowa i muzyka oraz animacja, do
przedstawiania rzeczy i zjawisk. Używanie angielskiego odpowiednika słowa
 wielomodalność , czyli  multimedia , jest w języku polskim bardzo niezręczne ze
względu na dziwaczne formy gramatyczne (np. spotykane w naszej prasie:
multimediowy). Spróbuję więc przynajmniej w tym rozdziale konsekwentnie używać
określenia  wielomodalne .
Prekursorem systemów wielomodalnych były programy demonstracyjne pisane przede
wszystkim przez posiadaczy komputerów Amiga. Początkowo tworzono głównie serie
obrazków (slide show) jako dodatki do nielegalnie rozpowszechnianych programów, w
miarę upływu czasu stawały się one jednak coraz bardziej rozbudowane. Twórcy takich
dodatków, a pózniej programów demonstracyjnych, spopularyzowali używanie
naturalnych dzwięków w demonstracjach graficznych, tworząc programy wzorowane na
teledyskach, a więc mieszając efekty muzyczne, graficzne i kolorystyczne. Było to
możliwe dzięki doskonałym możliwościom muzycznym i graficznym komputerów
Amiga. Powoli większość komputerów osobistych przestawia się z typowych zastosowań,
wymagających przetwarzania tekstu i numerycznych obliczeń, na zastosowania
wymagajÄ…ce grafiki, animacji, mowy, muzyki, wideo. Obecnie za system wielomodalny
uznaje się każdy system operujący różnymi technikami, a więc w pojęciu tym mieści się
również klasyczna technika wideo czy telewizyjna.
Pojęcie  multimedia w zastosowaniu do systemów komputerowych uściślić można
zauważając, że grafika i wideo używane w systemach wielomodalnych wymagają dużych
pamięci dyskowych. Najczęściej stosuje się przy tym CD-ROMy, mogące pomieścić do
0.5-1 GB danych na jednej płytce, a uwzględniając możliwości zapisu danych po
kompresji może tobyć nawet kilka gigabajtów. Można więc powiedzieć, że komputerowe
systemy wielomodalne oparte są na technice dysków optycznych i magnetooptycznych.
Do napędów CD-ROMów dołącza się często przykładowe dyski, zawierające np.
encyklopedie (Grolier's Multimedia Encyclopedia, Compton's Encyclopedia czy
Microsoft Bookshelf for Windows to trzy najczęściej dodawane dyski). Informacja
2 Fascynujący świat komputerów
zawarta w encyklopedii nabiera życia, oprócz tekstu do czytania można zobaczyć
graficzne animacje i sekwencje wideo lub usłyszeć głos przemawiających osób.
CD-ROMy stosowane są obecnie w wielu dziedzinach, jednakże wymyślono je właśnie z
myślą o tego typu zastosowaniach.
Ponieważ opracowanie standardów dla wszystkich rodzajów systemów wielomodalnych
dokonuje siÄ™ etapami, podzielono wszystkie systemy na telekomunikacyjne i
informatyczne. Do systemów telekomunikacyjnych zalicza się wideotelefonię i systemy
telekonferencyjne. Systemy informatyczne podzielić można na biurowe, przeznaczone do
archiwizacji i wyszukiwania informacji i na hipermedia, do których należą systemy
przeznaczone dla rozrywki, edukacji i innych komercyjnych zastosowań.
Międzynarodowa organizacja CCITT, zajmująca się standaryzacją, opracowała
przedstawiony w tabeli podział systemów wielomodalnych na różne klasy.
Przesyłanie ruchomych obrazów wysokiej jakości przez systemy telekomunikacyjne
wymaga przede wszystkim bardzo szybkich kanałów transmisji danych, od dwóch
Mbitów/s do wielu Gb/s. Kanały takie, określane jako  szerokopasmowe , są oczywiście
bardzo drogie. W krajach Wspólnego Rynku rozwojem takich sieci zajmuje się
organizacja o nazwie RACE (Research and Development of Broadband Communication
in Europe, czyli Europejska Organizacja do Spraw Badań i Rozwoju Szerokopasmowej
Komunikacji). Najbardziej popularne są na razie najtańsze sieci o szybkościach kilku
megabitów. Kilka takich łączy przebiega już pomiędzy większymi miastami Europy
Zachodniej. Eksperymentalne sieci szerokopasmowe do zastosowań wielomodalnych
powstają między innymi w Berlinie, Monachium i Stuttgarcie. Zaawansowane są również
plany budowy amerykańskich sieci gigabitowych. Wiele uniwersytetów organizuje swoje
własne, wewnętrzne sieci szerokopasmowe dla zastosowań edukacyjnych i naukowych.
Do bardzo szybkiego przetwarzania danych z aparatury medycznej, takiej jak tomografy,
NMR czy PET, potrzebny jest dostęp w czasie rzeczywistym do superkomputerów, stąd
zainteresowanie również ze strony medycyny.
Po wielu nieudanych próbach wprowadzenia wideotelefonii w latach 80-tych jest nadzie-
ja, że uda się ją wprowadzić amerykańskiej firmie AT&T. Wyprodukowany przez nich w
1992 roku wideotelefon korzysta z linii o przepustowości zaledwie 20 Kb/s (a więc na
łączu telefonicznym dobrej jakości zmieszczą się 2 takie kanały) pozwalając na
przesłanie 10 obrazów w ciągu sekundy. Stało się to możliwe dzięki technikom kompresji
obrazu, ich jakość nie jest jednak na tyle zadawalająca, aby stosować je w większości
systemów wielomodalnych. Pełny system cyfrowego wideo bez kompresji wymaga 1.5
GB miejsca na dysku na minutę materiału i szybkości czytania rzędu 27 MBps.
Zastosowanie kompresji pozwala na najszybszych komputerach osobistych na osiągnięcie
rozdzielczości VGA przy prawie 30 klatkach na sekundę, np. Mac Quadra 950 może
odtworzyć obraz o rozdzielczości 640 na 480 pikseli przy 8-bitowym kolorze (256
kolorów) z szybkością 24 klatek na sekundę. Możliwości sprzętowe dopiero dorastają do
tego typu zadań.
3 Fascynujący świat komputerów
Tabela 25,1 Klasyfikacja systemów wielomodalnych (multimedia)
Klasa systemu Typ danych Przykłady zastosowań
Systemy konwersacyjne Ruchome obrazy wideotelefonia
wideokonferencje
systemy informacyjne audio/wideo
Dzwięk transmisje dzwięku różnej jakości
Dane cyfrowe szybkie przesyłanie dużej ilości
danych cyfrowych
Dokumenty telefaks
przesyłanie obrazów wysokiej
jakości, inne systemy przesyłania
dokumentów
Systemy przesyłania Ruchomy obraz i poczta elektroniczna wideo
wiadomości dzwięk
Dokumenty poczta elektroniczna
Systemy wyszukiwania Teksty, dane, grafika, systemy wideotekstu
informacji dzwięk, obrazy systemy wyszukiwania informacji
nieruchome i ruchome wideo dla dokumentów i obrazów
Systemy udostępniania Wideo telewizja, również kablowa
informacji bez telewizja wysokiej jakości (HDTV)
interakcyjnego udziału telewizja płatna (kablowa i
użytkownika kodowana)
Teksty, grafika, systemy dystrybucji dokumentów
nieruchome obrazy
Dane systemy szybkiej dystrybucji danych
cyfrowych
Wideo informacyjny serwis wideo
Interakcyjne systemy Teksty, grafika, dz- wideografia
udostępniania informacji więk, nieruchome
obrazy
Standaryzacja formatów przechowywania i transmisji informacji ma ogromne znaczenie.
Systemy wielomodalne są atrakcyjne nie tylko dla producentów komputerów - np. IBM
od dawna o nich myśli, reklamował nawet swoją magistralę MCA, pozwalającą na szybki
dostęp do dysku, jako niezbędny element takich systemów. Podobne zainteresowanie
przejawiają firmy zajmujące się elektroniką użytkową, rozrywką, serwisem
4 Fascynujący świat komputerów
informacyjnym oraz wideo i telewizją. Z tej przyczyny, jak łatwo się domyśleć, powstało
wiele różnych, niezgodnych ze sobą formatów przesyłania i przechowywania informacji
wielomodalnej a przez to nastąpił podział i osłabienie rynku tego rodzaju produktów.
Pomimo rosnącej liczby komputerów na świecie w dalszym ciągu nie są one tak
popularne jak telewizory czy magnetowidy. Większość ludzi uważa bowiem, że łatwiej
jest posługiwać się magnetowidem (chociaż już nie każdy potrafi go zaprogramować) niż
komputerem. Z jednej strony bardziej wyrafinowane magnetowidy i kamkodery mogÄ…
obecnie współpracować z komputerami, oferując ogromne możliwości przetwarzania
obrazu. Z drugiej strony firmy specjalizujące się w elektronice domowej usiłują również
wejść na rynek systemów wielomodalnych sprzedając przystawki do telewizorów.
Krokiem w tym kierunku jest ITV, Interakcyjna Telewizja, wyrosła z udoskonalonej
telegazety. Nie oferuje ona grafiki wysokiej jakości ani ruchomych obrazów wideo, jest
poza tym powolna. Być może ulegnie to zmianie po wprowadzeniu połączeń
światłowodowych w telewizji kablowej, ale to jest kwestią dalszej przyszłości. Do
przekazywania danych dla interakcyjnej telewizji stosuje się części kanału TV,
połączenia radiowe i wykorzystuje modemy w publicznej sieci telefonicznej. Poza
typowymi usługami telegazety, takimi jak dostęp do różnego rodzaju informacji,
wiadomości, pogody, doniesień giełdowych, ITV umożliwia branie udziału w
telewizyjnych konkursach czy zakupach na odległość.
W 1993 roku rozpoczęto na Florydzie, przy współpracy firm Time Warner i Silicon
Graphics, pilotowy projekt wykorzystujący kanał telewizji kablowej do przesyłania
interakcyjnego wideo. Na jeszcze szerszą skalę działa kanał Sega, dostarczający gry
wideo do domu klienta (do końca 1993 roku miało ich być kilkanaście milionów)
bezpośrednio do konsol wideo firmy Sega. Powstają również systemy interakcyjnie nie
korzystające z telewizora do wyświetlania danych, ale z trzymanego w ręku
mikrokomputera typu palmotop. Wszystkie te systemy sÄ… na razie w fazie testowania a
biorąc pod uwagę liczne nieudane projekty interakcyjnej TV w przeszłości, nie wiadomo,
czy któryś z nich będzie istotnie konkurencyjny w stosunku do prawdziwych systemów
wielomodalnych.
1.2 Zastosowania systemów wielomodalnych
Potencjalnie systemy wielomodalne wpłyną na wiele dziedzin życia. Już teraz nowe
usługi telefoniczne, takie jak poczta głosowa, nowe usługi telewizyjne, takie jak lokalna
telewizja kablowa i nowe usługi komputerowe, takie jak lokalne grupy dyskusyjne,
bardzo mocno wpływają na sposób życia i pracy wielu ludzi. Możemy sobie wyobrazić
rozpowszechnienie się szerokopasmowych sieci umożliwiających dostęp do wiadomości
telewizyjnych przez wybieranie ich z menu, dostęp do filmów wideo i nagrań
muzycznych przez sieci komputerowe (oznaczać to będzie koniec wypożyczalni),
5 Fascynujący świat komputerów
bezpośredni dostęp do oprogramowania a nawet książek w elektronicznej formie, kursy i
różne formy interakcyjnego nauczania dostarczane prosto do domu. Zmieni się
oczywiście i system rozliczeń - elektroniczne banki staną się koniecznością. Spowoduje
to ogromne zmiany w rozrywce, kulturze, edukacji, sposobie pracy i życia codziennego.
Wszystkich tych zmian należy oczekiwać w stosunkowo krótkim czasie, rzędu
dziesięciolecia. Wielkie zmiany zajdą również w sposobie pracy - systemy wielomodalne
umożliwią realizację  przestrzeni wirtualnej (virtual reality) lub  przestrzeni
komunikacyjnej . Amerykanie wymyślili ten ostatni termin,  media space , podobnie jak
w słowie  mass-media (środki masowego przekazu), na stwarzane możliwości pracy
grupowej ludzi znajdujących się w różnych miejscach lub różnym czasie przy pomocy
wielomodalnych komputerowych systemów komunikacyjnych.
W przestrzeni komunikacyjnej można kontrolować zapis, odtwarzanie i wyszukiwanie
informacji wizualno-dzwiękowej z tworzonych przez siebie środowisk łączących
oddzielone przestrzennie grupy ludzi. Pierwsze badania w tym kierunku rozpoczęła
grupa pracowników firmy Xerox tworząc system umożliwiający wspólną pracę biorących
udział w eksperymencie specjalistów pracujących w laboratorium w Kalifornii i w
Oregonie. Inspiracją dla tego projektu było wydarzenie artystyczne z 1980 roku, nazwane
 Dziurą w przestrzeni . Było to po prostu połączenie wideo na żywo pomiędzy Nowym
Jorkiem i Los Angeles: przechodnie zatrzymywali się i gawędzili z ludzmi po drugiej
stronie kontynentu. Podobny eksperyment przeprowadzono w 1982 roku w czasie
festiwali muzyki rockowej w Kalifornii (w pobliżu San Bernardino, festiwal nazywał się
US i zorganizował go Steven Wozniak z firmy Apple Computers) i w Moskwie! Z
technicznego punktu widzenia projekt stworzenia przestrzeni komunikacyjnej stał się
możliwy dzięki rozwojowi technologii wideokonferencji. Początkowo stosowano ją
lokalnie, w obrębie jednego budynku. Wprowadzenie łączyoszybkości 54 Kb/s i systemu
kompresji obrazu pozwoliło na stałą łączność pomiędzy grupami badawczymi w obu
stanach. Początkowo system telekonferencyjny używano zestawiając połączenia
pomiędzy różnymi pomieszczeniami. Kolejnym krokiem było opracowanie narzędzi
pracy na odległość: wspólnych baz danych i narzędzi do rysowania. System komunikacji
stosowany był w firmie Xerox do utrzymywania stałej łączności, przypadkowych
indywidualnych rozmów i zorganizowanych dyskusji grupowych.
Realizacja wideokonferencji za pomocą oprogramowania See-you-See-me działającego w
sieciach Internetu stała się możliwa już w 1994 roku, nie była jednak zbyt praktyczna ze
względu na ograniczenia w szybkości transmisji danych. Pracownicy Open University z
Wielkiej Brytanii próbowali wykorzystać to oprogramowanie do prowadzeniu zajęć z
grupą studentów rozproszonych po świecie. Pomimo zakupu technologicznie najbardziej
zaawansowanego sprzętu i oprogramowania uczestnicy borykali się często z problemami
technicznymi.
ShareVision
System ShareVision firmy Creative Labs umożliwia robienie wideokonferencji przy
wykorzystaniu zwykłych linii telefonicznych. Oprogramowanie współdziała z kartami
6 Fascynujący świat komputerów
Video Blaster i kartą komunikacyjną oraz modemem zewnętrznym o szybkości 28.8
Kb/s. W zestawie znajduje się również kamera wideo oraz mikrofon ze słuchawkami.
Wystarczy połączyć się przez modem z drugim komputerem, wyposażonym w podobny
system, by w okienku o rozmiarach 160×120 pikseli oglÄ…dać, odnawiany z czÄ™stoÅ›ciÄ…
5-10 klatek na sekundę, obraz przesyłany linią telefoniczną. Chociaż obraz jest dość
mały i zmienia się niezbyt płynnie można się do niego przyzwyczaić. Niestety,
wymagana szybkość transmisji 28.8 Kb/s nie jest osiągalna na naszych liniach
telefonicznych. Przesłanie tak dużej ilości danych zwykła linią telefoniczną jest możliwe
dzięki specjalnym algorytmom kompresji, kodowania i dekodowania, opracowanym
przez Creative Labs. Pierwszeństwo przy przesyłaniu informacji mają sygnały dzwię-
kowe, więc im więcej mówimy tym wolniej zmieniają się klatki obrazu. Program
ShareVision umożliwia również przesyłanie danych komputerowych, a więc wspólną
pracÄ™ nad edycjÄ… tekstu, bazy danych lub innej aplikacji. System wideokonferencyjny
ProShare, pokazany przez firmÄ™ Intel w 1995 roku, pracuje z liniÄ… 14.4 Kbita/sekundÄ™.
Jest to możliwie dzięki szybszym procesorom (PentiumPro) zastosowanym do kompresji
w czasie rzeczywistym obrazu i dzwięku.
Firma Connectix oferuje bardzo tani (około 150 dolarów USA) pakiet do
wideokonferencji, składający się z kamery o nazwie QuickCam oraz oprogramowania
VideoPhone dla Windows. Kamera CCD daje obraz o rozdzielczości 320 na 240 pikseli i
16 lub 64 odcienie szarości. Jej 38-milimetrowy obiektyw pozwala na obserwację
obrazów oddalonych od 0.5 metra do nieskończoności. Instalacja kamery jest bardzo
prosta i polega na jej przyłączeniu do portu równoległego. Tak jak w zwykłym telefonie
nawiązanie łączności wymaga przyjęcia zgłoszenia. Telekonferencja z udziałem większej
liczby uczestników możliwa jest w sieciach lokalnych (np. Novella) i sieciach rozległych
Internetu, jeśli natomiast komputery połączone są ze sobą bezpośrednio przez modem to
urządzenie działa w trybie wideotelefonicznym (dwóch uczestników). Oprócz
oprogramowania do telekonferencji dołączono dodatkowo program WhiteBoard,
umożliwiający rysowanie i robienie notatek na wspólnym ekranie. Do przekazywania
dzwięku można wykorzystać normalne połączenie telefoniczne, bardziej niezawodne niż
połączenie przy pomocy programu VideoPhone, zacinającego się (urywająca się mowa) w
przypadku wolnych połączeń. Minimalna szybkość połączenia, przy której przesłać
można kilka klatek w ciągu sekundy, to 64 Kb, dostępna np. w sieci ISDN. Niestety
większość komputerowych sieci rozległych w Polsce nie oferuje pojedynczemu
użytkownikowi tak szybkich połączeń.
Wspólna praca wymaga nie tylko dzwiękowego lub wizualnego połączenia, lecz również
innych narzędzi, ułatwiających skupienie uwagi. Można stworzyć rodzaj wirtualnego
audytorium, oglądającego jakiś materiał przechowywany w bazie danych. Na ekranie
można widzieć jednocześnie w różnych oknach kilka osób, które mogą posługiwać się
wspólnie tym samym programem, np. opracowując tę samą bazę danych. Do budowy
takich programów aplikacyjnych w systemach wielomodalnych opracowano specjalny
obiektowo zorientowany język o nazwie Randezvous. System ten dostarcza narzędzi do
7 Fascynujący świat komputerów
Rodzaje dysków optycznych i magnetooptycznych
Nazwa Rok Pojemność Opis
CD 1980 527 MB Odtwarzanie płyt kompaktowych formatu
5.25 , do 80 minut przy 16-bitowym zapisie z
częstością 44.4 KHz; standard zawarto w
 czerwonej księdze
CD-ROM 1986 680 MB Dane zawarte na około 300.000 stron
maszynopisu. Standard ISO 9660, zawarty w
 żółtej księdze .
WORM 1987 640 MB Write Once Read Many, czyli jednokrotny
6.5 GB zapis, wielokrotny odczyt.
CD-I 1986 Interakcyjne CD, standard w  zielonej
księdze .
CD-ROM XA 1989 Rozszerzony standard CD-ROM, Sony,
Microsoft i Philips.
CD-R 1992 CD-Recordable, czyli zapisywalny CD-ROM
MO 1992 128 MB Magnetooptyczne
500-1000 MB
MD 1992 Nowy standard nagrywalnych płyt audio,
(minidyski) format 2
Enhanced CD 1995 ok. 1 GB Standard znany również jako Audio+,
jednocześnie zwykła płyta CD i CD-ROM
prowadzenia konwersacji, np. tablicy na której można coś napisać lub narysować.
Tabliczki do rysowania umożliwiają robienie szkiców widocznych dla wszystkich
uczestników wirtualnego spotkania.
Projekty tego typu - wiele z nich znajduje siÄ™ obecnie w fazie intensywnego rozwoju i
testowania w realnych warunkach - pozwolą wprzyszłości na stworzenie teleobecności,
zastępującej fizyczną obecność w miejscu pracy. Intel w oparciu o swój system
wideokonferencji ProShare pokazał w 1995 roku program pozwalający na poruszanie się
po wirtualnym mieszkaniu i spotkania z innymi osobami, które korzystając z sieci
komputerowej również się w nim znajdują. System działając na komputerze z
procesorem PentiumPro pozwala przetwarzać dzwięk i obraz z kamery zamieniając gona
trójwymiarową grafikę, osiągając przy tym pełną synchronizację ruchu ust i mimiki
twarzy z głosem. Mówi się o  wirtualnym biurze , złożonym z pracujących w odległych
miejscach osób. Najciekawszy eksperyment tego typu przeprowadzono w 1995 roku w
Szwecji. Pani Margot Wallstrom została ministrem kultury, lecz nie chcąc
przeprowadzać się z Karlstadt do Sztokholmu zorganizowała sobie w rodzinnym mieście
biuro wyposażone w sprzęt do telekonferencji. W naradach jej ministerstwa bierze udział
8 Fascynujący świat komputerów
do 15 osób. Eksperyment udał się i został dobrze przyjęty przez szwedzką opinię
publiczną, chociaż koszty prowadzenia takiego biura są na razie bardzo wysokie.
Dla jednoczesnego wysyłania i odbierania (full duplex) sygnałów wideo wysokiej jakości
trzeba przesyłać jednym kanałem cyfrowym do 30Mb/s danych. Oznacza to, że dla
jednej sali konferencyjnej czy większego biura połączonego z kilkoma miejscami
jednocześnie potrzeba będzie około 100 Mb/s a dla budynku w którym pracuje 100 osób
wymagana szybkość transmisji może osiągnąć 10 Gb/s. Obecne technologie budowy sieci
lokalnych nie oferują jeszcze takich szybkości ale dla sieci światłowodowych nie stanowi
to problemu. O wymaganiach technologicznych zwiÄ…zanych z budowÄ… szybkich sieci
wspominałem w rozdziale o komunikacji. Alternatywą do szybkich sieci jest oczywiście
kompresja danych, wymagająca dużych mocy obliczeniowych.
Największy realizowany przy końcu 1995 roku projekt budowy sieci multimedialnej
ogłosiła BBC. Każdy z 9 tysięcy współpracowników BBC w Wielkiej Brytanii i Irlandii
Północnej będzie miał dostęp do archiwum telewizji, będzie mógł odnalezć,
zmodyfikować i uzupełnić informację telewizyjną. Celem dalekosiężnym takich
projektów jest stworzenie globalnego systemu hipermodalnego, to jest dostępu do
wszelkich informacji, tekstów, grafiki, filmów, muzyki zgromadzonych w bankach
danych przez sieć komputerową. Idea takiego systemu starsza jest niż same komputery,
gdyż pojawiła się w artykule Vannevara Busha już w 1945 roku. Postulował on
stworzenie właściwego sposobu organizacji danych i stworzenie maszyny (nazwał ją
Memex) umożliwiającej połączenie wszystkich rodzajów informacji. Więcej na ten temat
napisałem omawiając hipertekst w rozdziale o komputerach i tekstach.
1.3 Świat urządzeń CD
Najbardziej popularnymi urządzeniami umożliwiającymi odtwarzanie wielomodalnych
danych są napędy CD-ROM. Przy cenach niewiele przekraczających napędy zwykłych
dyskietek, stają się one standardowym wyposażeniem komputerów osobistych i stacji
roboczych. Wiele programów można nabyć taniej w wersji na CD-ROM niż na
dyskietkach, a w niektórych przypadkach inne wersje po prostu nie wchodzą wgrę ze
względu na ogromne rozmiary programów. Dotyczy to przede wszystkim programów
graficznych, zawierających biblioteki fontów i dziesiątki tysięcy grafik, ale nawet takie
programy jak arkusze kalkulacyjne sprzedawane sÄ… na CD-ROMach z wielomodalnym
systemem inteligentnej pomocy. Programy te instalujÄ… na dysku twardym jedynie
niewielką część potrzebnych do pracy plików, korzystając z możliwości CD-ROMu w
czasie pracy.
Technologia CD-ROM ma kilka zalet. Po pierwsze, jest tania. Odnosi się to zarówno do
samych napędów jak i produkcji dysków (w dłuższych seriach poniżej dolara za kopię).
9 Fascynujący świat komputerów
Jest to najtańszy nośnik danych w przeliczeniu na koszty przechowywania jednego
megabajta. Po drugie, dyski są trwałe, mogą prawdopodobnie przetrwać nawet 100 lat,
chyba, że polejemy je zmywaczem do paznokci lub podgrzejemy w kuchence
mikrofalowej. Po trzecie, CD-ROM jest formatem standardowym (ustalonym
międzynarodową normą ISO 9660) i napędy tych dysków można używać na wszystkich
platformach sprzętowych. Po czwarte, można na nich odtwarzać zwykłe płyty
kompaktowe czyli CD-Audio. Prawie wszystkie napędy mają wyjścia słuchawkowe i
sprzedawane są z programem pozwalającym kontrolować napęd CD poprzez wirtualny
odtwarzacz z możliwościami programowania. W rzeczywistości produkcją CD-ROMów i
płyt kompaktowych zajmują się te same wytwórnie a wiele dysków CD-ROM zawiera
dzwięk zapisany w formacie płyty kompaktowej. Po piąte wreszcie dostępne na
CD-ROMach oprogramowanie i wielomodalne materiały są fantastyczne!
Technologia dysków kompaktowych rozwija się w kilku kierunkach i w najbliższych
latach można się spodziewać znacznego wzrostu zainteresowania nowymi urządzeniami.
Typowa płyta kompaktowa zawiera około 3 miliardów malutkich wgłębień na
pięciokilometrowej spirali (160.000 ścieżek na milimetr) odciśniętych w aluminium
pokrywającym płytkę. Aluminium zabezpieczone jest przed uszkodzeniem milimetrową
warstwą przezroczystego, bardzo wytrzymałego tworzywa (poliwęglanu), dzięki czemu
osiąga się tak dużą trwałość zapisu (płyty kompaktowe z początków lat 80-tych nie są tak
trwałe). Na płytach CD-ROM zapisanych jest 640 MB danych, co oznacza setki tysięcy
stron tekstu, kilka do kilkunastu tysięcy obrazów i do 20 godzin mowy. Standardowa
szybkość odczytu danych nie może być niższa niż 150 KB/sekundę - nazywa się to
standardową prędkością. Typowe napędy CD-ROMów odczytują dane z podwójną
prędkością (300 KB/sek) lub z poczwórną prędkością (600 KB/sek), a w 1995 roku
pojawiły się pierwsze modele o prędkościach poszóstnych i jeszcze wyższych. Ma to
znaczenie przy odczytywaniu obrazów wideo i ruchomych animacji.
Standard CD określony w  Czerwonej Księdze przewidywał oprócz dzwięku
dodatkowo zapisanie do 20 MB informacji tekstowych i danych graficznych. Takie płyty
przyjęto nazywać CD+R, ale nie zdobyły popularności z kilku względów: standard nie
był zbyt dobrze przemyślany i odtworzenie jednego obrazu zajmowało wiele sekund, a
sama technika zapisu była własnością firm Sony i Philips. Kilka innych standardów
multimedialnych ma szansÄ™ na dominacjÄ™ na rynku.
CD-I
Najbardziej popularną techniką, umożliwiającą interakcyjną pracę z systemami wielo-
modalnymi na dyskach optycznych jest CD-I, czyli Interakcyjne Dyski Kompaktowe
(Compact Disc Interactive), opracowanÄ… przez Philipsa w 1988 roku. Standard ten
powoli zdobywał sobie uznanie, a ponieważ Philips nie zastrzegł sobie wyłączności do
używania tej nazwy stała się ona niemal tożsamą z techniką wielomodalną. Ponad 200
najbardziej znanych firm zajmujących się komputerami i elektroniką użytkową wykupiło
od Philipsa licencję na używanie systemu CD-I. Między innymi pozwala on na pełną
zgodność ze standardami płyt kompaktowych audio, dyskietek używanych do robienia
10 Fascynujący świat komputerów
zdjęć fotograficznych (Photo CD), formatami gier elektronicznych opracowanych przez
Nintendo (jednego z największych producentów takich gier), oraz formatem
 elektronicznej książki opracowanym przez Sony. Dzięki temu niezależnie od
producenta płyt odtwarzacze CD-I pozwolą na słuchanie płyt kompaktowych, oglądanie
fotografii przeniesionych na płyty CD i specjalnie wyprodukowanych płyt CD-ROM z
materiałem wielomodalnym.
Chociaż CD-I to system stosunkowo najbardziej rozpowszechniony, inne, różniące się
formatem zapisu danych na dyskach optycznych, funkcjami oprogramowania i innymi
szczegółami technicznymi, systemy walczą o utrwalenie swojej obecności na rynku.
Wśród nich najważniejsze to DVI, czyli Interakcyjne Cyfrowe Wideo (Digital Video
Interactive) i CDI-XA, czyli CD-I o rozszerzonej architekturze. Niestety, w tej dziedzinie
przyjdzie nam jeszcze poczekać na utrwalenie się standardów. Dotyczy to zwłaszcza
systemów otwartych, pozwalających na przesyłanie zakodowanych obrazów i zdalnego
dostępu do archiwizowanych plików.
Przyjęte standardy zapisu informacji na interakcyjnych płytach kompaktowych (CD-I i
DVI) pozwalają na zapis wielu kanałów dzwięku, można więc zapisać komentarze w
kilku językach. Proporcje pomiędzy obszarem pamięci przeznaczonym na zapis dzwięku
i na zapis obrazu można dowolnie zmieniać. Pojawienie się płyt CD nowego standardu,
znanego jako Audio+ lub Enhanced CD, może jednak zagrozić rozpowszechnianiu się
CD-I. Nowy standard pozwala z jednej strony na odgrywanie muzyki za pomocÄ…
zwykłych odtwarzaczy płyt kompaktowych a z drugiej strony na przechowywanie
programów i danych w formacie zwykłego CD-ROMu. Płyty Enhanced CD zdobyły w
1995 roku sporą popularność, między innymi dzięki udanej serii
informacyjno-muzycznej o kompozytorach muzyki klasycznej.
1.4 Multimedia na CD-ROMach
Systemy wielomodalne znajdÄ… zastosowanie nie tylko w pracy, gdzie
potrzebne sÄ… przede wszystkim systemy telekomunikacyjne, lecz
przede wszystkim w edukacji i rozrywce, gdzie w znacznej mierze
wystarczają systemy informatyczne. Jednym z pierwszych zastosowań
sÄ… elektroniczne encyklopedie. Ich przewaga nad wersjami
drukowanymi jest oczywista - nie tylko zajmujÄ… znacznie mniej
miejsca i pozwalajÄ… na szybsze dotarcie do szukanej informacji,
pozwalają również na oglądanie grafiki i ruchomych obrazów oraz
fragmentów przemówień czy głosów ptaków. Sony produkuje
przenośne urządzenie o nazwie Data Discman pozwalające na
odtwarzanie CD-ROMów, wyposażone w wyjście słuchawkowe i klawiaturę, pozwalające
na interakcyjne wyszukiwanie informacji z encyklopedii, baz danych i poradników. W
11 Fascynujący świat komputerów
dalszej perspektywie, po udoskonaleniu ekranów LCD i obniżeniu ich ceny, możliwe
stanie się stworzenie podręcznej elektronicznej książki, przechowującej wszystkie
książki, artykuły i inne teksty, które nas zainteresowały. Aadowanie danych do takiej
elektronicznej książki mogłoby się odbywać przez sieć komputerową i nie wymagałoby
ruszania się z miejsca. Dostępność książek w takiej formie wywoła wielkie problemy
prawno-orgranizacyjne (sposób rozliczenia kosztów, ochrona praw autorskich, sens
istnienia bibliotek i księgarni). Już teraz przenośny odtwarzacz CD-ROMów
produkowany przez Panasonica reklamuje siÄ™ jako  odtwarzacz elektronicznych
książek .
Systemy wielomodalne stwarzają również ogromne możliwości artystom. Wystawy
grafiki i sztuki komputerowej oraz komputerowo generowanych filmów animowanych
odbywają się od wielu lat: dołączenie efektów dzwiękowych nie jest rzeczą trudną. Na
poczÄ…tku 1993 roku pokazano w galerii sztuki w Bonn wystawÄ™ Widok Ziemi: globalne
zmiany. Komputery sterowały tu instalacją wideo pokazującą obrazy zgromadzone na
CD-ROMie, zdjęcia satelitarne Ziemi połączone w jeden wielki obraz i rzucane na
wielką ścianę oraz inne obrazy naturalne i komputerowo przetworzone, połączone z
komentarzem słownym i efektami dzwiękowymi. Odwiedzający mogli wybierać różne
elementy pokazu dotykając ekranu monitora. W połowie 1993 roku pokazywano
wystawę  Pompeja na nowo odkryta , gdzie oprócz 200 archeologicznych artefaktów
zainstalowano 20 komputerów z ekranami wrażliwymi na dotyk, pokazującymi
rekonstrukcje starożytnych budowli i pozwalającymi poruszać się po pokojach i oglądać
malowidła naścienne. Wystawa ta stanowi podsumowanie 250 lat badań
archeologicznych w Pompei.
Do końca 1992 roku na rynku oprogramowania wielomodalnego było kilkaset tytułów a
liczba różnych dysków CD-ROM przekroczyła 5000. W 1993 roku zaczęły powstawać
pierwsze wypożyczalnie tych dysków, rozprowadzane przez sieć wypożyczalni kaset
wideo i płyt kompaktowych. Będą one również sprzedawane i wypożyczane w
księgarniach. Największą grupę programów wielomodalnych stanowią gry: można dzięki
nim znalezć się w najsłynniejszym kasynie w Las Vegas
(Cesar's World of Gambling), walczyć z robotami w
CyberCity (Escape from Cyberneticity), wejść w świat magii
wędrując po mrocznym zamku (Dark Castle), korzystać z
symulatorów gier zręcznościowych (tenis, baseball, golf) a
także grać w szachy mając pod ręką encyklopedię słynnych
partii szachowych - możliwości rozrywkowe są
niewyczerpywalne. PowstajÄ… wersje klasycznych bajek
Andersena i Lewisa Carolla, znakomite filmy animowane,
musicale dla dzieci a nawet wersje poważnych dzieł, takich jak
baśń symfoniczna Piotruś i Wilk Sergiusza Prokofiewa.
Zastosowanie CD-ROMów pozwala połączyć przyjemne z pożytecznym - w czasie
zabawy dzieci dowiadują się o instrumentach muzycznych i orkiestrze. Dla najmłodszych
tworzy się wiele gier wymagających prostych operacji arytmetycznych czy ćwiczących
12 Fascynujący świat komputerów
pamięć. W języku angielskim powstał nowy wyraz - edutainment, coś takiego jak
 edurywka , czyli kombinacja edukacji (education) i rozrywki (entertainment). Firma
Europress zamierza wydać na CD-ROMach wszystkie popularne bajki.
Drugą wielką grupą programów są wydawnictwa informacyjne: encyklopedie, historia
muzyki jazzowej, dzieła Mozarta, IX Symfonia Beethovena wraz z partyturą, malarstwo,
galerie sztuki, wydawnictwa geograficzne i przyrodnicze. Miłośnicy sztuki mogą
obejrzeć na CD-ROMach kolekcję 130 tysięcy szkiców, akwarel i pasteli przechowywaną
w Louvre, łącznie z informacjami o artystach. Szef Microsoftu, Bill Gates, założył firmę
Corbis, do której należy obecnie prawo do rozpowszechniania elektronicznych wersji
milionów obrazów, w tym tych najsłynniejszych, zgromadzonych w
renomowanych galeriach, oraz wielu filmów. Firma Corbis ma
zamiar publikować zbiory dzieł sztuki na CD-ROMach. Miłośnicy
kinematografii znajdÄ… na dysku Cinemania informacjÄ™ o 19000
filmów ze zdjęciami, dialogami, opisami, danymi o 30 tysiącach
postaci świata filmu i wieloma innymi informacjami. Miłośnikom
golfa polecić można szczegółowy przewodnik po 700 polach
golfowych. Dla potrzeb medycznych Sony Medical Systems we
współpracy z amerykańską fundacją informacji medycznej
opracowała cała serię poradników medycznych. Są one instalowane
wamerykańskich szpitalach i zawierają specjalistyczne informacje
na temat różnych chorób oraz terapii stosowanych w ich leczeniu.
Dane te pochodzą z wieloletnich badań statystycznych prowadzonych w najlepszych
szpitalach amerykańskich. Pacjenci mogą obejrzeć szczegółowe zdjęcia różnych organów
wewnętrznych, dowiedzieć się jak funkcjonują i na czympolegają zaburzenia wywołujące
objawy chorobowe. Bez wątpienia takie poradniki staną się również popularne i w domu.
Niestety, najładniejsze wydawnictwa z estetycznego punktu widzenia (np. seria
 Eyewitness Encyclopedia wydawnictwa Dorling Kindersley) zawierajÄ… najmniej
konkretnych informacji i nadają się jedynie dla młodszych czytelników. Nawet na
CD-ROMie nie można zmieścić wielotomowej encyklopedii wraz z większą liczbą
sekwencji wideo i zdjęć dobrej jakości. Jedynie w przypadku wydawnictw
specjalistycznych, np. encyklopedii motyli, historii lotnictwa, specjalistycznych atlasów
geograficznych czy anatomicznych, można się spodziewać większej liczby szczegółów.
Atlasy i encyklopedie ogólnego użytku - historii, nauki, natury, muzyki, wynalazków -
są znakomite jako pomoc edukacyjna dla młodzieży. Atlasy świata zawierają nie tylko
mapy ale i zdjęcia, informacje statystyczne, sekwencje wideo pokazujące
charakterystyczne widoki z różnych części świata. Książka Davida Macauleya  Jak to
działa (Wydawnictwo Aódzkie) zrobiła karierę na całym świecie, ale dopiero w wersji
multimedialnej pozwala ona naprawdę zobaczyć, jak działają różne mechanizmy i jak
poskładać z dostępnych elementów użyteczną maszynę. Wydawnictwa tego rodzaju
zaczęto nazywać eksplorapediami, gdyż pozwalają one na eksplorację wiedzy, a nie
tylko jej przyswajanie, łącząc możliwości encyklopedii z interakcyjnym tworzeniem
nowych rozwiązań. Jeśli jednak potrzebujemy dobrego zródła informacji najlepiej
13 Fascynujący świat komputerów
zdecydować się na którąś z renomowanych encyklopedii, takich jak Encyclopedia
Brittanica. Kombinacja encyklopedii, słowników i atlasów na jednym dysku określana
jest mianem infopedia.
Wydawnictwo Naukowe PWN przygotowuje encyklopediÄ™ multimedialnÄ… opartÄ… o tekst
sześciotomowej Nowej Encyklopedii Powszechnej PWN i kilku innych encyklopedii.
Zawartych w niej będzie około 40.000 haseł (ponad 20% związanych z Polską), 4000
ilustracji, wiele sekwencji animowanej grafiki, kilkanaście minut archiwalnych
materiałów filmowych, próbki dzwiękowe głosów ptaków, instrumentów, wymowę
nazwisk. Encyklopedia powinna pojawić się w 1996 roku i działać na komputerach pod
systemem Windows 95. Planuje siÄ™ jej corocznÄ… aktualizacjÄ™. Krakowska firma
NeuroSoft wydała CD-ROM  Fryderyk Chopin. Życie twórcy , zawierający ponad 800
stron tekstów, 600 obiektów graficznych i prawie 40 minut muzyki. Autorem scenariusza
i tekstów jest prof. Mieczysław Tomaszewski z Akademii Muzycznej w Krakowie. Prace
nad tym dyskiem trwały prawie trzy lata.
TrzeciÄ… grupÄ… sÄ… programy wspomagajÄ…ce prace profesjonalne: prac wydawniczych
(DTP, obszerne biblioteki krojów czcionek, elementów graficznych), tworzenie muzyki,
grafiki, animacji. Również firmy wydające prasę zainteresowały się możliwościami
systemów wielomodalnych: Newsweek, jeden z najbardziej popularnych tygodników na
świecie, wydaje kwartalnik Newsweek Interactive na CD-ROMie. Wysokie ceny
osiągają przepisy prawne i dane dotyczące biznesu. Na jednym dysku można również
dostać setki programów sharewarowych przeznaczonych do wspomagania tworzenia
grafiki i muzyki.
Tworzenie oprogramowania wielomodalnego jest bardzo pracochłonne i wymaga
współpracy specjalistów z różnych dziedzin. Wielkim utrudnieniem jest konieczność
uzyskania zgody właścicieli praw autorskich na wszystkie teksty, muzykę, rysunki,
zdjęcia, zamieszczone w danym programie. Wydawcy książek muszą się również
troszczyć o ochronę praw autorskich, publikacje CD-ROMów mogą jednak być znacznie
większym przedsięwzięciem ze względu na ich wielką pojemność. Oprócz firm
komputerowych w tworzenie oprogramowania wielomodalnego zaangażowało się wiele
firm wydających książki.
Na CD-ROMach wydawane sÄ… roczniki wielu pism komputerowych, np. Network World.
Również gazety codzienne oferują roczny zbiór swoich wydań na CD-ROMie, np.
brytyjski dziennik The Daily Telegraph dostępny jest za 125 funtów. Pierwszymi
bazami danych na CD-ROMach w Polsce były zbiory aktów prawnych obowiązujących w
naszym kraju, wydane przez KancelariÄ™ PrawniczÄ… LEX. Wiele wydawnictw
zainteresowanych jest tÄ… formÄ… rozpowszechniania informacji. Po sukcesie CD-ROMu
Petera Gabriela wielu muzyków zainteresowało się możliwościami systemów
wielomodalnych, pozwalających śledzić nuty, umieszczać na płycie szczegółowe
informacje o wykonawcach i uzupełniać muzykę grafiką, animacjami i sekwencjami
wideo.
14 Fascynujący świat komputerów
Informacje zawarte na CD-ROMach mogą być uzupełnione o najbardziej aktualne
wiadomości dzięki podłączeniu do sieci Internet. Przy końcu 1995 roku pojawiły się
pierwsze multimedialne płyty wykorzystujące przeglądarki WWW do prezentacji
wielomodalnych uzupełnień zawartości CD-ROMu. Program CD-Link rozszerza te
możliwości o współpracę z odtwarzaczami kompaktowymi, pozwalając ilustrować
zarówno strony WWW jak i zawartość CD-ROMów muzyką z płyt kompaktowych.
1.5 Najciekawsze dyski CD-ROM
Omówienie wielu tytułów dostępnych na CD-ROMach znalezć można w pismach,
książkach, sieci Internet18 lub, wraz z demonstracjami, na CD-ROMach dołączanych do
pism o tematyce komputerowej (np. CD-ROM Directory on Disc publikowany przez
TFPL Publishing). Wspomnę tutaj tylko o najciekawszych tytułach ilustrujących pewne
tendencje w świecie programów wielomodalnych.
Literatura i Sztuka
A Hard Day's Night (Voyager) to klasyczny film Beatlesów na CD, łącznie ze
scenariuszem i historiÄ… powstania filmu.
Cinemania (Microsoft) to doskonały przewodnik po filmach, baza danych, zdjęcia,
fragmenty wideo i recenzje, informacje o aktorach i reżyserach.
Ghosts (Sony Psignosis) interesująco prezentowane opowieści o duchach!
Great Artists and Paintings (Attica Cybernetics) zawiera życiorysy i prace 58 słynnych
artystów.
Impressionism and its sources (EBook Inc.), czyli impresjonizm i jego zródła, to
historia tego nurtu w malarstwie, zawierająca ona 1000 zdjęć i muzykę Chopina i
Fauvre.
Le Louvre (BMG Interactive) to interakcyjny przewodnik po
Luwrze.
Microsoft Art Gallery to przewodnik po Gallerii Narodowej w
Londynie, z narracją, muzyką, animacją i oczywiście obrazami.
18
Pismo CD-ROM Today ma adres www.futurenet.co.uk/computing/CD-ROMToday
15 Fascynujący świat komputerów
Romeo and Juliet (Attica Cybernetics) to wersja dzwiękowa słynnej sztuki Szekspira,
przygotowana przez BBC, zawierajÄ…ca fragmenty wideo i komentarze do sztuki.
William Szekspir (Andromeda Interactive) zawiera pełny tekst
wszystkich dzieł Szekspira.
Woodstock (Time Warner Interactive) to historia, muzyka i
fragmenty filmu z najsłynniejszego festiwalu ery hippisów.
Gry
Bioforge (Electronic Arts) - gra przygodowa wyróżniająca się
bardzo dobrą trójwymiarową grafiką. Inne gry przygodowe warte
polecenia to Lands of Lore (Virgin), Little Big Adventure,
Shadowcaster, The Lost Files of Sherlock Holmes (Electronic Arts), Magic Carpet
(pozwala grać w modzie stereoskopowym w okularach), Syndicate+ (Bullfrog), Ultima
Underworld (Origin), Woodruff (Sierra On-Line), Ecstatica (Sony Psygnosis, tylko dla
dorosłych), MTV Club Dead (Viacom, również dla dorosłych), Descent, Dark Forces,
Indiana Jones, Loom, Secrets of Monkey Island (LucasArts). Firma Lucasa (twórcy
 Wojen Gwiezdnych ) wyprodukowała wiele znakomitych
gier. Na szybkim komputerze możliwości graficzne wszystkich
tu wymienionych gier sÄ… zdumiewajÄ…ce.
Discworld (Sony Psignosis) - ta gra jest pierwszym
przedstawicielem nowego gatunku gier, w której
pierwszoplanowÄ… rolÄ™ odgrywa mowa, znakomite dialogi i
monologii profesora magii wypowiadane z pięknym,
brytyjskim akcentem. Grafika nie pozostawia również wiele do
życzenia. Return to Zork (Activision) to druga gra
przygodowa zawierająca również sporo dobrych dialogów.
Cosmology of Kyoto zabiera nas do Kyoto sprzed tysiąca lat. Jest to trójwymiarowa gra
przygodowa, wymagająca zrozumienia japońskiego obrazu świata i szczegółowo
wyjaśniająca styl życia i wierzenia ludzi z tego okresu. Wędrujemy nie tylko po mieście
ale i przez sześć krain istnienia, światy demonów, goblinów i duchów. Dysk zawiera
informacje o pózniejszej historii odwiedzanych miejsc i zdjęcia, pokazujące ich obecny
wygląd. Wszystkie spotykane postacie mówią po japońsku, napisy są po angielsku.
Flight Unlimited (Virgin) to symulator lotu zachowujÄ…cy siÄ™ jak prawdziwy samolot.
Sceneria lotów powstała z prawdziwych zdjęć i robi bardzo realistyczne wrażenie.
Bardzo dobrym symulatorem samolotów z okresu I Wojny Światowej jest Dawn Patrol
(Empire Software), samolotów bojowych marynarki wojennej US Navy Fighters
16 Fascynujący świat komputerów
(Electronic Arts), Wing Commander 3 (Origin) a znudzonym zwykłymi samolotami
polecić można X-Wings Collectors Edition (Virgin) w stylu wojen gwiezdnych.
Symulacja wyścigów samochodowych NASCAR Racing (Papyrus) robi duże wrażenie.
Są nawet symulacje drużyny hokejowej NHL Hockey'95 (Electronic Arts) no i
oczywiście wiele dobrych programów do golfa, np. PGA Tour Golf (Electronic Arts).
SimTown jest grÄ… symulacyjnÄ…, ze znanej serii SimCity i SimWorld (Interplay).
Wszystkie trzy godne sÄ… polecenia, sÄ… to atrakcyjne gry symulacyjne, oparte na solidnej
wiedzy i modelach matematycznych rozwoju urbanistycznego i rozwoju świata.
ThemePark (Electronic Arts) to symulacja parku rozrywki, który trzeba rozbudować i
utrzymać.
Tuneland to przyjemne dziecięce piosenki i filmy animowane dla najmłodszych.
Encyklopedie, wydawnictwa informacyjne
i edukacja
3D World Atlas (Electronic Arts) to atlas świata
z fotografiami satelitarnymi i informacjami
statystycznymi i opisem poszczególnych krajów.
One World (Virigin) zawiera interakcyjne mapy
z wieloma informacjami o różnych rejonach
świata, łącznie z muzyką. National Geographic
opublikowało ładny atlas z fragmentami wideo i
muzyką o nazwie Picture Atlas of the World. Bardziej szczegółowe mapy zawiera
Global Explorer (Delorme), łącznie z planami niektórych miast. ITN European Atlas
(Attica Cybernetics) pozwala również na znaczne powiększanie fragmentów map. Inne
atlasy świata godne polecenia to Small Blue Planet (Now What Software) i World Atlas
(Mindscape).
Encarta (Microsoft) bardzo przydatna i doskonale zorganizowana encyklopedia, zawiera
26.000 artykułów, atlas, słownik i tezaurus. Jest to najwyżej oceniana encyklopedia
wielomodalna. Compton's Interactive Encyclopedia (Compton's New Media) zawiera
35.000 artykułów, atlas, słownik, 100 sekwencji wideo i 15 godzin dzwięku. Grolier
Encyclopedia (Grolier) oparta jest na The American Academic Encyclopedia i zawiera
dodatkowy dysk Animals! o życiu zwierząt. Podobnych rozmiarów są też encyklopedie
Hutchinson (Attica Cybernetics) i Information finder (World Books).
Bardziej edukacyjny charakter noszÄ… 3D Body Adventure (Knowledge Adventure), w
zasadzie atlas anatomiczny pozwalający na eksplorację ludzkiego ciała na
przestrzennych rysunkach i The Ultimate Human Body (Dorling Kindersley)
pokazujący jak działają różne systemy ludzkiego ciała. Family Doctor (CMC Research)
17 Fascynujący świat komputerów
to poradnik domowy odpowiadający na ponad 1000 pytań
dotyczących problemów ze zdrowiem, korzystający z licznych
zdjęć atlasu anatomicznego.
Specjalistyczne encyklopedie obejmujÄ… Aviation Adventure
(Knowledge Adventure) i Daring to Fly (Arnowitz Studio),
historię lotnictwa, Jets (Medio) historię wojskowych samolotów
(łącznie z biografiami projektantów), Warplanes (Maris
Multimedia) o samolotach wojskowych, SpaceAGE
Encyclopedia (Arts and Letters) dotyczącą wszystkich aspektów
lotów kosmicznych, Football Encyclopedia (Matra Hachette),
czyli encyklopedię piłki nożnej, New Dictionary of the Living World (MDI)
zawierającą 500.000 słów, zdjęcia i wideo encyklopedię świata roślin i zwierząt. Bardzo
solidnie opracowano encyklopediÄ™ nauki McGraw-Hill Encyclopedia of Science
(McGraw-Hill). Redshift (Maris Multimedia) to znakomicie opracowany przewodnik po
Systemie SÅ‚onecznym i okolicach.
Oxford English Dictionary (OUP) jest największym słownikiem języka angielskiego na
świecie, zawiera ponad 2.4 mln fraz ilustrujących użycie słów.
Book Bank CD-ROM (J. Whitaker and Sons) zawiera informacje bibliograficzne na
temat 700.000 książek wydanych w języku angielskim. TES Book Find (Head Software)
zawiera informacje na temat tylko 500.000 książek, za to z recenzjami.
Big Green Disc (MDI) omawia zagadnienia ekologiczne, bardzo dobra pomoc
edukacyjna. Bardziej szczegółowo zagadnienia ekologii traktują dyski Environment cz.
I, Woda i cz. II, Ziemia i powietrze (ILP). Last Chance To See (Voyager), czyli ostatnia
szansa by to zobaczyć, to dwa dyski CD-ROMbędące wynikiem podróży dookoła świata
znanego pisarza Douglasa Adamsa z Markiem Cawardine. Osobliwości świata ludzi
pokazuje dysk One Tribe (Virigin).
Nauka języków obcych: Japanese for biznesmens (Berlitz), Learn French with Asterisks
and Son (Eurotalk), Learn to Speak Spanish (Hyperglot) to jedne z najlepszych
programów do nauki japońskiego, francuskiego i hiszpańskiego (dla osób znających
angielski).
The even more incredible machine (Sierra Online) to dysk dla wynalazców. Mając do
dyspozycji liny, bloki, balony i inne przedmioty mamy rozwiązać 170 problemów.
Wymaga inwencji!
Prehistoria (Grolier) obejmuje 500 milionów lat rozwoju Ziemi i powstania około 500
gatunków zwierząt. Microsoft Dinosaurs to doskonale przygotowany dysk o
prehistorycznych gadach. Można je też obejrzeć na dysku 3D Dinosaur Adventure
18 Fascynujący świat komputerów
(Knowledge Adventure) i to w trzech wymiarach, używając w tym celu specjalnych
okularów.
Dangerous Creatures (Microsoft) pokazuje niebezpieczne zwierzęta wszystkich
kontynentów, zawiera piękne sekwencje wideo i wiele informacji. Sharks! (Discovery
Channel) skupia siÄ™ na rekinach a Whales and dolphins (MDI) na wielorybach i
delfinach. nie brakuje też dysków o zwierzętach lądowych, ptakach, motylach czy
żuczkach.
Różne przyjemności
Bacchus & Comus (Winesoft Clurxo) i Wines of the World (Multicom) to przewodniki
po winach z różnych zakątków świata. Zawierają informacje o produkcji, miejscach
pochodzenia i pokazują nalepki na około 2000 butelek.
Brief History of Time (W.H.Freeman) to książka Stevena Hawkinga, wydana w Polsce
jako  Krótka historia czasu . Tu ilustrowana jest dodatkowo przy pomocy zdjęć, narracji
i sekwencji wideo.
Cookbook Heaven (Most Significant Bits) zawiera ponad 20.000 receptur, omawia
różne diety i problemy zdrowotne. Dobry jest również Better Homes CD Cookbook
(Multicom) zawierający sekwencje wideo ilustrujące różne przepisy.
Guiness Book of Records (Mindscape) czyli księga rekordów Guinessa, jest znacznie
bardziej atrakcyjna w tej wersji niż na papierze.
Magic Eye (Mindscape) czyli komputerowa wersja trójwymiarowych obrazków z serii
 magiczne oko (fachowo nazywa się je autostereogramami), wraz z objaśnieniami, jak
się je projektuje i możliwością tworzenia własnych.
Star Trek Interactive Manual (ABLAC Learning) zabiera nas na statek kosmiczny
Enterprise. Ten serial popularny jest również i u nas, ale w USA ma swoich naprawdę
zagorzałych fanów.
The Way Things Work (Dorling Kindersley) czyli książka Davida Macauleya  Jak to
działa , znakomicie ilustrowana i animowana w wersji na CD-ROM.
Muzyka klasyczna doczekała się kilku dobrych dysków. Intro to Classical Music
(Attica Cybernetics) to życiorysy i próbki utworów 40 kompozytorów. Viking Opera
Guide tej samej firmy zawiera informacje o wszystkich operach, ponad 300 zdjęć i 3
godziny muzyki. Życie Beethovena i jego współczesnych omawia Beethoven and
Beyond (Voyage). Znakomicie przygotowany jest dysk z nagraniem  PiÄ…tej Symfonii
19 Fascynujący świat komputerów
tego kompozytora (Interactive Publishing), świetnie przygotowano również  Święto
Wiosny Strawińskiego i uwerturę  Rok 1812 Czajkowskiego.
Jazz - a multimedia history (Compton's New Media) zawiera historiÄ™ muzyki jazzowej
w latach 1923-1991, fragmenty utworów, zdjęcia i sekwencje wideo. Jazz nie doczekał
się jeszcze wielu publikacji. Więcej znalezć można na temat rocka: od wspominek
Rock'n Roll Years: The Fifties (Supervision), płyt o twórczości Boba Dylana, do
znakomitej płyty Xplora 1 (RealWorld) Petera Gabriela.
Historia
20th Century Video Almanac (Mindscape) to historia 20 wieku. Podobny charakter
dokumentujÄ…cy nasze czasy nosi dysk Changing Times (News Multimedia) zawierajÄ…cy
15.000 reportaży i ponad 1000 zdjęć z Timesa. Nie brakuje oczywiście historii drugiej
wojny światowej, World War II (Yorkshire TV/ILP) oraz World War II Encyclopedia
(Attica Cybernetics). Seven Days in August (Time Warner Ineractive) to historia muru
Berlińskiego. Najnowsza historia USA udokumentowana jest na dyskach opisujących
zamach na Kennedy'ego, wojnę w Wietnamie czy ilustrowanymi pamiętnikami
Haldemana (współpracownika prezydenta Nixona). ITN World News (Media Design
Interactive) publikuje od 1993 roku podsumowanie wydarzeń z całego roku na
CD-ROMach, podobnie robi Daily and Sunday Telegraph, a Newsweek Interactive
(Mindscape) publikuje swoje CD-ROMy kwartalnie. Financial Times sprzedaje roczniki
archiwalne swojej gazety.
Ancient Lands - świetny przewodnik po starożytnych cywilizacjach (Microsoft).
Cartoon History of the World (Putnam New Media), to popularna historia świata w
obrazkach na dwóch dyskach CD-ROM.
Dead Sea Scrolls (Hodder and Stoughton) zawiera fotografie i fragmenty wideo z okolic
Qumran nad Morzem Martwym, w którym znaleziono słynne zwoje. Odtworzono wygląd
starożytnego osiedla Khirbert Qumran, które można oglądać dzięki trójwymiarowym
animacjom. Szczegółowo przedstawiono samą historię odkrycia a tłumaczenia zwojów
połączone są ze zdjęciami oryginalnego tekstu i komentarzami ekspertów.
First Emperor of China (Voyager) to oczywiście wczesna historia Chin.
Incredible Cross Sections Stowaway (Dorling Kindersley) to szczegółowy opis życia na
XVIII-wiecznym statku wojennym, z licznymi przekrojami statku i rysunkami wnętrz.
Z punktu widzenia użytkownika, programy wielomodalne na CD-ROMach w połowie lat
90-tych dalekie były jeszcze od ideału. Jest to wynikiem wciąż niewystarczającej
20 Fascynujący świat komputerów
standaryzacji. Jedynie najszybsze komputery i napędy CD-ROMów o poczwórnej lub
wyższej prędkości działają w miarę szybko i bez zacinania się. Komputer z procesorem
Intela 486 z zegarem 33 MHz bez pomocy specjalnego koprocesora może pokazać 15
klatek w ciÄ…gu sekundy, dopiero 90-MHz Pentium
wystarczy, by odtwarzać pełnoekranowe sekwencje wideo
z szybkością 25 klatek na sekundę, tak jak robi to
telewizja. Nawet jeśli dysponujemy najnowszym
komputerem o dużej mocy obliczeniowej pojawi się inny
problem. Obejrzenie jednego demonstracyjnego
CD-ROMu pozostawia na dysku wiele śmieci, które
trudno potem wytropić i usunąć, wgrywa się przy tym i
instaluje liczne sterowniki do odtwarzania wideo,
kompresji obrazu i dzwięku. Pracując w środowisku MS-Windows po paru dniach
oglądania CD-ROMów naliczyłem takich sterowników (w tym kilka prawie identycznych
wersji o nieznacznie różniących się nazwach) aż piętnaście! Zwalnia to oczywiście pracę
systemu zabierając niepotrzebnie pamięć RAM i pamięć dyskową.
Najbardziej wyrafinowane metody wielomodalne prowadzÄ… do tworzenia  wirtualnych
światów , o których głośno w środkach masowego przekazu.
1.6 Cyberspace czyli wirtualna rzeczywistość.
 Życie w przestrzeni wirtualnej stanie się możliwe w ciągu następnych dziesięciu lat.
Pewną namiastką jest obecnie życie w sieci (opisane w rozdziale o komunikacji).
Budowane obecnie systemy przestrzeni wirtualnej sÄ… na razie bardzo proste - tworzenie
trójwymiarowej grafiki jest niezwykle pracochłonne i zajmuje bardzo dużo pamięci a jej
dekodowanie i tworzenie obrazu wymaga wielkich mocy obliczeniowych. Dodatkowo
urządzenia do  zanurzania się w wirtualnej rzeczywistości, wrażliwe są na położenie
ciała i ruchy kończyn, wymagają więc odpowiednich rękawic. Wyciągnięciu ręki i
złapaniu jakiegoś przedmiotu odpowiada w wirtualnej rzeczywistości podobne zdarzenie.
Obrót czy pochylenie głowy odpowiednio zmienia widziany obraz.
Stereoskopowy obraz oglądać można przy pomocy hełmu (HMD, Head Mounted Display)
lub urządzenia projekcyjnego określanego jako CAVE (jaskinia). Obraz w jaskini
pojawia się na suficie i ścianach. Ponieważ osiągnięcie odpowiednio dużej rozdzielczości
na tak dużych powierzchniach jest bardzo kosztowne jaskiń takich zbudowano
dotychczas bardzo niewiele. Hełmy stosują zwykle wyświetlacze ciekłokrystaliczne.
Crystal Eyes (SteroGraphics Corp) daje bardzo dobre efekty przestrzenne korzystajÄ…c
tylko z jednego ekranu w hełmie. Obraz przełączany jest w zsynchronizowany sposób
tak, że widziany jest raz przez jedno a raz przez drugie oko. Okulary i-glasses! (Virtual
I/O) są częściowo przezroczyste pozwalając na nakładanie obrazu świata wirtualnego na
21 Fascynujący świat komputerów
rzeczywisty. Jest to stosunkowo tanie i wygodne urządzenie o dobrej zdolności
rozdzielczej. Bardzo funkcjonalny hełm VR4 (Virtual Research Systems) kosztuje więcej
niż porządny komputer.
Użytkownik może korzystać z sześciu stopni swobody ruchu, tj. trzech kierunków
(lewy-prawy, góra-dół, przód-tył) i trzech obrotów w przestrzeni. Może również
oddziaływać z przedmiotami znajdującymi się w sztucznym świecie wirtualnej
rzeczywistości. Nieco prostsze systemy dają tylko trzy stopnie swobody (bez obrotów).
Należy do nich Spaceball (Spacetec IMV), urządzenie zawierające kulę, którą można
poruszać w przestrzeni, a więc rodzaj trójwymiarowego  kota . Sześć stopni swobody
dzięki pochyleniom i obrotom daje CyberMan 3D Controller (Logitech), rodzaj myszy na
drążku. Oprócz urządzeń sterujących w hełmach i rękawicach montowane są urządzenia
śledzące ruch człowieka. Do rejestracji ruchu używa się ultradzwięków, fal radiowych i
systemów laserowych. FasTRAK (Polhemus) to zestaw czujników umieszczanych na
głowie, rękach czy klatce piersiowej, wysyłających sygnały radiowe do odbiornika
odłączonego do portu szeregowego. Flock of Birds (Ascension Technology Corporation)
wykorzystuje czujniki magnetyczne do śledzenia pozycji. Dzięki takim czujnikom
programy wirtualnej rzeczywistości mogą określić, gdzie się znajdujemy. Wprowadzanie
danych w czasie przebywania w wirtualnym świecie ułatwia klawiatura BAT Personal
Keyboard (Inforgrip). Można ją trzymać wjednymręku i korzystając z jej 7 przycisków
wydać dowolne polecenie przez naciskanie kombinacji klawiszy (akordów, jak określa to
producent).
Wymagania dotyczące szybkości przetwarzania danych graficznych przy tworzeniu
rzeczywistości wirtualnej są bardzo wysokie, stąd potrzeba specjalnych kart i
przyspieszaczy graficznych. Karty graficzne, takie jak MGA Impression (Matrox
Graphics), współpracują z bibliotekami elementów graficznych OpenGL, 3DR i innymi
obsługując takie funkcje jak cieniowanie i buforowanie obrazów. Obsługa obrazów
najwyższej jakości, tworzenie 24-bitowych tekstur, cieniowanie i tworzenie
półprzezroczystych obiektów przyspieszają karty graficzne firmy Evans and Sutherland,
przeznaczone dla magistrali PCI. Dla tej magistrali buduje również karty firma Future
Visions Technologies, oferując cały szereg efektów specjalnych, np. efektów
atmosferycznych. Do współpracy z takimi kartami potrzebny jest komputer oparty na
Pentium i przynajmniej 32 MB pamięci
RAM. Komputery przeznaczone
specjalnie do zastosowań graficznych
korzystają z bardziej wydajnej pamięci
VRAM zamiast pamięci dynamicznej
DRAM. Karty dzwiękowe zdolne do
obsługiwania kilku zródeł dzwięku
jednocześnie pozwalają na tworzenie
iluzji dzwięku przestrzennego. IBM do
spółki z firmą Virtuality oferuje zestaw
do rzeczywistości wirtualnej złożony z
22 Fascynujący świat komputerów
komputera IBM, odpowiednich kart
przyspieszających, hełmu, urządzenia
śledzącego i wprowadzającego oraz
oprogramowania.
Tworzenie wirtualnej rzeczywistości
wymagało początkowo pakietów
programów dostępnych na graficznych
stacjach roboczych. Wyróżniają się
wśród nich programy na komputery
firmy Silicon Graphics, takie jak Amaze
lub DVS. Cena takiego oprogramowania
dorównuje na razie cenie samych stacji
roboczych. Nie jest to tylko oprogramowanie wspomagające tworzenie trójwymiarowej
grafiki ale i manipulacji obiektami w wirtualnej przestrzeni, unikania kolizji, śledzenia
ruchu wirtualnych obiektów, definiowanie ich hierarchii, synchronizacji dzwięku ze
zdarzeniami. Eksperymentalne oprogramowanie tego typu opracowała ostatnio również
firma IBM z myślą o zastosowaniach edukacyjnych i naukowych, np. do treningu
lekarzy. W 1995 roku pojawiło się również sporo pakietów na komputery osobiste. Ich
ceny nie przekraczają zwykle cen dobrych pakietów graficznych.
WalkThrough Pro i Virtus VR (obydwa firmy Virtus) to stosunkowo proste pakiety
przeznaczone dla środowiska Windows na szybkich komputerach osobistych. Używając
interfejsu graficznego możemy budować wirtualny świat korzystając z obiektów
zawartych w bibliotece tych programów. Programy te przeznaczone są przede wszystkim
do tworzenia modeli budynków, domów mieszkalnych, biur czy fabryk. Wnętrza można
umeblować, położyć dywany i tapety, zmienić tapicerkę mebli. Program Superscape VRT
(Superscape) działa zarówno w systemie DOS jak i Windows integrując obraz z
dzwiękiem i możliwościami tworzenia własnych animacji i płynnych przekształceń
(morfingu), określania parametrów ruchu, elastyczności obiektów czy siły przyciągania
grawitacyjnego. VRCreator (VREAM) zawiera narzędzia do tworzenia trójwymiarowych
obiektów i powiązań między nimi. Szczególnie dobre są możliwości cieniowania i
tworzenia tekstur. Pierwotnie program korzystał głównie z języka skryptów, ale
udoskonalony interfejs graficzny pozwala na ominięcie programowania przy
definiowaniu większości czynności.
Wirtualna rzeczywistość nie służy tylko rozrywce: możliwe stanie się  wejście we
wnętrze wirtualnego ciała człowieka i poznanie go  od środka przez studentów
medycyny, śledzenia procesów chemicznych i fizycznych w mikroświecie. Pakiet
WorldToolKit (Sense8) zamienia dane finansowe dotyczące giełdy w trójwymiarowe
obiekty graficzne. Pakiet ten działa na wielu platformach sprzętowych, obsługuje niemal
wszystkie rodzaje interfejsów rzeczywistości wirtualnej (hełmy, urządzenia śledzące i
trójwymiarowe myszy, dzwięk przestrzenny) i współpracuje z takimi językami
programowania jak Visual C++. Program Open Inventor (NeTPower Inc) korzysta
23 Fascynujący świat komputerów
również z zestawu narzędzi w języku C++ do tworzenia i manipulowania obiektami.
Informacje dotyczące świata wirtualnego przechowywane są w zorientowanej obiektowo
bazie danych. Open Inventor pozwala również korzystać z biblioteki struktur
trójwymiarowych OpenGL. Autodesk, firma znana przede wszystkim dzięki
oprogramowaniu AutoCAD, wchodzi również na ten nowy rynek oprogramowania do
tworzenia wirtualnej rzeczywistości. Program CDK (Cyberspace Developer Kit)
przeznaczony jest dla programistów języka C++. Dostarczono w nim klasy obiektów
pozwalających definiować prawdziwe oddziaływania fizyczne pomiędzy obiektami,
uwzględniające ciążenie, sprężystość, tarcie czy zderzenia. CDK importuje animacje
stworzone przez program do trójwymiarowej grafiki 3D Studio.
Projektowanie nowych obiektów, możliwość symulacji rzeczywistości przed tworzeniem
ostatecznych konstrukcji stanie się na pewno nowym celem architektów. Można sobie
wyobrazić cyber-wycieczki do starożytnych Aten czy Rzymu. Pierwszym poważnym
projektem tego rodzaju jest model benedyktyńskiej bazyliki Cluny, przez ponad 800 lat
najpotężniejszej świątyni chrześcijańskiej. Zniszczona całkowicie w czasach rewolucji
francuskiej bazylika została bardzo szczegółowo zbadana przez archeologów. Na
podstawie ich szkiców i opisów powstał komputerowy model, pozwalający na zwiedzanie
wnętrza. Ponieważ niewiele wiadomo o jego wyglądzie, o freskach i malowidłach na
ścianach, wnętrze jest dość surowe a nieliczne obrazy rozmyte, podkreślając naszą
niewiedzę. Korzystając z rękawic z czujnikami można zmierzyć rozmiary elementów
architektonicznych własnymi rękami!
Bardzo ciekawe zastosowanie wirtualnej rzeczywistości zaproponowała amerykańska
firma specjalizująca się w produkcji robotów. Za 120 mln dolarów zamierza ona wysłać
robota na księżyc i sterować go przy pomocy sprzętu wirtualnej rzeczywistości. Jest to
przedsięwzięcie komercyjne, gdyż firma zamierza sprzedawać czas wszystkim chętnym,
pozwalając im na obecność i odkrywanie nowych obszarów księżyca. Już teraz można
spotkać w węzłach WWW teleskopy, mikroskopy i inne urządzenia, którymi możemy
sterować na odległość wybierając kierunek i powiększenie - teleskop taki dostępny jest
np. w Honolulu, obraz oglądany przez ten teleskop może być przesłany na ekran
dowolnego komputera używającego oprogramowania WWW. Wiele poważnych
projektów badawczych wykorzystuje teleobecność do prowadzenia obserwacji na
odległość, np. wspomniany w rozdziale o wykorzystaniu globalnych sieci
komputerowych projekt JASON wykorzystujący sprzęt satelitarny. Pierwsze zastosowania
komercyjne wirtualnej rzeczywistości pokazano na targach Telcom'95 w Genewie.
Sprzedawca w Genewie oprowadzał klientów znajdujących się w Singapurze po sklepie z
zegarkami!
Tworzenie oprogramowania dydaktycznego tego rodzaju należy jednak do dalszej
przyszłości - pojawienie się tańszych systemów do tworzenia wirtualnej rzeczywistości
spowoduje zapewne rozwój ruchu amatorskiego podobnego do  sceny amigantów .
Konieczne są jednak standardy i nowe języki programowania. Znaczącym krokiem w
tym kierunku było wprowadzenie języka modelowania wirtualnej rzeczywistości VRML
24 Fascynujący świat komputerów
(Virtual Reality Modelling Language). Firma Silicon Graphics, korzystając z tego języka,
opracowała program WebSpace, będący przeglądarką WWW pozwalającą na
oddziaływanie z trójwymiarowymi obiektami. Kilka przykładów takich wirtualnych
światów obejrzeć można pod adresami WWW Silicon Graphics, http://www.sgi.com,
gdzie dostępne jest również oprogramowanie WebSpace (niestety, tylko na stacje Silicon
Graphics). Inne przykłady wykorzystania światów wirtualnych w WWW znalezć można
na stronach http://www.sd.tgs.com/~template oraz http://www.ziff.com~pcmag
dostępnych przez dowolną przeglądarkę WWW. Oprogramowanie SceneCreator
(Template Graphics Software) powinno umożliwić tworzenie wirtualnych światów w
WWW (na razie jednak bez możliwości posługiwania się rękawicami czy
stereoskopowymi obrazami) interakcyjnie konstruując programy w języku VRML, będzie
to więc rodzaj Visual Basicu dla trójwymiarowej grafiki, z którą można oddziaływać. W
oparciu o ten język powstało już wiele trójwymiarowych obiektów.
Do wiekszości przeglądarek WWW dołączyć można oprogramowanie pomocnicze, takie
jak WebFX (dostępne w polskich archiwach), pozwalające poruszać się w writualnych,
trójwymiarowych światach, wchodzić do pomieszczeń, oglądać je z różnych stron.
Ponieważ obiekty VRML budowane są z typowych, przechowywanych lokalnie
elementów graficznych poruszanie się po węzłach Internetu zawierających
trójwymiarowe obiekty nie jest wolniejsze niż wędrówka po węzłach zawierających
zwykłe elementy graficzne. Również wpolskich węzłach WWW zaczynają się pojawiać
pierwsze trójwymiarowe obiekty stworzone przy pomocy języka VRML.
Virtual World to pierwszy cyfrowy park rozrywki. Można go znalezć w Internecie pod
adresem http://www.virtualworld.com/ Goście wirtualnych światów - co roku planowany
jest przynajmniej jeden nowy świat - zwani pilotami, mogą oddziaływać w
trójwymiarowej rzeczywistości z wieloma przedmiotami oraz z innymi pilotami, dzięki
czemu każda przygoda jest odmienna i nieprzewidywalna. W każdym środowisku mamy
do czynienia z różnymi warunkami klimatycznymi, zmieniają się pory dnia, można
korzystać z różnorakich map. Co roku najlepsi piloci spotykają się w normalnej, a nie
wirtualnej, rzeczywistości i organizują międzynarodowe mistrzostwa. Idee światów
wirtualnych rozwijane są przez FASA Corporation, firmę, która założyła w USA oraz
Japonii i Australii kilka ośrodków wyposażonych w sprzęt  Tesla VR do wirtualnej
rzeczywistości - są to zamknięte, obracające się symulatory wyposażone w liczne
przyrządy nawigacyjne i połączone w grupy po osiem. Planuje się satelitarne połączenia
rozrzuconych po świecie ośrodków. Piloci rozgrywają zawody między sobą spotykając się
w wirtualnym świecie. Firma rozwija też oprogramowanie do realistycznego
przedstawiania trójwymiarowych obiektów. Piloci zrzeszeni są w Wirtualnej Lidze
Geograficznej, podobno wywodzącej się z założonej w 1897 roku przez Nicola Teslę i
Grahama Bella tajnej organizacji zmierzajÄ…cej do odkrycia i eksploracji innych
wymiarów.
Rzeczywistość wirtualna znalazła nieoczekiwane zastosowania. W amerykańskich
gabinetach dentystycznych zaczęto pacjentom nakładać okulary  virtual i-glasses i
25 Fascynujący świat komputerów
odwracać uwagę od zębów prezentując filmy i programy w czasie zabiegów
dentystycznych. Od 1993 roku wychodzi w San Franciso pismo Future Sex, zajmujÄ…ce
siÄ™  erototronikÄ… i cyberseksem !
1.7 Karty dzwiękowe
Karty dzwiękowe i dobry zestaw głośników coraz częściej stanowią standardowe
wyposażenie komputerów. Umożliwiają one przetwarzanie sygnałów muzycznych i
mowy na zapis cyfrowy, korzystając przy zapisie z układów elektronicznych typu ADC
(Analog to Digital, czyli  analogowe na cyfrowe ) i przy odtwarzaniu z DAC (Digital to
Analog, czyli odwrotnie, z cyfrowego na analogowe). Karty 8-bitowe oferujÄ… niewielkie
możliwości, gdyż każda próbka dzwięku może przyjmować zaledwie 256 różnych
wartości. Na płytach kompaktowych przyjęto zapis 16 bitów 44 tysiące razy w ciągu
sekundy (44.1 KHz). Taki zapis dzwięku wysokiej jakości zajmuje oczywiście bardzo
dużo pamięci (prawie 90 KB na sekundę). Rozwinięta w latach 70-tych technika MIDI
(Musical Instruments Digital Interface) omija te problemy. Zamiast zapisu samego
dzwięku zapisuje się bowiem tylko wskazówki, w jaki sposób ten dzwięk wytworzyć lub
jakich dzwiękowych próbek użyć. Można to przyrównać do bardzo szczegółowej
partytury muzycznej, która określa jak wykonać dany utwór, przy użyciu jakich
instrumentów, w jakim tempie, tonacji, jak głośno. Godzina tak zapisanej muzyki nie
zajmuje więcej niż 0.5 MB.
Jedną z bardziej popularnych kart, pozwalających uzyskiwać wysokiej klasy efekty
dzwiękowe na komputerach osobistych jest Sound Blaster. Wyposażony w układy
syntezy dzwięku FM (Frequency Modulation) pozwala na generowanie głosów 128
instrumentów, sterowanie zewnętrznymi instrumentami przez sprzęg MIDI oraz cyfrowe
nagrywanie dzwięku (wbudowany konwerter analogowo-cyfrowy A/D pozwala na
nagrywanie głosu lub innych dzwięków z częstością próbkowania do 23 KHz przy
8-bitowej kwantyzacji (Sound Blaster Pro i Sound Blaster 16 pozwalajÄ… na zapis z
jakością podobną do płyt kompaktowych i przyłączenie CD-ROMu). Większość z
dostępnych na rynku kart muzycznych potrafi emulować kartę Sound Blaster.
Karty UltraSound (Gravis) i SoundBlaster AWE32 (Creative Labs) mogą odtwarzać
16-bitowy dzwięk cyfrowy. Zamiast korzystać z generatora dzwięków FM, jak robi to
większość innych kart, karty te używają naturalnych próbek dzwięków, czyli stosują
syntezę WT (WaveTable, opartą na tabelach z próbkami dzwięku). Ponieważ dzwięk nie
jest tworzony sztucznie lecz wykorzystuje się dzwięki naturalne osiąga się w ten sposób
bardzo dobre efekty. Tabele próbek dzwiękowych wymagają (pomimo zastosowania kom-
presji) około 1 MB ROM i zawierają próbki dzwięku prawie 300 instrumentów, w tym
około 100 perkusyjnych, oraz około 50 efektów specjalnych. Nowe próbki dzwięku
można dokupić na dyskietkach. Specjalne możliwości tworzenia trójwymiarowego
26 Fascynujący świat komputerów
dzwięku  holograficznego wywołują entuzjazm wśród młodzieży. System SRS (Sound
Retrival System) wykorzystuje model ucha i efekty psychoakustyczne do tworzenia
realistycznych trójwymiarowych dzwięków przy wykorzystaniu tyko dwóch głośników.
Karty wykorzystujące próbki dzwięku umożliwiają też często odtwarzanie muzyki
zapisanej w formacie MIDI, który zakładał początkowo sterowanie prawdziwym
syntezerem MIDI. Podobne możliwości ma coraz więcej kart muzycznych dzięki
odpowiedniemu oprogramowaniu. Jako ciekawostkę warto dodać, że również dzięki
oprogramowaniu karta Ultrasound emuluje kartÄ™ Sound Blaster.
Dążenie do scalania funkcji kart rozszerzających doprowadziło do pojawienia się kart
spełniających funkcje modemu, faksu, automatycznej sekretarki i przetwarzania dzwięku.
Karta Media Manager zawiera jeden procesor sygnałowy (DSP) do wszystkich
skomplikowanych zadań oferując zgodność z kartą Sound Blaster, szybkości przesyłu
danych do 28.8 Kb/s, odbiór i wysyłanie faksów, funkcje elektronicznej sekretarki i
możliwość przyłączania zewnętrznego napędu CD-ROM. Karta SoundExpression ma
podobne uniwersalne możliwości: działa jako modem 14.4 Kb/s, faks, karta dzwiękowa
typu Sound Blaster, łącznie z funkcjami MIDI, obsługę telefonu z przywoływaniem
rozmówców i pocztę głosową do tysiąca skrytek.
1.8 Przykłady systemów wielomodalnych
W zastosowaniach wielomodalnych komputery muszą przetwarzać informacje
dzwiękowe i wizualne w czasie rzeczywistym. Stawia to wysokie wymagania w stosunku
do sprzętu. Ponieważ rynek komputerów osobistych jest najbardziej interesujący z punktu
widzenia liczby systemów dających się masowo sprzedać, najwięcej urządzeń
wielomodalnych konstruuje się do współpracy właśnie z komputerami osobistymi. Pewne
urządzenia pracują również samodzielnie (szczególnie te przeznaczone dla rozrywki) lub
w oparciu o stacje robocze. Sytuacja na rynku takich urządzeń zmienia się z miesiąca na
miesiąc. W wielu przypadkach nowe możliwości uzyskać można przez prostą rozbudowę
zakupionego systemu, ale nie zawsze.
Pierwszy odtwarzacz CD-I wprowadzono na rynek USA przy końcu 1991 roku. W
Europie pierwszy model wprowadzony został przez Philipsa. Firma ta udziela licencji na
używanie nazwy CD-I. Modele odtwarzaczy CD-I sprzedawane przez pierwsze 2 lata nie
umożliwiały odtwarzania obrazów wideo, oferując jedynie grafikę i dzwięk. Dopiero
modele wprowadzane na rynek w 1993 roku pozwalają na dołączenie przystawki
umożliwiającej odtwarzanie sekwencji wideo (FMV, czyli Full Motion Video). Pojawiły
się przenośne odtwarzacze o niewielkiej masie (poniżej 2 kg), wyposażone w kolorowe
ekrany LCD. Odtwarzacze CD-I przyłączyć można do komputera, ale również
bezpośrednio do telewizora (przez złącze Euro-AV lub wyjście wideo) lub monitora i
sprzętu hifi. Obecnie wiele firm oferuje odtwarzacze CD-I, a Motorola przewiduje
27 Fascynujący świat komputerów
wprowadzenie w 1995 roku jednego obwodu scalonego realizujÄ…cego wszystkie
elektroniczne funkcje takiego urzÄ…dzenia.
Jednym z pierwszych popularnych systemów wielomodalnych jest sprzedawany przez
firmÄ™ Commodore system CDTV (Commodore Dynamic Total Vision), kombinacja
komputera Amiga 500 i czytnika CD-ROM. Do obsługi tego urządzenia nie jest
konieczna klawiatura komputera, można z niego korzystać równie łatwo jak z
telewizyjnego teletekstu. Sprzedawane są również monitory z ekranem wrażliwym na
dotyk. Tańszym i bardziej uniwersalnym rozwiązaniem jest jednak rozszerzanie
możliwości komputerów o otwartej architekturze, takich jak komputery klasy IBM-PC
czy Macintoshe. Oprócz odpowiedniego oprogramowania należy je wyposażyć w karty
muzyczne i czytniki CD-ROMów Należy przy tym zadbać o zgodność z standardem
Multimedia PC. Główne wymagania dotyczą szybkości transmisji danych z CD-ROMu
(przynajmniej 150 KB/s) i czasu dostępu do danych (poniżej 1 sekundy). Mikroprocesor
komputera nie powinien być zanadto obciążony komunikacją z CD-ROMem, stąd
wymaga siÄ™ przynajmniej procesora i386SX, 2 MB RAM. Wymagania stawiane kartom
dzwiękowym nie są wysokie (częstość próbkowania 22 KHz, 8-bitowa kwantyzacja).
Komputery zgodne z zalecanym standardem ustalonym przez międzynarodową grupę
producentów Mulitmedia PC Market Council, w której wiodącą rolę odgrywa Microsoft,
oznaczane sÄ… znakiem  MPC, Mulitmedia PC
Standardem oprogramowania wielomodalnego stanowiącego niezależne od sprzętu
rozszerzenie systemu operacyjnego Macintosha jest QuickTime. Pozwala on na
integrację dzwięku, animacji i wideo w cyfrowe filmy, poza tym system określa sposób
używania obiektów zmiennych w czasie (obiektów dynamicznych) traktujące je jako
nowy rodzaj danych. W architekturze systemu Quick Time wyodrębnić można 4
elementy: oprogramowanie systemowe, formaty plików, kompresję i dekompresję plików
i system dialogu i narzędzi użytkownika.  Film w terminologii Quick Time to zbiór
różnych typów danych dynamicznych - w praktyce może to być pokaz slajdów,
animowane wykresy, dane laboratoryjne itp. Grupy danych jednego typu zorganizowane
są w ścieżki, odwołujące się do nośników danych takich jak taśma wideo czy dysk
CD-ROM. Quick Time synchronizuje te  ścieżki odtwarzając film. Przyjęto rozszerzony
format PICT, program współpracuje również z Photo CD Kodaka. Zastosowano kilka
algorytmów kompresji, między nimi JPEG do grafiki PICT. System dialogu i narzędzia
pozwalają na przeglądanie obiektów dynamicznych, definiowanie klas, oraz
rejestrowanie zewnętrznych urządzeń do których odwoływać może się program. Takie
podejście umożliwia całkowitą niezależność od sprzętu - program żąda pewnych usług a
system zarzÄ…dzajÄ…cy konfiguracjÄ… sprawdza, czy jest jakiÅ› sterownik pozwalajÄ…cy na
wykonanie takich usług.
W 1992 roku wprowadzono kilka ciekawych odtwarzaczy CD, pozwalających odtwarzać
obrazy bezpośrednio na ekranie telewizora. VIS (Video Information System) firmy
Tandy, obsługiwać można zdalnym sterownikiem telewizora ( pilotem ). System
korzysta z mikroprocesora 80286 i wersji Windows (Modular Windows), pozwalajÄ…c
28 Fascynujący świat komputerów
programistom opracowującym wielomodalny materiał dla tego systemu na korzystanie z
narzędzi programowania w standardowym MS-Windows. Tandy nie chce sprzedawać
tego systemu jako komputera, ale urządzenie domowe. Można do niego podłączyć karty
rozszerzeń, np. szybką kartę graficzną czy modem. Urządzenie Philipsa zbudowane jest
w oparciu o procesor Motoroli 68000 i można je nie tylko podłączyć do telewizora, ale
ma również wbudowany ekran. Wyposażone jest w port szeregowy i można na nim
odtwarzać ruchome sekwencje wideo.
Najnowsza technologia pojawia się również w urządzeniach przeznaczonych przede
wszystkim do gier. Takie firmy jak Nintendo czy Sega wprowadzajÄ… w swoich konsolach
do gier 32-bitowe mikroprocesory i szybkie procesory graficzne. Najpotężniejszą
maszynę tej klasy wprowadzić zamierza Atari. Model Atari Jaguar oparty będzie na
64-bitowym procesorze RISC, pozwalając na szybką animację trójwymiarowych
obiektów. Również Nintendo, przy współpracy z Silicon Graphics, ogłosiło swoje plany
pracy nad takim systemem do gier wideo. Będzie to kolejny, wielki krok w stronę
fotorealizmu. Należy się spodziewać uwzględnienia takich efektów jak położenie zródła
światła czy metamorfoza jednego obiektu w drugi (morphing).
Systemy wielomodalne wkraczają w świat komputerów od dwóch stron: z jednej strony
przez doskonalenie komputerowych systemów dialogu z użytkownikiem, z drugiej strony
przez komputeryzację urządzeń domowych. Procesory tekstu wyposaża się w pomocnicze
programy pozwalające na głośne czytanie tekstu przez odpowiednią kartę dzwiękową.
Telewizory wyposażone są w coraz bardziej rozbudowane urządzenia pozwalające na
programowanie ich pracy oraz pamiętanie i odtwarzanie stron teletekstu, cyfrową
obróbkę obrazu a wkrótce również filtry pozwalające na odszukanie interesujących nas
programów wśród kilkudziesięciu dostępnych przez telewizję kablową lub satelitarną
kanałów. Stosunkowo tanie kamkodery wyposaża się wurządzenia do cyfrowej obróbki i
montażu obrazu.
Oprogramowanie muzyczne jest częścią systemów wielomodalnych, zajmujemy się nim
bliżej w rozdziale poświęconym komputerowym hobby. Piszemy tam o sekwenserach i
kontroli syntezerów muzycznych przez komputer. Warto tu wspomnieć o panującej
obecnie modzie na śpiewanie znanych utworów do podkładu muzycznego pozbawionego
głosu prawdziwego wykonawcy (nazywa się to  karaoke , gdyż jest to wynalazek
japoński i tam kluby karaoke spotkać można na każdym kroku). Doskonale nadają się do
tego celu systemy CD-I pokazujÄ…ce w czasie odtwarzania muzyki nuty, tekst, grafikÄ™ i
fragmenty wideo z występu oryginalnego zespołu czy wykonawcy.
Video frame grabers to specjalne karty do komputerów pozwalające na  zamrożenie
obrazu z kamery wideo i zapisaniu go w postaci pliku. Obraz taki można przetwarzać
przy pomocy standardowych programów graficznych. Zapisanie całej serii ruchomych
obrazów wymaga bardziej wyrafinowanych możliwości i większej szybkości działania
karty oraz dysku. Ceny takich kart nie są zbyt wysokie (około 500 $).
29 Fascynujący świat komputerów
Najbardziej popularnym środowiskiem dążącym w kierunku systemów wielomodalnych
jest oczywiście MS-Windows. Już Windows 3.1 ma duże możliwości dzwiękowe,
umożliwiając posiadaczom kart dzwiękowych odtwarzanie muzyki wysokiej jakości i
nagrywanie głosu i muzyki przez mikrofon. Dużym krokiem w tym kierunku jest
wprowadzenie Windows Sound System, składającego się z oprogramowania, karty,
mikrofonu i słuchawek. Pakiet ten oferuje nie tylko możliwości nagrywania komentarzy
słownych i tworzenia obiektów dzwiękowych, lecz również odczytywanie danych głosem
i układ analizy mowy, pozwalający na wydawanie głosem poleceń oprogramowaniu!
Odczytywanie danych przydaje się nie tylko ludziom z wadami wzroku, ale może być
pomocne np. przy sprawdzaniu poprawności wpisywanych do programu liczb. Tworzenie
dzwięku sterowane jest na tej karcie wbudowanym syntezerem OPL3 Yamahy.
Nagrywanie możliwe jest przy kwantyzacji 4, 8 i 16-bitowej z częstością 22 KHz,
wymagając, odpowiednio do jakości, 11, 22 lub 44 KB pamięci dyskowej na sekundę
nagrania.
Inne pakiety pozwalające rozpoznawać głos to prosty i tani pakiet VoiceType Control
for Windows oferujący 32 wbudowane i 32 wybierane przez użytkownika słowa, które
rozpoznawane są przy współpracy z kartą Sound Blaster; IBM VoiceType 2 for DOS
zawierający słownik 5000 wyrazów, rozszerzalny przez użytkownika o kolejne 2000
wyrazów i pozwalający na komputerach klasy 386 na tworzenie głosem typowych
dokumentów dla biznesu; oraz najbardziej zaawansowany IBM Speech Server Series, w
wersji jednostanowiskowej rozpoznający 20000 słów a wielostanowiskowej 32000. Ten
ostatni system wymaga do pracy stacji roboczej z serii IBM RS/6000 i pozwala na
dyktowanie z prędkością do 70 słów na minutę.
Pakiet oprogramowania Video for Windows Microsoftu umożliwia nagrywanie obrazów
wideo z kamkodera lub magnetowidu. Microsoft przy współpracy z wieloma innymi
firmami lansuje standard MPC tworzenia oprogramowania systemów wielomodalnych.
IBM lansuje swój własny standard o nazwie Ultimedia. Programy do obróbki obrazu
pozwalajÄ… na dowolne manipulacje klatkami filmu, przetwarzanie ich przez rozmaite
filtry graficzne, dodawanie elementów graficznych, napisów, dogrywanie efektów
dzwiękowych lub komentarzy.
Ponieważ ruchome obrazy o dużej zdolności rozdzielczej wymagają przesłania do
monitora przez kartę graficzną dużej ilości danych, a wiele kart graficznych działa zbyt
wolno, pojawiło się sporo kart reklamowanych jako specjalne karty do zastosowań
wielomodalnych. Z drugiej strony wielkie rozmiary plików z ruchomymi obrazami wideo
powodują konieczność stosowania szybkich metod kompresji danych. Karta
VideoMaker pozwala na przechowywanie 45-sekundowej sekwencji wideo w kolorze na
dyskietce 1.44 MB. Jest to możliwe dzięki realizacji algorytmu kompresji MPEG,
chociaż jej moc obliczeniowa nie wystarcza do kompresji w czasie rzeczywistym. Karta
montowana jest w komputerach typu IBM PC i współpracuje z oprogramowaniem
działającym pod Windows 3, pozwalającym na obróbkę obrazu (kontury, 24-bitowy
kolor, filtry, powiększanie fragmentów) i zapamiętywanie pojedynczych obrazów w
30 Fascynujący świat komputerów
typowych formatach graficznych, 8 i 24-bitowych. Program Multimedia Manager
korzysta zarówno z tej karty jak i współpracuje z kartami dzwięku (Sound Blaster i inne),
pozwalając tworzyć wielomodalne oprogramowanie. Inne karty współpracujące z Video
for Windows to Video Blaster i VideoSpigot for Windows. Ta ostatnia karta dostępna
jest również w środowisku MacIntoshy i wyróżnia się dużą szybkością. Przy
rozdzielczości 160 na 120 punktów karta digitalizuje 30 obrazów w ciągu sekundy -
zajmuje to około 9 MB na dysku. Częstości poniżej 10 obrazów na sekundę nie są już
akceptowalne, częstości około 15 klatek na sekundę stwarzają już wrażenie płynności
ruchów. Problemem zbyt wolnych kart może być brak synchronizacji obrazu i dzwięku.
ReelMagic CD (Sigma Designs) przetwarza 30 klatek na sekundÄ™ w standardzie MPEG,
oferuje 16-bitowe przetwarzanie dzwięku oraz interfejs do CD-ROMu. Wysoki stopień
kompresji i dekompresji obrazu i dzwięku zapisanego w plikach MPEG pozwala na
jednym dysku CD-ROM umieścić 72 minuty filmu. Dekompresja w czasie rzeczywistym
wymaga specjalnych układów elektronicznych (są to trzy układy scalone produkcji Sigma
Design). Kartę ReelMagic podłączyć należy do złącza rozszerzającego karty wideo
zainstalowanej w komputerze. Jej rozdzielczość może wynosić do 1024 na 768 pikseli a
liczba kolorów do 32786 (w praktyce trudno to odróżnić od wiernego koloru
24-bitowego).
Na rynku komputerów osobistych pojawia się coraz więcej systemów reklamowanych
jako komputery do zastosowań wielomodalnych, wyposażonych w CD-ROM i dobrą
kartę dzwiękową. Są to komputery korzystające z mikroprocesorów klasy i386SX lub
wyższej, wyposażone przynajmniej w 4 MB pamięci, grafikę SVGA, dyski rzędu 100 MB
oraz czytniki CD-ROM i najczęściej kartę dzwiękową Sound Blaster Pro. Urządzenia do
nagrywania CD ROMów staniały na tyle, by stać się dostępne dla niewielkich firm lub
nawet bogatszych amatorów. Coraz bogatsze staje się oprogramowanie do tworzenia
programów wielomodalnych. Między innymi Philips sprzedaje taki system o nazwie
CD-I Starter System. Oferuje on narzędzia i biblioteki gotowych elementów do tworzenia
grafiki, muzyki, systemu menu do dialogu z użytkownikiem oraz animację i
synchronizację wszystkich elementów.
Wkrótce spodziewać się można opracowania specjalnych obwodów scalonych łączących
funkcje mikroprocesora (i486 będzie jednym z pierwszych), szybkiego procesora
graficznego i procesora sygnałów dzwiękowych. Nowy, wspaniały świat cyfrowego wideo
wymaga wielkich mocy komputerów i ogromnych pamięci dyskowych - technika
komputerowa do takich zadań dorosła dopiero w połowie lat 90-tych.
31 Fascynujący świat komputerów
1.9 Przykłady oprogramowania
Programy do tworzenia materiałów wielomodalych to przede wszystkim edycja plików
wideo, grafiki i dzwięku wykorzystywanych w sekwencjach wideo.
Adobe Premiere
Jest to pakiet przeznaczony zarówno dla komputerów Macintosh jak i systemów
działających w środowisku MS-Windows. Ustanawia on pewien standard w dziedzinie
edycji wideo na komputerach osobistych i nadaje siÄ™ do prac profesjonalnych. Minimalne
wymagania Adobe Premier to 32-bitowy komputer z szybkim zegarem (486/66 MHz lub
Pentium) oraz 16 MB pamięci operacyjnej i duży, szybki dysk (100 MB przestrzeni dla
instalacji programu i miejsce na przetwarzane pliki wideo). Program umożliwia pracę aż
z 99 ścieżkami wideo, oferując szeroką paletę narzędzi do edycji. Zawiera na przykład 16
różnych możliwości generowania masek do tworzenia okienek w filmie i
przezroczystości do efektów nakładania sekwencji na siebie. Podobnie jak w grafice
ilustracyjnej zgrupować można do 16 warstw w jedną i umieścić na ścieżce. Użytkownik
Adobe Premier ma do dyspozycji wiele efektów specjalnych, np. ruch kamery w kierunku
światła i stosowanie wielu filtrów oraz projektowanie własnych filtrów.
Narzędzia do wprowadzania napisów i tytułów również nie pozostawiają wiele do
życzenia. Fonty postscriptowe jak i fonty TrueType można wypełniać przejściami
tonalnymi i stosować efekty cieniowania. Zdefiniowanie obszaru przeznaczonego na tytuł
pozwala na wygładzanie krawędzi obszaru (antialiasing) i animację ruchu tytułu. Określa
siÄ™ jÄ… opisujÄ…c ruch w oknie dialogowym Motion Settings (parametry ruchu).
Przesuwając suwaki ustalamy obroty i zbliżenia dla każdego punktu na trajektorii ruchu.
Znaczniki pozwalają na precyzyjną synchronizację obrazu i dzwięku. Pliki graficzne i
animacje przechowywane są w formatach typowych dla komputerów osobistych (VFW,
QuickTtime i FLI), możliwe jest również sterowanie urządzeniami zewnętrznymi
zapisującymi film na taśmie wideo. Operacje edycji dokonywać można na wstępnie
przetworzonych materiałach niskiej zdolności rozdzielczej tworząc pliki EDL (Edit
Decision List). Ostateczna edycja wykonywana jest przez wysokiej klasy system linearnej
edycji wideo w oparciu o dane czytane z tych plików - jest to standardowe rozwiązanie w
dziedzinie tworzenia sekwencji wideo. Dobre opanowanie tego pakietu wymaga sporo
czasu i wysiłku gdyż proces tworzenia atrakcyjnych materiałów wideo jest z natury
rzeczy trudny.
Inscriber
Profesjonalnym użytkownikom studia telewizyjnego - a nie brakuje przecież studiów
telewizji lokalnej czy kablowych telewizji osiedlowych - polecić można wyrafinowany
program o nazwie Inscriber, kanadyjskiej firmy Image North. Program ten daje siÄ™
używać już na komputerach 386 wyposażonych w odpowiedniej jakości kartę graficzną
SuperVGA (taką jak TARGA czy ATVista) i około 100 MB miejsca na twardym dysku.
32 Fascynujący świat komputerów
Jest to program używany przez zarówno małe jak i duże studia telewizyjne na całym
świecie (np. Eurosport).
W istocie Inscriber jest językiem programowania przeznaczonym do zastosowań
graficznych. Jego głównym zadaniem jest tworzenie grafiki, napisów i tła dla obrazu.
Przykładowym jego zastosowaniem jest tworzenie napisów w języku polskim dla filmu
wideo - dzięki wprowadzanej przez użytkownika tablicy czasów poszczególnych scen
program automatycznie zadba o synchronizację. Możliwości tworzenia napisów dwu i
trójwymiarowych są bardzo rozbudowane: osiąganie efektów głębi przez ustawianie
zródeł światła, określanie faktury powierzchni znaków, np. metalizację czy efekt
rzezbienia liter w kamieniu. Dostępne są przy tym wszystkie akcenty języków
słowiańskich. Dzięki temu można stworzyć w pełni profesjonalne plansze reklamowe i
grafikę prezentacyjną. Efekty specjalne umożliwiają płynne pojawianie się i zanik tekstu,
przesuwanie fragmentów obrazu, wyrafinowane sposoby przenikania się klatek i zwijania
obrazu (na ponad 60 sposobów).
Media Studio (Riva)
Jest to stosunkowo niedrogi program przeznaczony do tworzenia prezentacji
wielomodalnych i edycji wideo dla amatorów. Zawiera narzędzia do edycji map bitowych
(w tym formatu Photo CD), dzwięku, nagrywania i digitalizacji wideo (stosowany jest
format AVI), oraz zamiany formatów wideo, np. z QuickTime to AVI. Efekty specjalne i
narzędzia do płynnego przejścia pomiędzy obrazami (morphing), mieszania kilku
obrazów i możliwości operacji na poszczególnych klatkach pozwalają na uzyskanie
wyrafinowanych efektów wizualnych. Wymagania tego programu są stosunkowo
skromne i nawet na komputerze osobistym z procesorem 486 i 4 MB RAM daje siÄ™ go
już (choć z trudnościami) używać. Program nie dokonuje natychmiastowo wszystkich
zmian lecz pamięta wydane w czasie edycji instrukcje w niewielkich plikach pokazując
próbki w małych okienkach. Dopiero po skończeniu edycji wykonywana jest końcowa
kompilacja tworzÄ…ca nowy film.
Wśród innych programów do edycji wideo wymienić warto MediaMerge (ATI),
CineWorks (Touchvision), PrimeTime (EMC) i DVP (Asymetrix). Na CD-ROMach
dostępne są całe sekwencje wideo na CD-ROMach, przeznaczone do montowania w
tworzonych przez siebie materiałach, podobnie jak pliki graficzne dołączane do
programów do grafiki ilustracyjnej. Przykładowo, biblioteka Royalty Free Digital Video
(Cyfrowe wideo Wolne od Opłat Licencyjnych) firmy Four Palms zawiera sekwencje
wideo dotyczące transportu powietrznego, morskiego, kolejowego i drogowego. Długość
sekwencji leży w granicach 4-15 sekund a parametry obrazu to 320×240 pikseli z
wiernymkolorem24-bitowymi z częstością 15 klatek na sekundę.
33 Fascynujący świat komputerów
1.10 Kilka informacji technicznych.
Brak standardów zapisu informacji może bardzo utrudnić rozwój technik
wielomodalnych. Już teraz zapis informacji dzwiękowej odbywa się na zbyt wiele
różnych sposobów: właściciele sklepów muzycznych skarżą się na brak miejsca, by
przechowywać ten sam materiał dzwiękowy na płytach analogowych, płytach
kompaktowych, kasetach magnetofonowych, kasetach DCC (Digital Compact Cassette) i
MiniDyskach MD, by wymienić tylko najważniejsze stosowane obecnie formaty. W
kasetach wideo też dzieje się nie lepiej: formaty 8 mm (Sony), VHS w kilku wersjach i
Beta (głównie w USA), również w kilku wersjach, kilka rodzajów płyt wizyjnych,
wszystko to powoduje zamieszanie wynikające z braku standardów.
Jednym z ważniejszych standardów na rynku systemów wielomodalnych stał się
opracowany przez Philipsa format CD-I. Obejmuje on nie tylko sam format zapisu
informacji na dysku lecz również określa usługi, które musi świadczyć podstawowe
oprogramowanie zarządzające zapisanymi w ten sposób danymi. Format zapisu w
znacznej mierze zgodny jest z przyjętym dla dysków CD-ROM  formatem typu 2
(przewidziano dotychczas tylko dwa formaty). Dla pracy w czasie rzeczywistym wymaga
on szybkości odczytu danych równej 175 KB/s. Sektory danych o wielkości 2336 bajtów
zawierać mogą dzwięki, obrazy lub dane cyfrowe - w nagłówku sektora zapisana jest
informacja określająca rodzaj danych, dzięki czemu kierowane są one do odpowiedniego
układu dekodującego, kanału audio, wideo lub cyfrowego. Sektory zawierające
informację różnego rodzaju przeplatają się ze sobą. Wiele wysiłku poświęcono technikom
oszczędzania pamięci dyskowej - chociaż pojemności rzędu gigabajtów są duże, systemy
wielomodalne zużyć mogą dostępną pamięć bardzo szybko. Możliwy jest zapis z kilkoma
poziomami jakości, kilku różnych kanałów dzwięku i obrazu jednocześnie.
Standard CD-I określa aż 4 poziomy jakości zapisu dzwięku, od zajmującego najwięcej
pamięci dzwięku wysokiej jakości do najbardziej oszczędnego zapisu nadającego się do
mowy. Jakość płyty kompaktowej zapewnia kodowanie PCM (Pulse Code Modulation),
zapewniające dynamikę 100 dB, przenoszenie w całym paśmie 20 Hz-20 KHz i
maksymalny czas stereofonicznego zapisu 72 minuty, a więc nieznacznie krótszy od
płyty kompaktowej (wynika to z zastosowania nieco innego formatu, w którym każdy
blok danych poprzedzony jest nagłówkiem informującym o ich rodzaju). Pozostałe trzy
poziomy zapisu dzwięku oznaczone są literami A, B i C i korzystają z metod kompresji
danych oznaczanych jako ADPCM (Adaptive PCM). Na poziomie A kosztem
nieznacznego spadku poziomu dynamiki (do 96 dB) zapisać można dwukrotnie więcej
(144 minuty), na poziomie B, przy jakości równoważnej dobrej stacji UKF czterokrotnie
więcej (288 minuty) i przy najniższym poziomie, nadającym się głównie do
przechowywania mowy do dyspozycji jest ośmiokrotnie dłuższy czas, czyli prawie 10
godzin.
34 Fascynujący świat komputerów
Odtwarzanie dzwięku zachodzić może bezpośrednio z dysku (przy użyciu dekompresji
jeśli zapis dokonały został na poziomie A, B lub C) lub z pamięci, w której utworzyć
można  mapę dzwiękową . Urządzenia CD-I dysponować muszą przynajmniej 1 MB
pamięci. Mapy dzwiękowe nie tylko zapisują dzwięki w postaci binarnej, odczytanej z
dysku, lecz również zdarzeniami MIDI, które zajmują niewielką pamięć i pozwalają
syntezować frazy muzyczne. Można również składać zdania z zapisanych w pamięci
słów. Są to przykłady technik oszczędzania pamięci i przyspieszania dostępu do danych.
Nieruchome obrazy zapisuje się również w czterech różnych formatach. Format RGB
5,5,5 odpowiada najlepszej jakości. Punkt obrazu opisywany jest przez 5 bitów dla
każdego z podstawowych kolorów. Pozwala to na rozróżnienie 25 =32 odcieni
niebieskiego, czerwonego i zielonego, czyli w sumie 323 =32768 barw. Jeden obraz
zajmuje około 200 KB pamięci. Średnio o połowę mniej pamięci zajmują obrazy
kodowane w formacie Delta YUV. Jest to rodzaj kompresji obrazu, definiujący dla każdej
linii obrazu punkt odniesienia i opisujący pozostałe punkty przez parametry określone
względem tego wyróżnionego punktu. Ponieważ obrazy najczęściej nie zmieniają się
gwałtownie, np. operują podobną paletą barw, pozwala to na oszczędzenie liczby bitów
na punkt. Innym, nieco bardziej efektywnym sposobem na redukcję pamięci
przeznaczonej dla obrazu jest ograniczenie palety barw do 256 kolorów z gamy 16.7
milionów odcieni dla 24-bitowego koloru. Dla każdego obrazu wybierana jest najwierniej
go oddająca paleta, a punktom tego obrazu przypisuje się jeden bajt, będący adresem
danego koloru w pamięci ROM przechowującej dane kolorach. Dane te zawarte są w
tablicy nazywanej w skrócie CLUT (Color Look UP Table, czyli Tablica Określająca
Kolory), stÄ…d nazwa tej metody kodowania: CLUT. NajlepszÄ… kompresjÄ™ obrazu
zapewnia metoda RL (Run Length Picture).
Oczywiście są i inne, bardziej efektywne metody kompresji obrazu, np. kompresja przy
użyciu obiektów fraktalnych, polegająca na zapisaniu obrazu w postaci serii
transformacji (Iterative Function Systems, czyli systemów funkcji iteracyjnych) kilku
początkowych punktów. Czas, potrzebny na dokonanie kompresji obrazu w tej metodzie
jest znacznie dłuższy, niż czas dekompresji. System kompresji fraktalnej oferuje bardzo
duży stopień kompresji. Po raz pierwszy zastosowała go w komercyjnym produkcie
(encyklopedii Encarta) firma Microsoft. Stosowanie kompresji fraktalnej do dowolnych
obrazów wymaga drogiego oprogramowania i jest zbyt powolne, by je stosować do
dekompresji w czasie rzeczywistym. Ten sam problem zwiÄ…zany jest z ruchomymi
obrazami, określanymi jako FMV (Full Motion Video, czyli wideo w pełni ruchome).
Wymaga to bardzo dużej mocy obliczeniowej i szybkości przesyłania danych kanałami
transmisji. Odtwarzacze CD-I nie mają obecnie możliwości obsługi FMV, ale
przewidziano możliwość rozszerzenia w przyszłości, wyposażając je w specjalne łącze,
do którego będzie można dołączyć przystawkę dokonującą kompresji i dekompresji
obrazów wideo. Przyjęcie wspólnego standardu zaproponowanego przez grupę ekspertów
MPEG (Moving Pictures Expert Group) przez dwie najważniejsze w tej dziedzinie firmy,
Philipsa i Sony, pozwala mieć nadzieję na szybki postęp. Nad odpowiednimi obwodami
pracuje wiele firm, między innymi Hewlett-Packard opracował procesor PA RISC
35 Fascynujący świat komputerów
7100LC, pozwalajÄ…cy na kompresjÄ™ i dekompresjÄ™ obrazu wizyjnego w systemie MPEG i
JPEG z szybkością do 30 klatek na sekundę. Komputer zbudowany na tym procesorze
wprowadzi na rynek systemów wielomodalnych nową jakość.
Oprogramowanie udostępniające różne usługi urządzeń CD-I jest rodzajem systemu
operacyjnego działającego w czasie rzeczywistym. System ten nazywa się RTOS (Real
Time/Multitasking Operating System) i może jednocześnie wykonywać kilka poleceń (do
16 odczytów i interpretacji informacji z dysku CD-I). Znaczna część systemu zapisana
jest w pamięci EPROM i oparta na znanym systemie operacyjnym czasu rzeczywistego
jakim jest OS-9. W system wbudowanych jest wiele sterowników, w tym również
typowych urządzeń, takich jak sterownik myszy, klawiatura, złącza szeregowego i
równoległego oraz dysków.
Standard CD-I, dominujący w tańszych zastosowaniach domowych, po pięciu latach od
jego ustalenia zaczyna dość mocno krępować projektantów. Przewidziano np. dokładnie
1 MB pamięci w odtwarzaczach CD-I. Kiedyś pamięć była droga i mała więc takie
założenie wydawało się rozsądne, dzisiaj jest to duże ograniczenie dla programów
posługujących się obrazem i dzwiękiem. Stąd powstają już rozszerzenia standardu: CD-I
XA, czyli CD-I o rozszerzonej architekturze (extended architecture). W rozwiÄ…zaniach
profesjonalnych dominuje standard DVI.
Niezależnie od samego logicznego formatu zapisu danych na dyskach optycznych, a więc
podziału na sektory i nagłówki informacyjne, przyjąć można różne standardy dla
formatów informacji. Dla grafiki stosuje się format GKS (Graphical Kernel System),
PHIGS i kilka innych. Nieruchome obrazy zapisywane sÄ… w formacie TIFF (Tag Image
File Format), JPEG (Joint Picture Expert Group), IIF (Image Interchange Facility) oraz
MacPaint. Do rejestracji obrazów wideo stosuje się formaty telewizyjne (europejski PAL,
amerykański NTSC) oraz specjalne techniki kodowania i kompresji sygnału wizyjnego
(MPEG lub H.261). Do nieruchomych obrazów stosuje się też standardy kompresji
danych używane w telefaksach (Fax G3, G4).
Standard CD-ROM XA (Extended Architecture), opracowany między innymi przez
Philipsa, Sony i Microsoft pozwala na jednoczesny odczyt danych tekstowych i audio.
Jego największą zaletą jest możliwość odtwarzania obrazów z nowego formatu Kodak
Photo CD. Obrazy fotograficzne zapisane w standardzie Kodaka mogą zajmować do 6
MB i są przechowywane na dyskach magnetooptycznych. Jeśli istotnie ten system
fotografii stanie się popularny wówczas liczba sprzedawanych dysków MO będzie tak
duża, że ich cena bardzo się obniży. Dyski mieszczące do 108 zdjęć przy zdolności
rozdzielczej 3072×2048 i 24-bitowym kodowaniu koloru kosztujÄ… równowartość dwóch
rolek filmu, ale skanowanie i zapisywanie zdjęć jest nadal kosztowne.
Szybkość działania takich napędów powinna być większa niż typowych CD-ROMów, by
oczekiwanie na pojawienie się kolejnego zdjęcia nie trwało zbyt długo. Pojawiły się
36 Fascynujący świat komputerów
napędy CD-ROM z rozszerzeniami XA, ale nie realizujące wszystkich funkcji standardu
XA. Chociaż wystarczy to do odtwarzania dysków z aparatów fotograficznych Kodaka,
nie wystarczy jednak do wszystkich zastosowań, np. nie można wówczas odtwarzać
dzwięku bez przerw w czasie odczytywania obrazu. Z przyczyn technicznych wyróżniono
również możliwość wielokrotnego zapisu obrazów na Photo CD: nie wszystkie
sprzedawane obecnie napędy potrafią odczytać obrazy dopisane już po zapełnieniu całego
dysku i wymazaniu części wcześniej zrobionych zdjęć, chociaż zapewne wkrótce ta
cecha, określana jako  multisession czyli  wielosesyjność , stanie się standardem.
Proponowano wiele innych standardów, wśród nich standardy dostępu do danych na
CD-ROMach przez sieci komputerowe. Należy do nich CD-RDx (CD-ROM Read Only
Data Exchange), DXS (Data Exchange Standard) i SFQL (Structured Full-Text Query
Language). U podłoża tych standardów jest model klient-serwer: CD-ROM udostępnia
dane (jest serwerem) oprogramowaniu z nich korzystajÄ…cemu (klientom). Standardy
dysków optycznych i magnetooptycznych opisane są w serii książeczek o różnych
kolorach: standard dysków kompaktowych CD w  Czerwonej książeczce , CD-ROM i
CD-ROM XA w żółtej, standard CD-R i standard dla dysków MO opisany jest w
 Pomarańczowej książeczce , a dysków CD-I w zielonej.
1.11 Tendencje rozwoju multimedia
Pomimo ogromnego postępu w technologii dysków magnetycznych i magnetooptycznych
możliwości przechowywania i odtwarzania sekwencji filmowych zależeć będą od stopnia
kompresji obrazu. Wśród nowych, obiecujących technik wyróżnić należy HARC-C,
oprogramowanie opracowane w Houston Advanced Research Center w Teksasie,
pozwalające na uzyskanie średniego stopnia kompresji rzędu 300:1 a najlepszych
rezultatów rzędu 450:1 przy niezauważalnej stracie jakości. System kompresji oparty jest
na transformacjach matematycznych obrazu przy pomocy falek (wavelets) i nie nadaje siÄ™
do kompresji danych numerycznych, gdyż nie pozwala na idealne odtworzenie danych.
HARC-C działa zarówno dla obrazu wideo, jak i zdjęć, muzyki czy mowy. Stosowanie w
pełni odwracalnych algorytmów kompresji jest w przypadku obrazu lub dzwięku
rozrzutnością, wystarczy by zniekształcenia po dekompresji były niezauważalne. Stopień
kompresji rzędu 300:1 oznacza, że plik graficzny wielkości 3 MB zajmie zaledwie 10 KB
a na CD-ROMie zmieści się około równowartość 200 GB danych graficznych!
Początkowo technika kompresji falkowej stosowana była tylko w zastosowaniach
naukowych, kompresji obrazów satelitarnych i obrazów medycznych.
Rozwój sieci światłowodowych oraz technik kompresji danych umożliwia dostarczanie
filmów prosto do odbiorcy. Film wyświetlany w kinie zawiera około 1 TB danych
graficznych. Z powodu dużych kosztów związanych z dystrybucją filmów w 1995 roku
sieć kin AMC Entertainment rozpoczęła próbny program dystrybucji filmów do kin
37 Fascynujący świat komputerów
poprzez sieć komputerową. Ocenia się, że do 1997 roku około 10.000 kin w USA
korzystać będzie z tej formy dystrybucji. Prawdopodobnie rozpowszechni się również
dostarczanie wideo bezpośrednio do domu, chociaż koszty doprowadzenia światłowodu
do prywatnych mieszkań na razie zniechęcają do takich eksperymentów - właściciele
wypożyczalni kaset jeszcze przez kilka lat mogą spać spokojnie.
Literatura
Szczegółowe informacje o napędach CD-ROM i dostępnych dyskach zawiera książka:
Dana Parker i Bob Starrett, Przewodnik po CD-ROM (Intersoftland, Warszawa 1993)
Recenzje i informacje o nowych dyskach CD-ROM znalezć można w pismach, np. w
Wielkiej Brytanii wychodzą dwa pisma, do których dołączane są CD-ROmy zawierające
demonstracje omawianych w nich programów. CD-ROM Today (Future Publishing)
przeznaczony jest dla dorosłych, a CD-ROM PC kids, z podtytułem  przewodnik
rodziców po oprogramowaniu dla dzieci omawia programy edukacyjne i rozrywkowe
dla najmłodszych.


Wyszukiwarka

Podobne podstrony:
248 12
Biuletyn 01 12 2014
12 control statements
Rzym 5 w 12,14 CZY WIERZYSZ EWOLUCJI
12 2krl
Fadal Format 2 (AC) B807 12

więcej podobnych podstron