WSP J POLN254181

WSP J POLN254181



Sambfir, J<zyk polski »• świetle statystyki


506

Pojawienie się wśród najczęstszych liter)” i wynika z wielości jej funkcji (oznaczanie głoski h! oraz wskazywanie na miękkość poprzedzających spółgłosek), z kolei najczęstsze pary literowe wynikają ze struktury najczęstszej w badanym tekście sekwencji trójliterowej nie. Dane te wykorzystamy niżej przy omówieniu dwóch typów ważnych eksperymentów, dzięki którym można ujawnić różny stopień entropii i redundancji elementów języka.

Entropia i redundancja w języku. Polszczyzna jako język spółgoskowy

Na prostym przykładzie można łatwo się przekonać, że w polskim tekście pisanym o wiele łatwiej dadzą się zrekonstruować opuszczone („zdeformowane”) liter)” samogłoskowe aniżeli spółgłoskowe (kreskami oddzielono poszczególne wyrazy):

(a)    tekst bez spółgłosek: /.e... /.e. / .a.o..o.e. /..y.a.y /\a..o/

(b)    tekst bez samogłosek: /t.kst/b.z/s.m.gf.s.k Ici.l.m. H.twJ.

Rekonstrukcja zdania, bardzo trudna w wypadku (a), a niemal natychmiastowa w wypadku (b), dowodzi, że samogłoski są w polskim tekście bardzo łatwo przewidywalne na podstawie kontekstu., mają więc dużą redundancję, a małą entropię. Przewidywalność spółgłosek jest o wiele mniejsza, a więc mniejsza jest ich redundancja, większa zaś entropia. Informacja w teorii informacji rozumiana jest jako miara niepewności co do zajścia danego sygnału (np. litery, fonemu). Entropia jest to przeciętna ilość informacji przypadająca na 1 sygnał, a jej jednostką jest 1 bit, czyli ilość informacji, jaką niesie jeden z dwu sygnałów jednakowo prawdopodobnych (bardziej wyczerpujące dane na temat zastosowań teorii informacji wr językoznawstwie w: Hammerl, Sambor, 1990, rozdz. 4).

Struktura informacyjna tekstu

Pojęcie entropii można wykorzystać także do wyznaczania granic elementów tekstu (np. wyrazów, morfemów, sylab), przeprowadzając znany eksperyment psycholingwistyczny, który polega na odgadywaniu przez respondenta kolejnych liter (lub fonemów-) tekstu. Miarą entropii jest liczba pytań typu „czy”, jakie potrzebne są do odgadnięcia kolejnej liter)”, a granice między elementami tekstu wyznacza styk minimalnej i maksymalnej entropii. Pytania mogą być chaotyczne bądź zadawane w sposób systemowy”. Ta-


Wyszukiwarka

Podobne podstrony:
WSP J POLN254178a JĘZYK POLSKI W ŚWIETLE STATYSTYKI JADWIGA SAMBOR Częstość fonemów. - Częstość lite
WSP J POLN254179 504 Jndioigi Sambor, Język polski w świetle statystyki Wewnętrzna struktura obu kor
WSP J POLN254185 510 Jadwiga Sambor, Język polski w świetle statystyki Zbadano także frekwencję częś
WSP J POLN254187 512 J.nlmg.i    Jeżyk polski w świetle statystyki rzadkie (Samb
WSP J POLN254197 522 Jadw& Sambor, Jeżyk polski w świetle statystykiGraf 1. Gniazdo leksykalne S
WSP J POLN254199 524 JmIuh&i Sambor. Język polski w świetlt statystyki Graf 9. Gniazdo pojęciowe
WSP J POLN254195 Jadwiga    Język polski u śv.-unle statystyki 520 Opisano także słow
WSP J POLN254274 SŁOWNIKI JĘZYKA POLSKIEGO TADEUSZ PIOTROWSKI Terminologia. Słowniki a kultura. - Sł
WSP J POLN25478 NOWE SŁOWNICTWO POLSKIE TERESA SMÓŁKOWA Nowe potrzeby - nowe wyrazy. - Nazwy abstrak
WSP J POLN254182 5C7 Probabilistyczny model procesu tworzenia tekstu Tabela 4. Wyniki eksperymentu:
DSC0007 Prehistoria ziem polskich Jeśli za prehistorię Polski uważać okres od pojawienia się człowi
MINIMALNA LICZEBNOŚĆ PRÓBY W badaniach statystycznych często pojawia się problem określenia minimaln
Przemysł II 1257-1296 Orzeł w koronie polskiej po raz pierwszy pojawił się podczas
WSP J POLN254183 508 J<uiui$J Sjrribor, Język polski w iwietk statystyki tworzyli losowo „teksty
WSP J POLN254189 514 Jjdm&i S*mbvr Jtiyk ońljki w świetle statystyki pokryto su potu I ■ E » 0 1
WSP J POLN254200 Bibliografia 525Bibliografia B a r t m i ń s k i Jerzy, 1976, Oralność tekstu pieśn
WSP J POLN254201 526 JadtsrigA Sambor. Język polski w świerk statystyki Sambor Jadwiga, 1984, Menzer
WSP J POLN254119 439 Kinrifkl :.;.i się nazwiska polskiego przyjmuje się na ogół wiek XV. Wśród doda
WSP J POLN254125 445Bibliografia 5 u bak Józef, 1986, Proces kształtowania się polskiego nazewnictwa

więcej podobnych podstron