| 8. La informacio (la instruay-"maso") kiel mezuro (ankaü) de la lernmalfacil-eco (la instruay-"inerto"). |
8.1 Konsidero de analogio La vorto "informo" de la öiutaga lingvo havas (almenaü) du signifojn, nome |
| 1) mesaäo, sciigo (al öi tiu signifo ni limigas en ILo la nocion "informo") kaj |
| 2) grado, laü kiu mesaäo estas neantaüvidebla, malkutima, originala, malfacile enprenebla en la konscion aü memoron - tion signifas senambigue en ILo la vorto "informacio" (neologismo enkondukita de Hilgers kaj Yashovar-dhan, 1980, p. 37). |
| Oni celas la unuan signifon, se oni parolas pri "informprilabor-ado" aü se oni diras, ke oni pri io "oficiale ankoraü ne ricevis informon", t.e., ke oni ja jam scias la koncernayon (kiu do ne plu enhavas "informacion"), ricevinte "öi tiun sciigon (mesaäon) tamen ne laü la tiucela vojo (tra la äusta kanalo). |
| La dua signifo estas celita en parolturnoj kiel ekzemple: "multaj vortoj, malmulte da inform(aci)o", aü "Tio por mi havas tro multe (tro malmulte, neniom) da inform(aci)o". |
| Analoge ankaü la vorto "maso" estas uzata en du diversaj sensoj. |
| La arkitekto parolas pri la "kon-struaymaso", kaj la kuirejestro konstatas, ke la foryetaymaso ne trovas lokon en la disponebla rubayujo. Parolante tiel, ambaü kom-prenas per "maso" ion materian, kiu postulas, plenigas kaj forprenas spacon. "Maso" öikaze do signifas "materio". |
| Estas des pli laborige, transporti materion supren (pro äia pezo) aü eö en horizontala direkto (pro äia inerto), ju pli granda estas äia "maso", mezurata en (kilo)gramoj. |
| Por la fizikisto la "maso" estas unu el la mezureblaj aspektoj de la "materio", apud äia volumo (mezurebla en cm3), äia denseco (g/cm3) kaj äiaj laükvantaj trajtoj en aliaj natursciencaj dimensioj (kaj en pluaj dimensioj, öar peco da materio povas havi pli aü malpli grandan valoron!). Analoge (bildo 8.1) por la kibernetikisto la "informacio" estas unu el la mezureblaj aspektoj de la "informo", apud äia amplekso (nombro da signoj), äia denseco (koncizeco, t.e. informacio je signo) kaj äiaj laükvantaj trajtoj en aliaj, ne nur kibernetikaj dimensioj (ankaü informo povas esti pli aü malpli valora!) Ambaü mezuras la aspekton de la malfacilo de transporto. Por la kibernetikisto temas pri la sendado de informo tra (spaca) kanalo aliloken aü per storo al pli malfrua tempopunkto. Same kiel la nocio kaj mezuro de la maso fariäis la bazo de la novtempa (t.e. de la analiza, modeliga, mezuranta, antaükalkulanta kaj teknike aplikebla - unuvorte: la nomoteta) naturscienco (kiel scienco pri la materia mondo), la nocio kaj mezuro de la informacio karakterizas la kibernetikon kiel nomotetan sciencon pri la informeca (mensa) mondo - do speciale ankaü pri la pedagogia temaro. Öi tie temas - unuflanke - pri la mezurado de la enprenkapacito de la konscio (nunmemoro) kaj de la (antaü-konscia) memoro, aliflanke pri la mezurado de la instruay-"maso" kiel instruay- "inerto" (t.e. kiel malfacilo äin enkonsciigi aü enmemorigi), por - trie - antaükalkuli necesajn lerntempojn kaj ebligi la planadon de (ankaü perilteknika) instruado. |
| Bildo 8.1: La maso estas nur unu el la laükvantaj dimensioj de la ("maso" =) materio; same la ("informo" =) informacio estas nur unu el la laükvantaj dimensioj de la informo (= mesaäo, sciigo, signo). |
| 8.2 Mezurunuo de
la informacio Estas evidente, ke oni bezonas normale öirkaü la duoblan tempon, por legi, do apercepti, du paäojn de romano ol legi nur unu paäon. Du tiaj paäoj ja ampleksas normale duoble tiom da literoj kaj aliaj skribmaqinaj signoj (kvazaü "atomoj") kiom ampleksas nur unu paäo, kaj öirkaü la duoblon da vortoj aü aliaj lingvaj ("super-signoj" =) kunsignoj (kvazaü "mo-lekuloj") - en ILo jam la vortpartoj (leksemoj) estas tiaj kompleksigitaj (el atomoj kombinitaj) kunsigoj. Se la dua paäo estas pli malpligrandlitere presita, äi bezonigas ja pli da tempo, sed 100 (kun)signoj de äi la saman tempon. Sed nek paäo nek signo estas taüga mezurunuo de la (enpren-, speciale legad-)malfacilo, do de la informacio. Ni bezonas pli longan (internan reag-)tempon, por konsciiäi pri io eksterordinara ol pri io öe ni ofta. Tial la legadtempo por maloftaj vortoj (ekz. "iridio") estas pli longa ol por pli oftaj vortoj (ekz. "Izraelo"), eö se ili estas (proksimume) samlongaj. Dum la lingvoevoluo la pli oftaj vortoj fariäas pli mallongaj ol la malpli oftaj - öu pro mallongigo de pli kaj pli ofte uzataj vortoj ("La Internacia Lingvo de Doktoro Esperanto" al "ILo" aü "E-o"), öu pro estingiäo kaj öirkaüfrazo de apenaü plu bezonataj, mallongaj vortoj, kiuj nun disponiäas por senambigua kodigo de pli longaj signifoj (Ekz.: la germana vorto "Ding" iam signifis "parlamento", kaj nun "ayo".) Öi tiu optimumiäo de historie evoluintaj (etnaj) lingvoj estas unu el la temoj de la lingvokibernetiko (vd. ekz. la konciza prezentado de la informaciteoria lingvoanalizo en Frank, 1966 kaj 1969, I, p. 196 - 205). |
| Psikologie kaj pedagogie
taüga mezuro de la informacio do devas dependi de la kutima (la t.n.
"subjektiva") probablo p de la signoj, tiel, ke ili enhavas
des pli da informacio, ju malpli probablaj ili estas - do: ju malpli granda
estas la malprobablo u := 1/p (vd. bildon 8.2). Arbitre oni
povas difini kiel mezurunuon de la maso la gramon (anstataü ekz. la
uncon) fiksante, ke äi estu la maso de 1 cm2 da 4 °C
varma akvo. Same arbitre ni difinas kiel mezurunuon de la informacio la
"biton" (ansta-taü ekz. la "deciton"; oni ne konfuzigu
la informaciteorian biton kun la informadika "bito" [germa-ne
majuskle skribenda!], kiu estas sinonimo de "binara signo"; binara
signo povas enhavi pli aü malpli ol unu bito da informacio, sed en
la aritmo maksimume unu biton) tiele: 1 bit(o) estas la informacio de informo, kies probablo estas p = ½ (la malprobablo do u = 2). |
Bildo 8.2: La informacio malkreskas kun kreskanta
probablo. La mezurunuon do eblas difini per difinita probablo: ekz.0,5
por 1 bit, 0,1 por 1 decit.
"1 decit" estus pli da informacio, nome la informacio de signo kun nur 10% anstataü 50%a probablo (vd. bildon 8.2). La rezulto de la yeto de monero (aü la sciigo pri la rezulto) enhavas 1 biton da informacio (bildo 8.3), se la akomodilo de la observanto (aü ricevanto de la sciigo) nur atentas, kiu flanko montriäas, sed ne ankaü la angulon. La informacio en la 50a decimalo de la radiko el hazarda nombro estus 1 decit = x bit > 1 bit. Cele kalkulon de la faktoro x bezonatas la matematika precizigo de la falanta funkcio i(p) de bildo 8.2.
Bildo 8.3: Observoj kaj sciigoj kun probablo
½ "pezas" 1 bit.
8.3 Mezurado de informacio
La vortkombinado ilustrita per la bildo 8.4 kondukas al la taüga funkcio i(p). Oni imagu, ke iu konstruas ILo-vortojn per hazarda, po unufoja tirado de tabulo el kvar repertuaroj. La diversaj tabuloj de la unua repertuaro surhavu po maksimume unu prefikson, tiuj de la dua repertuaro po unu radikon, tiuj de la tria eventuale unu sufikson kaj tiuj de la kvara repertuaro unu gramatikan finayon. Öar en neniu repertuaro du tabuloj estu same surskribitaj, neniu radiko estas pli malprobabla, do pli informaciriöa, ol alia radiko - kaj la sama validas por la tri aliaj leksemtipoj. Estas nature, postuli, ke la informacio i = i(p) estu tiel difinita, ke la informacio de la rezultanta, per kvar tabuloj kombinita ILo-vorto estas la sumo de la informacio aperceptebla de öi tiuj kvar tabuloj:
(8.1) i = ip+ ir + is + if
Normale la probablo - do la informacio - de la sekvanta leksemo dependas de la antaüaj leksemoj; sed en la kazo de nia modela vortfarado la leksemoj sinsekvas "sto-kastike sendependaj", tiel ke la tria tabulo havigas nek pli, nek malpli da informacio, se oni jam antaüe konas la surskribon de la unua kaj dua tabuloj.
ld u = ld up + ld ur + ld us + ld uf
En unua (imagad)eksperimento ekzistu
nek prefiksoj nek sufiksoj. Estas do nur po unu, malplena tabulo. Ankaü
la repertuaro de la finaytabuloj konsistu el nur unu tabulo, sur kiu staras
la adjektiva finayo a. Pro tio, ke la repertuaron de la radikoj
reprezentu du tabuloj (grand, rapid), oni povas per la entute
kvar tabuloj kombini 2 vortojn (granda, rapida) - ili konformas
en la bildo 8.4 al la 2 vojoj de la unua startpunkto tra la skemo de la
kombinebloj. Ambaü vortoj (vojoj) havas laü bildo 8.2 la
| Bildo 8.4: La informacio de vorto estas la sumo de la informacivaloroj, kiujn havigas unu post la alia la sinssekvaj vortpartoj (leksemoj). En la plej simpla kazo de (unue:) "stokastike sendenpenda" sinsekvo de la (due:) samprobablaj leksemoj öiuj u = up.ur.us.uf eblaj vortoj estas egalprobabloj (p = 1/u) kaj ilia egala informacio estas |
| informacion 1 bit, öar ambaü ekestas laü probablo ½. Jam la radiktabulo sole havigas 1 biton da informacio, öar äi estis elektita laü probablo ½ (la vojo estis laü öi tiu probablo tiel daürigata öe la disbranöiäpunkto al la du radikoj). Laü formulo (8.1) la tri aliaj tabuloj havigas do po la informacion 0. Tio qajnas esti memkomprenebla kaze de la prefikstabulo kaj de la sufikstabelo, sur kiuj ja nenio staras. Ke ankaü la gramatika finayo a ne havigas informacion, se oni jam anticipe scias, ke öiam öi tiu tabulo montriäos, konformas al la öiutaga parolmaniero, ke öi tiu tabulo resp. äia surskribo estas "seninforma": oni ja ne ekscias ion novan, do ne havas malfacilon diveni la sur-skribon de öi kvara tabulo. Se mesaäo por ricevonto jam anticipe certas, äi estas por li seninformacia: i(1) = 0 - kiel jam desegnite en bildo 8.2. |
| Por dua eksperimento
ni disponigu du sufiksojn (et, eg) anstataü malplena sufikstabulo.
Nun evidente ankaü en la sufikso estas 1 bito da informacio, en la
tuta vorto do 2 bitoj. Entute en öi dua eksperimento eblas u =
4 vortoj (vojoj tra la dua skemo), öiu havante la probablon p =
1/u = ¼, do la informacion i(¼) = 2
bit.
Kiom estas i(1/8)? Tion evidentigas la tria eksperimento, kie oni elektas el kvar radikoj, de kiu öiu do havas la probablon ¼, do la informacion i(¼) = 2 bit. Pro tio, ke en la sufikso estas - same kiel en la dua eksperimento - 1 bit, öiu el la u = 8 rezultantaj vortoj do sume enhavas 0 + 2 + 1 + 0 = 3 bitojn, sekve devas validi: i(1/8) = 3 bitoj. (Oni prave jam konjektas, ke kreskas la informacio je 1 bit, se duoniäas la probablo.) Ni tiel daürigas, planante
la kvaran eksperimenton. Ni aldonas al la malplena prefikstabulo duan tabulon
surskribita per la prefikso mal, kaj al la du sufikstabuloj unu
kun ig kaj unu malplenan. La repertuaron de la radikoj ni pligrandigas
al 8, öar ni jam scias, ke i(1/8) = 3 bit. Nun ekestas u
= 2.8.4.1 = 64 eblaj
vortoj, öiu kun la sama informacio i(1/u) = i(1/64)
= 1+3+2+0 = 6 bit. Ekde la startpunkto pro daürigo de la vojo je
unu paqo adiciiäas informacio - äi estas 0, kie ekzistas ununura
voj-daürigeblo, kaze de disbranöiä-punkto äi estas
des pli granda, ju pli da branöoj tie ekzistas, sed öiu-kaze
tie validas i > 0. Ni rimarkas, ke ne nur la vorto
malgrandeta enhavas 6 bitojn da informacio, sed ankaü la vorto
grandeta, kaj eö la vorto granda, öar öiuj
vojoj tra la skemo, ankaü tiuj tra malplenaj tabuloj, estas samprobablaj,
do öiuj 64 eblaj vortoj. En la kvara eksperimento do ankaü
malplena tabulo, do foresto de afikso, enhavas informacion. Tio ne
estas absurda sed respegulas la parolturnon: "Neniu respondo ankaü
estas respondo." Krome öi tiu rezulto substrekas, ke la nombro de signoj en mesaäo ne taügas kiel mezuro de la informacio: la vorto malgrandeta konsistas el 4 leksemoj (11 literoj), la saminformacia vorto granda nur el 2 leksemoj (6 literoj). |
| Nun la seröata funkcio i(1/u) senvualiäas: la repertuaro de la eblaj kaj en la eksperimento samprobablaj vortoj ja kreskas kun la produto de la amplekso de la repertuaroj de la kvar vortpartoj, ilia samgranda informacio i laü (8.1) kun la sumo de iliaj informacioj: |
(8.2) i(1/u) = i(1/up.ur.us.uf)
= i(1/ up) + i(1/ ur)
+ i(1/ us) + i(1/ uf)
Tiun öi kondiöon plenumas la logaritmo je ajna bazo (sed neniu alia kontinua funkcio). Por ke estu i(½) = 1 konforme al la elektita mezurunuo, la bazo de la logaritmo devas esti 2, kaj oni nomas la logaritmon latine "logaritmus dualis". Por la komunikadkibernetiko (unue - Frank, 1959, p. 17 -por la informaciestetiko kaj la informacipsikologio, baldaü poste ankaü por la klerigkibernetiko kaj la lingvokibernetiko) oni do difinis kiel ("subjektive") informacion de ia signo aü observeblayo, kiu estas antaüvidita en la akomodilo de iu ricevonta aü observanta subjekto kiel unu el la ebloj (kies "subjektivaj probabloj" wk laü la äisnunaj spertoj povas esti malegalaj!)
(8.3) ik := 2log 1/wk (= log2 1/wk) =: ld 1/wk
La logaritmoj de x je diversaj bazoj estas proporciaj unu al la alia. Validas ekz.
(8.4a) lg x = lg 2 . ld x (lg x := 10log x)
(8.4b) ln x = ln 2 . ld x (ln x := elog x)
Se oni do disponas pri tabelo de dekumaj logaritmoj lg x aü de naturaj logaritmoj ln x (aü se tian funkcion ofertas klavo de poqkalkulilo), eblas kalkuli la duuman logaritmon ld x, do informacivalorojn, laü la simpla formulo
(8.4c) ld x = lg x / lg 2 = ln x / ln 2
| El (8.3) sekvas la respondo al la demando, al kiom da bitoj egalas 1 decit. Äi ja estas la informacio de signo kun probablo 1/10, do kun informacio ld 10 bit 3,3219 bit (vd. bildon 8.2!). Laü (8.4a) oni ricevas la informacion en decit, se oni multiplikas la en bitoj mezuritan informacion per lg 2 0,30103. - |
| 8.4 La informacipsikologie
plej gravaj informaciteoriaj rezultoj. Nocioj ne utilas, se oni pri ili
ne povas pli eldiri ol ilia difino. Speciale mezurunuo estas utila nur,
se äi
|
| Por geometriaj, kinematikaj kaj fizikaj nocioj kaj mezuroj, ekz. la distanco mezurata en metroj, la daüro mezurata en sekundoj kaj la maso mezurata en (kilo)gramoj, öiuj tri kondiöoj estas plenumitaj. La kibernetiko komencis plenumi öi tiujn kondiöojn por la informacio, mezurata en bitoj. La informaciteorio, fondita de Shannon (1948), pruvis matematike kelkajn gravajn äeneralajn leäojn, kiuj grandparte rilatas al ebloj de la kodigo kaj havas - almenaü parte kaj post konkretiga adaptado - ankaü psikologiajn konsekvencojn. |
| Estas konate, ke sur
teletajpilaj strioj, sur trukartoj kaj en la storiloj de komputiloj informo
estas binare kodita, t.e. per nur du diversaj signoj, ekzemple per truo
(0) aü manko de truo (X) je difinita
loko. Por senambigue kodigi ekzemple la kvar signojn A, E, I, O
kompreneble ne sufiöas po unu binara signo, unu "kodbito"
(ger-mane: Bit), sed tia kodo bezonas tutajn, normale pli longajn kodvortojn.
Äi povas uzi ekz. OO (aü XX) por
A, OX (aü nur O) por E,
XO (aü XOO) por
I kaj XX (aü XOX) por
U. La "mesaäo" IUEAEAEE
(kiu povas, sed ne devas havi ian semantikan signifon
en iu lingvo!) transformiäas laü öi
tiu kodo en seninterrompe skribeblan sekvon de 8 kodvortoj por la N
= 8 (tekst)signoj: XOXXOXOOO-XOOOXOX (resp.,
en la dua kodo, en XOOXOXOXXOXOOO). Eblas krei senfinan nombron da tiaj binaraj kodoj; oni nur devas respekti, ke la kodvorto de neniu signo estu ankaü la komenco de la kodvorto de alia signo, por ke senambigua malkodo eblu. Por qpari storlokon aü sendadtempon taügas tiu(j) kodo(j), kiu(j) transformas la mesaäon en laüeble mallongan sinsekvon da binaraj signoj. En nia ekzemplo la kodo enhavanta nur kodvortojn kun la longeco l = 2 bezonas L = 16 binarajn signojn (Bit) por la mesaäo kun longeco N = 8 tekstsignoj (angle: tokens) el u = 4 diversaj repertuarsignoj (angle: types), do aritmel = L/N = 2 Bit/tekstsigno. La iom pli komplika kodo, kiu uzas nur 1 binaran signon por la ofte en la mesaäo aperanta signo E, kaj, kompense, po 3 binarajn signojn por la maloftaj signoj I kaj U, bezonas por la tuta mesaäo nur L = 14 kodbitojn, do l = (14/8 =) 1,75 Bit/tekstsigno. Oni povas pruvi, ke neniu kodo bezonas malpli. Tio estas aparte simpla ekzemplo por fundamenta teoremo de la matematika informaciteorio de C.E.Shannon (1948), laü kiu por la plej qpariga kodo validas |
(8.5) H /bit l /Bit < H /bit + e
H estas la aritma informacio de la signoj en la mesaäo, t.e. la tuta informacio de la mesaäo dividite per N - do mezuro de la koncizeco. l, la arimta longeco de la kodvortoj, kalkuliäas kiel longeco L (Bit) de la kodita mesaäo dividite per la longeco N (tekstsignoj) de la nekodita mesaäo. e > 0 estas nombro, kiu povas esti laüplaöe malgranda, se oni eventuale akceptas tre komplikan kodon. Oni vidas, ke E aperas 4-foje en nia 8 signojn longa mesaäo - do (se la mesaäo estas tipa por la kutima ofteco de la signoj) laü probablo ½; äia informacio do estas öiufoje 1 bit. Same kalkuliäas la informacoj de A je 2 bit, de I kaj U je po 3 bitoj. Aritme ilia informacio estas
(8.6) H = ½ . 1 bit + ¼ . 2 bit + 1/8 . 3 bit + 1/8 . 3 bit = 1,75 bit
| Precize la saman nombron
ni ricevis por la aritma longecol de la kodvortoj de la pli komplika
kodo. Öi tiu ruze kodigas öiun signon per tiom da kodbitoj, kiom
da bitoj da informacio äi enhavas, tiel ke öiu kodbito transportas
aü storas 1 bit da informacio. La kodo do estas laü (8.5) optimuma.
La pli simpla kodo bezonas 2 kodbitojn por transporti aü stori aritme
1,75 bit; äia koncizeco do ne estas 100% sed nur 1,75/2 = 87,5% -
la deficito, do 12,5%, nomitas kodredundanco. En unu kodbiton oni povas aritme neniam qtopi pli ol 1 biton da informacio - kaj aliflanke oni devas aritme apenaü malpli enqtopi, se oni sufiöe ruze kodigas. |
| La informacipsikologio
pruvas empirie, ke la nerva sistemo tendencas per la akomodilo ruze kodigi
(t.e. adapti la subjektivajn probablojn w al la relativaj aper-oftecoj
de la aperceptotaj signoj [do lerni probablojn] kaj laüeble precize
per ld 1/w Bit kodigi öi tiujn signojn [t.n. informacieca
adaptiäo]). La mezuma plenkreskulo tial aperceptas sendepende de la koncizeco H de mesaäo proksimume 16 bitojn je sekundo kaj lernas ö. 40 - 50 bitojn je minuto. (Vd. la öapitron 5 en Frank, 1969, aü, pli koncize, la öapitron 6 en Frank, 1996.) |
| Ankaü tri pluaj teoremoj de la informaciteorio (la tria estis starigita aparte por adapti la informaciteorion al la bezonoj de la komunikadkibernetiko) koncernas la informacipsikologion. |
| 1. Sinsekvo de signoj el repertuaro kun u diversaj signoj havas la maksimuman informacidensecon, nome Hmax = ld u, se öiu de la u signoj öie en la sinsekvo aperas laü la sama probablo 1/u. La (absoluta aü relativa) deficito al ld u nomitas (absoluta resp. relativa) redundanco de la signovico; la komplemento de la relative redundanco, do H / ld u, nomitas äia koncizeco. - Plej koncizajn, do senredundancajn signovicojn oni aütomate legas aparte malrapide - t. e. oni legas aparte malmultajn signojn je sekundo, öar la plenkreskulo jam tiel aperceptas 16 bitojn je sekundo. |
| 2. Signoj ne nepre sinsekvas stokastike sendepende, sed ilia aperprobablo plejofte dependas de tio, kiuj signoj antaüiris. (Ekz. al q en francaj vortoj preskaü öiam, en germanaj vortoj öiam sekvas u; öi tiu litero öiloke do estas en la Franca preskaü, en la Germana tute seninformacia.) La informacidenseco (kaj sekve la koncizeco) de tiaj signovicoj estas malpli granda ol äi estas post hazarda aliordigo, kaj äi estas des pli malgranda, ju pli longa estas la öeno de la antaüirintaj signoj, de kiuj la aperofteco ankoraü dependas. - La normigo de la vortordo en la frazo tial plifaciligas la legadon - öiu devio de la kutima sinsekvo (subjekto - predikato - objekto en multaj lingvoj) estas - se äi estas permesita (ne en la Angla kaj Öina!) - pli informaciriöa, "rara esprimmaniero", kiun oni estetike "äuas", do malrapide legas. |
| 3. Se la subjektivaj probabloj wk, laü kiuj la akomodilo strebas al optimuma kodigo, devias de la aperprobabloj pk, tiam la (subjek-tiva) informacidenseco estas pli granda ol por ricevanto de la sama mesaäo, kiu jam estas alkutimiäinta al la pk, tiel ke por li validas wk = pk. - Partneron el fremda lingvoregiono, kies lingvon oni estis lerninta en la lernejo, sed sen jam lerni nekonscie ankaü äian oftecstatistikon, oni do kutime petas, paroli malpli rapide, öar oni ja komprenas öiun vorton, kiu tamen aritme estas ankoraü tro informaciriöa por rapida konsciiäo. |
| Simplajn pruvojn, agordigitajn
al komunikadkibernetiaj aplikebloj, oni trovas por öi tiuj kaj por
aliaj faktoj de la matematika informaciteorio precipe en Frank, 1969, vol.
1, öapitro 3, kaj en Frank, 1972.
|