| 9. Die Messung der Lehrstoffinformation (= Lehrstoff-Informacio) und des Lernfortschritts. |
9.1 Das erste Rateverfahren von Klaus WELTNER (1966). |
| Könnte man von jedem der aufeinanderfolgenden Textzeichen eines beliebigen Textes (z. B. von den Buchstaben und anderen Schreibmaschinenzeichen, oder den Lexemen, oder den Wörtern) sagen, mit welcher Wahrscheinlichkeit sie (statt eines anderen Repertoirezeichens) dort erscheinen, dann könnte man leicht die Information des ganzen Textes berechnen. Man bräuchte ja nur - nach dem in Bild 8.4 bzw. in Formel (8.3) gegebenen Vorbild - nach (8.2) für jedes Textzeichen die Informacio zu berechnen, welches es hier hat (an anderer Stelle ist die Wahrscheinlichkeit, also die Informacio, im Normalfall der stochastischen Abhängigkeit im allgemeinen eine andere), und dann alle Ergebnisse aufaddieren. |
| Jedoch ist schon der Vorrat der wenigstgens 32 Schreibmaschinenzeichen zu groß, um ausreichende Wahrscheinlichkeitstabellen aufstellen zu können. Wenn man den Text unter Wahrung dieses Vorrats "verdampft", d. h., wenn man den Text in Stücke mit je einem solchen Zeichen zerschneidet und die Teilchen in eine zufällige neue Reihenfolge bringt, so daß diese stochastisch unabhängig wird, dann kann man ja für diesen "verdampften" Text die Zeichenhäufigkeiten zählen und die Wahrscheinlichkeiten berechnen, die nun vom Auftrittsort unabhängig sind. Die dann berechenbare mittlere informacio H der Schreibmaschinenzeichen ist kleiner als ld u = 5 bit, denn die Zeichen sind nicht gleichwahrscheinlich, also selbst der "verdampfte" Text etwas redundant. Man berechnet zum Beispiel für (geschriebene) deutsche Texte (u = 30) H 4,1 bit/Zeichen, folglich als relative Redundanz r 16% (für das gesprochene Deutsch [u = 31] H 4,5, r 9%), für das (geschriebene) Englisch (u = 27) H 4,0 bit/Zeichen, r 15% - und Werte ähnlicher Größe für andere europäische Sprachen ebenso wie für ILo. |
| Noch redundanter wird der Text, wenn man ihn,
nach der Verdampfung, so rekonstruiert, daß auf jedes Repertoirezeichen
die einzelnen Repertoirezeichen gleichoft wie im Originaltext folgen. Diesem
Originaltext nähert sich das so konstruierte Textmodell besser an,
denn es behält nun auch die Häufigkeiten aller 2-tupel (Paare)
aufeinanderfolgender Zeichen bei. Aus deren Wahrscheinlichkeiten, oder
aus den bedingten Wahrscheinlichkeiten der einzelnen Zeichen als Nachfolgezeichen
eines bestimmten Zeichens, kann man erneut die Informationsdichte
H in dieser zweiten Annäherung berechnen. Wegen des erwähnten
informationstheoretischen Gesetzes H ld u (vgl. Abschnitt
8.4) ist das Ergebnis kleiner: empirische Ergebnisse liegen für Deutsch
wie für Englisch (wie wahrscheinlich für alle lateinisch geschriebene
europäische Sprachen) bei H 3,4 bit/Zeichen, r 30%. - Die
Statistik, dieser Berechnung zugrundezulegen ist, muß bereits für
u2 322 = 1024 Zeichenpaare erstellt werden.
Dieser erforderliche Umfang wächst auf u3 323 = 32768 Zeichentripel für die folgende Stufe des Sprachmodells, in welchem die Informationsdichte auf etwa H 2,7 bit/Zeichen (r = 43%) gesunken ist; usf. In normalen Texten erstreckt sich die stochastische Abhängigkeit auf viel mehr Vorgängerzeichen. (Beispiel: nach der Zeichenfolge "Der Präsident betonte in seiner Eröffnungsansprache, #" folgt an der Stelle # sehr wahrscheinlich der Buchstabe d.) Eine rein sprachkybernetisches Vorgehen zur Erstellung der statistischen Basis ist also nicht verwirklichbar. |
Klaus Weltner (1966, 1970), der dabei ein Verfahren
vervollkommnete, das schon Shannon (1951) selbst erdacht hatte, fand Auswege,
um dennoch die Textinformation zu messen. Seine zwei Grundideen waren:
|
| Sowohl Shannon als auch Weltner maßen
die Information eines Textes durch die Fehler, welche Versuchspersonen
machten, als sie die aufeinanderfolgenden Zeichen erraten sollten. Wo es
nur eine mögliche Fortsetzung gibt, wie im Falle der Endung in den
Beispielen von Bild 8.4, entsteht kein Fehler. Die Wahrscheinlichkeit des
zufällig richtigen Erratens nimmt aber desto weiter ab, je mehr Fortsetzungsmöglichkeiten
des Textes existieren: im Beispiel 4 von Bild 8.4 ist die Ratewahrscheinlichkeit
der eventuellen Vorsilbe ½, der eventuellen Nachsilbe ¼,
der Wurzel 1/8. Nutzt man viele Versuchspersonen (die die über alle
Möglichkeiten der Textfortsetzung überall im Text gleich orientiert
sind) könnte man also aus der relativen Häufigkeit der Fehler
die Informacio bestimmen; sie ist offensichtlich größer, wo
man weniger leicht rät, was als größere Fehlerzahl beobachtbar
ist. (Wegen der Gleichwahrscheinlichkeit der Alternativen im Falle des
vierten Beispiels von Bild 8.4 werden etwa ½ bzw. ¼ bzw.
1/8 der Versuchspersonen, die nicht wissen, um welches Wort es sich handelt,
die Vorsilbe bzw. die Nachsilbe bzw. die Wurzel richtig erraten - und die
Informationswerte sind ja beziehentlich ld 2 bit, ld 4 bit und ld 8 bit.)
Shannon ließ buchstabenweise raten, und die Versuchspersonen mußten im Bedarfsfall mehrmals raten, bis sie das richtige Zeichen fanden - selbst wenn dies in seltenen Fällen mehr als 20 Versuche erforderte. Weltner halbierte das Repertoire der möglichen Zeichen und fragte nur, in welcher Hälfte sich das Fortsetzungszeichen des Textes befindet. Dann halbierte er die richtige Hälfte und stellte über diese dieselbe Frage - so daß nach jeweils fünf Halbierungen jedes Zeichen erraten wurde. Bild 9.1 zeigt eine (von B.S.Meder, 1977, entwickelte) Anpassung dieser Vorgehensweise an die Informationsbestimmung von ILo-Wörtern oder ganzen Texten mittels Teilnehmern am Sprachorientierungsunterricht. Wenn die Versuchsperson die Fortsetzung kennt, irrt sie sich bei keinem der fünf Schritte bis zu ihrer Bestimmung. Wenn sie raten muß, und wenn jedes Repertoirezeichen (mit gleicher Wahrscheinlichkeit) infrage kommt, irrt sie jeweils zufällig 0-, 1-, 2-, 3-, 4- oder sogar 5-mal über die richtige Hälfte (wobei sie im Mittel 2,5 Fehler macht). Wenn sie an einer bestimmten Stelle des Wortes oder des Textstücks weiß, daß es nur zwei mögliche Fortsetzungszeichen gibt, irrt sie sich über die richtige Hälfte nicht, wenn sich beide Zeichen in ihr befinden; sie irrt hier also höchstens einmal (im Mittel 0,5-mal). |
Wo also ein Fehler passierte, dort mußte geraten werden, denn es fehlte Informacio - und es genügte 1 bit (das durch die Bestätigung - "ja!" - oder Berichtigung - "nein!" - seitens des Versuchsleiters zu erhalten war). Wo kein Fehler passierte, dort kannte die
Bild 9.1: Anpassung des ersten ("klassischen") Weltnerverfahrens
an die Informationsmessung im SpOU (nach Meder, 1977).
| Versuchsperson entweder die Fortsetzung, oder sie erriet sie zufällig richtig. Angenommen die Versuchsperson hatte in den Fällen, in denen sie raten mußte, ebensooft Erfolg wie Mißerfolg, dann war die Zahl der (nicht beobachtbaren) Fälle, in denen sie raten und die fehlende Information aus der Bestätigung oder Berichtigung durch den Versuchsleiter erhalten mußte, das Doppelte der Zahl E der (beobachtbaren) Fehler. Die Information war also |
(9.1) i/bit = 2E
Wenn die vorgesehenen Versuchspersonen nicht mehr Grundschulkinder sind, dann ist es natürllich nicht nötig, gemäß Bild 9.1 nach jeder Antwort über die richtige Hälfte ("Das Zeichen ist oben / unten?, oben / unten?, rechts / links?, rechts / links?, rechts / links?") die falsche abzudecken. Weltner (1966) selbst benutzte für ältere Versuchspersonen (und deutschsprachige Texte) einen Codebaum (Bild 9.2). Dort mußte man - wie in Bild 8.4 - von einem Anfangspunkt aus den Weg (rechts / links ...) bis zum richtigen Schreibmaschinenzeichen erraten. Man erriet also eigentlich dessen Codewort (wie in den in Bild 8.4 dargestellten Fällen die Aufeinanderfolge von Lexemen zu erraten war, aus welchen das Wort selbst - als ein "Superzeichen" - besteht).
| Bild 9.2: Verzweigungsbaum für das klassische Weltnerverfahren. |
| 9.2 Der Informationsgehalt von Vokabeln
Man kann das Weltnersche Rateverfahren benutzen, um den Informationsgehalt zu lernender Vokabeln zu ermitteln. In Abschnitt 6.3 unterschieden wir dabei schon zwischen dem Erwerb des (bloßen) Verständnisses (passive Beherrschung, d. h. des Herübersetzenskönnen) einer Vokabel und deren (auch) aktiver Beherrschung. Letzteres ist nach (6.3, 6.4) schwerer zu erwerben, da die Lernwahrscheinlichkeit a für den Erwerb bei nur einer Lerngelegenheit kleiner ist. Die "Lernunwahrscheinlichkeit" 1/a ist also größer. Und 1/a ist die durchschnittlich benötigte Zahl von Lerngelegenheiten1. |
| Wenn ein deutscher Lerner das ILo-Wort für das deutsche Wort "Klammersatz" lernen muß, dann muß er lernen, daß der erste Buchstabe des ILo-Worts ein P ist, das zweite ein A, das dritte ein R, das vierte ein E usw. Beim Anwenden des Rateverfahrens nach Bild 9.2 muß er also über den ersten Buchstaben raten, daß man ihn vom Wurzelpunkt des Codebaums aus erreicht, indem man nacheinander nach rechts, nach links, nach links, nach rechts und nach rechts geht. Deutsche Schüler oder Studenten irren dabei im Mittel F = 2-mal. Nach (9.2) enthält also der erste Buchstabe 2 mal 2 bit, also 4 bit. Das ist tatsächlich die mittlere Informacio im Anfangsbuchstaben, der ja - im Falle von Vokabeln - nicht von vorangehenden Buchstaben abhängt. Genauer: die vorangegangenen Zeichen waren der Text: |
"Klammersatz_estas_en_ILo_ ".
| Für einen Lerner, der schon wenigstens ein paar Dutzend ILo-Wörter kennt, sich also wenigstens an die einfachen (nicht bedingten) Buchstabenhäufigkeiten gewöhnte, aber keine Kenntnisse über die Herkunft (aus dem Franzöischen oder Deutschen oder...) der ihm noch nicht bekannten ILo-Wörter hat (denen gegenüber er sozusagen "Laie" ist), enthält deren Anfangsbuchstabe im Mittel ungefähr H = 4 bit Informacio, denn nach dem Zwischenraum ("_") treten die Buchstaben mit mehr oder weniger derselben relativen Häufigkeit wie im gesamten Text auf (zumindest wenn der Text "verdampft", d. h. in einzelne, zufällig aneinanderreihbare Wörter zerschnitten ist). Ist aber bekannt, daß der Anfangsbuchstabe P ist, dann wird jeder, dessen Akkomodator schon etwas an die statistische Struktur von ILo-Lexemen gewöhnt ist, als zweiten Buchstaben entweder einen der fünf Vokale oder r oder (weniger häufig) l erwarten, vielleicht sogar n, s, t - kaum f und q (andere Möglichkeiten findet man nicht im Plena ilustrita vortarode Waringhien, 1970). Er zieht also 7 - 12 Möglichkeiten sehr untereschiedlicher Wahrscheinlichkeit in Betracht. Die Informacio des zweiten Buchstabens, falls P der erste war, kann also im Mittel höchstens 2,8 - 3,5 bit sein; Da 1/8 der Lexeme, die mit P beginnen, als zweiten Buchstaben ein A haben, ist dessen Informacio an dieser Stelle 3 bit. Im Mittel aller ILo-Vokabeln erreichen deutsche Schüler, die sprachstatistisch an ILo gewöhnt sind, durch den Codebaum den zweiten Buchstaben mit durchschnittlich nur einem Fehler - die mittlere bedingte Informacio des zweiten Buchstabens ist also nach (9.1) 2 bit. Da der zweite Buchstabe von ILo-Lexemen meist ein Vokal ist, gibt es für die dritte Stelle meist viele Möglichkeiten; daher werden beim Vorhersageversuch des dritten Zeichens etwas mehr Fehler (E 1,3) gemacht, entsprechend einer mittleren Informacio von ungefähr (2F =) 2,6 bit (vgl. Bild 9.3). Wenn man weiß, daß die grammatische Endung von Substantiven O ist, dann wäre diese informationslos, wenn man wüßte, daß das Lexem PARENTEZ lautet. Daß man etwa 0,5 bit Informacio in O mißt, bedeutet, daß nur etwa 1/20,5 70% der Versuchspersonen unterstellten, daß bereits die grammatische Endung kommt, oder jedenfalls der Buchstabe O, auf den nicht sicher aber wenigstens mit der Wahrscheinlichkeit 1/20,057 96% dann der Zwischenraum folgt, der das Wortende anzeigt. |
| Wer die ILo-Übersetzung von "Klam-mersatz" kennt (also bezüglich dieser Vokabel "Fachmann" ist), macht keinen Fehler: E = 0. Die Information, daß die Übersetzung in ILo PARENTEZO lautet, hat für ihn keine Informacio - mit anderen Worten: sie hat für ihn die subjektive Informacio 0. |
| Zwischen diesem "Fachmann" und jenem "Laien" gibt es Lerner mit teilweisen Vorkenntnissen. Wer beispielsweise sich daran gewöhnte, daß 2/3 des Lexemvorrats von ILo aus latiniden Sprachen oder aus Latein selbst stammen, und außerdem die französische Übersetzung "parenthèse" kennt, wird bei den ersten sieben Buchstaben der ILo-Vokabel kaum einen Fehler machen; deren gesamte subjektive Information, nämlich etwa 1 bit, steckt im achten Buchstaben, de auch S hätte sein können. |
| Wenn das Informationsmaß tatsächlich die Schwierigkeit der Apperzeption und des Lernens mißt, muß sich in ihm irgendwie der in Kapitel 6 untersuchte Umstand niederschlagen, daß die Lern- |
Bild 9.3: Mittlere Information in den aufeinanderfolgenden Buchstaben
von ILo-Vokabeln für Fortgeschrittene, die schon an die Buchstabenhäufigkeiten
an den verschiedenen Stellen von ILo-Wörtern gewöhnt sind. (Aus
Frank, 1984b.)
| wahrscheinlichkeit für den aktiven Gebrauch der Vokabel PARENTEZO, also die Assoziation PARENTEZO Klammersatz, schwerer als der bloß passive Gebrauch zu erlernen ist, also als das Lernen der Assoziation PARENTEZO Klammersatz. Man könnte erneut das Rateverfahren von Weltner anwenden, diesmal jedoch um die Information in der deutschen Übersetzung zu messen. Unser "Laie", der keinerlei Zusammenhang zwischen den beiden Ausdrücken sieht, jedoch den Begriff selbst und das zugehörige deutsche Fachwort kennt, wird das erste Teilwort dieses zusammengesetzten Fachausdrucks mit nicht wenig Fehlern raten; die Fortsetzung "satz" ist dann eine von verhältnismäßig wenigen sinnvollen Möglichkeiten, bringt also nicht mehr viel Informacio. Dennoch wird das deutsche Wort kaum weniger als die Hälfte an Informacio gegenüber seiner Übersetzung in ILo haben. Dies kommt im nur etwa halben Zeitbedarf für die Apperzeption, also für das Lesen des Wortes in der eigenen Sprache im Vergleich zum fremdsprachlichen Wort parentezo zum Ausdruck. Aber nach (6.4) ist die Lernwahrscheinlichkeit für dessen aktiven Gebrauch nur etwa 40% im Vergleich zur Wahrscheinlichkeit der Aneignung der Fähigkeit, das Wort zu verstehen. Man muß also mit beträchtlich mehr als der doppelten, nämlich mit ungefähr der (1/0,4 =) 2,5-fachen Lernzeit rechnen. Man scheint also für das Verstehenlernen fremdsprachlicher Vokabeln weniger lernen zu müssen, als die Anwendung des Ratetestes vermuten läßt. |
| Eine Lösung dieses Paradoxons legen die Bilder 5.1 nahe. Hat man Klammersatz als deutsche Bedeutung von PARENTEZO apperzipiert, dann assoziiert man sogleich zu diesem deutschen Wort seine Bedeutung, stellt sich also irgend etwas Ähnliches wie [Satz] vor. Der Vorrat unkombinierter Begriffe ("800.000 schwarze Schafe" ist eine Kombination aus - mindestens - drei Begriffen!), die sich in unserem Gedächtnis befinden, hat einen Umfang von höchstens etwa einer Million; die Informacio eines solchen Begriffs übersteigt im Mittel also nicht 20 bit. Auch dieses Ergebnis liefert aber nicht die gewünschte Erklärung, denn für das Verständnis von 100 Vokabeln müßten demnach rund 2.000 bit Informacio über die Bedeutungszuordnung (semantische Information) gelernt werden - zusätzlich zur Information, die nach Bild 6.5 über den Aufbau der fremdsprachlichen Vokabeln mindestens zu lernen ist, um sie wiedererkennen zu können. Nach der ersten Apperzeption, aber vor Schluß des Lernens der Vokabeln erfolgt nun aber im Akkomodator eine Repertoireanpassung an die vielleicht 100 Begriffe, die durch die zu lernenden Vokabeln kodiert sind, also an nicht mehr als 7 bit (semantischer) Informacio in nur einer von ihnen. Nur diese Zuordnung der Bedeutung muß (außer den zur Wiedererkennung der Vokabel nach Bild 6.5 ausreichenden Merkmalen) gelernt werden - ihren deutschen Ausdruck kennt man ja schon. Lernt man umgekehrt das fremdsprachliche Wort, dann reicht das Lernen der Bedeutung (also z.B. 7 bit semantischer Information) und der in Bild 6.5 hervorgehobenen Fragmente des fremdsprachlichen Wortes nicht aus, denn man hat ja die vollständige Buchstabenfolge des bedeutungstragenden fremden Wortes noch nicht gelernt (sondern beginnt diese zu lernen). |
9.3 Messung der Lehrstoffinformation. |
| Der Unterschied zwischen jemand, der über
etwas Fachmann ist, und einem diesbezüglichen Laien besteht offensichtlich
darin, daß dieses Etwas zwar dem Fachmann, nicht aber dem Laien bekannt
ist. Es ist also der Lehrstoff, den der Laie noch lernen muß, um
Fachmann zu werden (genauer: um als solcher anerkannt zu werden). Kognitive
Lehrstoffe (z.B. Grammatik oder Vokabeln einer Fremdsprache, geographische
oder biologische Fakten oder technologische Vorgehensweisen) sind meist
verbalisierbar. Eine möglichst knappe Formulierung eines Lehrstoffs
heißt "Basaltext (BT)". Beispiele sind eine Vokabellisto
oder die grammatische Regel: "In ILo wird die Mehrzahl sowohl bei
Hauptwörtern als auch bei Eigenschaftswörtern durch die grammatische
Endung j ausgedrückt; im Wen-Fall ist bei beiden Wortarten
in Einzahl und Mehrzahl n der Schlußbuchstabe."
Das Weltnersche Rateverfahren ermöglicht es, die subjektive Informacio eines solchen Basaltextes zu messen. Sie ist offensichtlich für einen Laien höher als für einen Fachmann: iL(BT) > iF(BT). Die Differenz heißt "Lehrstoffinformacio" I. Daraus und aus (9.1) folgt |
(9.2) I := iL(BT) - iF(BT) = 2(EL - EF) > 0
| Meist weiß der Fachmann über "Etwas" mehr, als aus irgendeinem Grund gelernt werden muß, also mehr als im BT formuliert ist. Dann ist die zu |
Bild 9.4: Die Lehrstoffinformation ist die subjektive Information
eines den Lehrstoff vollständig enthaltenden Basaltextes für
den vorgesehemnen Lerner (den "Adressaten") abzhüglich der
bloßen ("ästhetischen") Information des Formulierungsstils
desselben Basaltextes, meßbar als dessen subjektive Information für
einen Fachmann
| lernende Lehrstoffinformation nur ein Teil der Kenntnissse des perfekten Fachmanns (Bild 9.4); die ihm bekannte Informacio über das "Etwas" übertrifft also die Lehrstoffinformacio. |
| Andererseits weiß selbst der, der über etwas Fachmann ist, nicht, wie dieses Etwas im BT formuliert ist, falls es mehrere gleichbedeutende Formulierungsmöglichkeiten gibt. In unserem grammatischen Beispiel hätten zuerst die Eigenschaftswörter und erst dann die Hauptwörter erwähnt sein können. Das muß selbst ein perfekter Fachmann nicht wissen, denn es handelt sich nicht um semantische Information des BT über die Spezialität des Fachmanns sondern nur um stilistische Formulierungsinformation, die sogenannte "ästhetische Basaltextinformacio". Sie ist für ihn die subjektive Informacio von BT: |
(9.3) iest(BT) = iF(BT)
| Normalerweise besteht die Lehrstoffinformation aus der semantischen Information des Basaltextes, d. h. aus dem, was der BT von den zu lernenden Kenntnissen des perfekten Fachmanns vermittelt (Bild 9.4). In der Schulpraxis kommt es häufig, beim gleichzeitigen Lehren von Fach und Fachsprache (was erstmals von Becker-Frank [Materne] 1970 erprobt wurde) immer vor, daß der Laie nicht "ideal" in dem Sinne ist, daß er zwar nichts über den Fachlehrstoff weiß, aber die Sprache, in welcher der BT formuliert ist, perfekt beherrscht. Er macht also im Ratetest mehr Fehler als ein "idealer Laie", also steigt nach (9.2) I. Zur semantischen Informacio, die auch vom "idealen Laien" gelernt werden muß, kommt die Informacio über die Sprache des BT und (im Normalfall) des Unterrichts hinzu; normalerweise muß diese Informacio zusätzlich gelernt werden (beispielsweise durch Lerner aus anderen Sprachbereichen). |
9.4 Das zweite (vereinfachte) Weltnersche Rateverfahren (1967) . |
Es wäre angenehm, weil zeitsparend, gäbe
es eine Kombinationsmöglichkeit
derart, daß die Versuchsperson nur je einmal die Schreibmaschinenzeichen (oder gar ganze Lexeme oder Wörter) zu raten hat und dann gleich bestätigt wird, oder - in den F Fällen, in denen sie irrte, die Korrektur durch die Mitteilung des richtigen Zeichens erhält. Eine solche Vereinfachung seines Verfahrens legte Weltner 1967 vor - ein Jahr nach seinem bahnbrechenden Vortrag beim "4. Nürtinger Symposion über Lehrmaschinen in Düsseldorf". Sie benötigt anstelle von (9.1) die Formel |
(9.4) i(F) = mF - nN
| um die Informacio aus der Fehlerzahl näherungsweise
zu berechnen. N bezeichnet die Zahl der Textzeichen (also der Rateversuche),
m und n sind noch zu bestimmende Parameterwerte. Auch diese Beziehung ist theoretisch leicht verständlich. Die Informacio von etwas mißt ja die Schwierigkeit, dieses Etwas vorherzusehen, und diese Schwierigkeit zeigt sich durch die Fehlerzahl F. Also muß i(F) = NH von i(0) = 0 bis zum Maximum ld u ständig steigen - folglich bei u = 32 zu unterscheidenden Zeichen, wie in den Bildern 9.1 und 9.2 angenommen, bis NHmax = 5N bit. Weil dieses Maximum erreicht wird, wenn alle Zeichen die gleiche Wahrscheinlichkeit 1/u haben (vgl. Abschnitt 8.4), werden sie nur mit dieser Wahrscheinlichkeit richtig geraten. Dann ist die relative Fehlerzahl F/N = (u-1)/u 97%, und i(F) erreicht an dieser Stelle, d. h. für etwa 0,97N Fehler, das Maximum i(0,97N) = 5.N bit. Unabhängig davon, ob i(F) proportional, beschleunigt oder verzögert mit F steigt, muß sie in jedem, nicht zu großen F-Intervall ungefähr mit der dort zu zeichnenden Tangente oder Sehne übereinstimmen, also mit einer Geraden. Für sie gilt (9.4), falls die richtigen Parameterwerte m und n eingesetzt werden. |
| Für deren Bestimmung fehlt eine Theorie. Man kann sie aber empirisch finden, wenn man für eine größere Anzahl verschiedener Texte und Versuchspersonen nach dem ersten Weltnerverfahren die subjektive Informacio zu i = 2E bestimmt, und dazu jeweils die Zahl F der Codewörter notiert, von denen wenigstens 1 Bit falsch geraten wurde, so daß bei Anwendung des vereinfachten Verfahrens nicht das richtige Zeichen geraten worden wäre. Auf diese Weise erhält man eine Reihe empirischer Punkte (F, i) - oder, nach Division aller Abszissen- und Ordinatenwerte durch die jeweilige Textlänge: (F/N; H = i/N) -, die theoretisch auf der unbekannten Kurve liegen müßten (Bild 9.5). Bestimmt man für ein F-Intervall, innerhalb dessen die Punkte nicht offenkundig um eine nicht gerade Linie streuen, die Regressionsgerade, dann stimmt diese näherungsweise mit der gesuchten Tangente oder Sehne überein. Für deutsche Texte erhält man im Intervall 0,1 F/N 0,5 ungefähr m = 3,9 und n = 0,08, also |
(9.4a) i(F) = 3,9F - 0,08N
(9.4b) H(F/N) = i(F)/N = 3,9F/N - 0,08
| Aus (9.4), (9.4a) und (9.2) folgt |
(9.5) I = m(FL - FF) = 3,9.( FL - FF)
| Für andere Sprachen müssen m und n in gleicher Weise bestimmt werden. Im angegebenen Intervall, in welchem die meisten Versuchsergebnisse liegen, ist bei anderen lateinisch geschriebenen europäischen Sprachen (einschließlich ILo) nicht mit erheblich anderen Ergebnissen zu rechnen. Bei einer größeren relativen Fehlerzahl f = F/N, also insbesondere bei Vokabellisten, ist m dagegen wesentlich größer, da i(F) und H(f ) beschleunigt steigen, wie der Vergleich der Näherung (9.4a,b) mit den theoretisch gesicherten Funktionswerten von H(f) an den Stellen 0 und 97% erkennen läßt. |
| Als grobe, aber textunabhängige Näherungswerte für die semantische und ästhetische Information deutscher Basaltexte (ohne Formeln und fremdsprachliche Bestandteile) ergaben sich je etwa ½ bit pro Schreibmaschinenzeichen. |
Bild 9.5: Regressionslinie zur Anwendung des vereinfachten Weltnerschen Rateverfahrens auf deutsche Texte im Fehlerintervall 0,1 < f < 0,5.
9.5 Lernfortschritt
Normalerweise ist der Lerner weder zu Beginn des Unterrichts vollständiger Laie (Kompetenz 0), noch erreicht er bis zum Unterrichtsschluß schon das Niveau des Fachmanns (Kompetenz 1), vielmehr wächst seine Kompetenz von einem Prozentsatz p0 anfänglich schon bekannter Lehrstoffinformation bis zum Prozentsatz pd um (p0 - pd)I =: W an. Diesen Lernfortschritt nennen wir "Weltnerinformation"; Weltner selbst nannte ihn "didaktische Transinformation".
Beim Fremdsprachenlernen zeigt sich der Lernfortschritt auch im Lernen der (bedingten) Zeichenwahrscheinlichkeiten (informationelle Akkomodation). Abweichend von den in Bild 9.3 für gute ILo-Kenner eingetragenen Werten ergaben sich für SpOU-Anfänger nach Kenntnis von erst ca. 75 Vokabeln zwar im Mittel für den ersten Buchstaben auch schon ca. 4,0 bit, für den zweiten aber noch 2,7 bit, für den dritten 3,2 bit und ab dem vierten 4,0 bit; das Wortendezeichen erwies sich noch als 0,4 bit "schwer". (Vgl. Frank, 1984b.)