das thema meiner diss

diss, linguistik, uni, vgs — 21.09.2008

letzte woche war ich odense an der von h.f. nielsen organisierten tagung 'the gothic language - origins, structure, developments', wo ich freundlicherweise mein dissertationsprojekt vorstellen durfte. falls sich jemand dafür interessieren sollte, kann er oder sie das manuskript hier beziehen (die letzten zwei seiten stellen das handout dar).

die etymologie von cheeseburger

etymologie, linguistik, vgs — 9.09.2008

der erste teil, cheese-, bedarf keiner erklärung. aber was ist eigentlich (-)burger?

der ursprung von burger ist im wort hamburger zu suchen. dies bezeichnete ursprünglich ganz einfach eine speise, die aus hamburg (DE) kommt, so wie die wienerwürste auch wiener oder die frankfurter würste frankfurter, bzw. in der schweiz frankfurterli heissen. dieses wort hamburger wurde dann ins englische entleht. dort hat man es offensichtlich nicht mehr mit der stadt hamburg assoziiert, sondern man glaubte engl. ham ‘Schinken’ darin zu sehen. dass dies ziemlich absurd war, da ein hamburger gar keinen schinken enthält, hat offenbar niemanden gestört. durch die neuinterpretation von ham- in hamburger musste das hinterglied, -burger, das generelle konzept dieser speise bezeichnen, d.h. ein ‘warmes sandwich’. dies machte in der folge neubildungen wie cheeseburger möglich, und burger ist heute im englischen auch als simplex geläufig.

die neuinterpretation von hamburger als kompositum ham-burger ist eine klassische volksetymologie.

das hinterglied des ortsnamens hamburg ist natürlich mit nhd. burg identisch, d.h. dass der cheeseburger rein etymologisch gesehen eigentlich ‘(die speise aus der) käsestadt, käseburg’ sein müsste.

referenz
kluge, f. und seebold, e.: etymologisches wörterbuch der deutschen sprache. berlin 2002. 24. auflage.

für und wider künstliche texte in lehrbüchern toter sprachen

wenn man sich die vorwörter zu lehrbüchern toter sprachen anschaut, z.b. von griechisch- oder latein-lehrbüchern, dann schreiben die autoren dort meistens stolz, dass sie "schon ab der 5. lektion ausschliesslich originaltexte" verwenden würden, oder so etwas in der art. dies streichen sie meistens als vorteil hervor, da sie - so die implizite stellungsnahme - originaltexte in jedem fall für besser halten als kunsttexte.

dies ist insofern nachvollziehbar, als heute keine muttersprachlichen altgriechisch- oder latein-sprecher mehr leben, die mit absoluter sicherheit die grammatische und stilistische richtigkeit von neukompositionen bestätigen könnten. doch bedeutet dies wirklich, dass deshalb originaltexte im schulischen/studentischen lernkontext in jedem fall gegenüber kunsttexten vorzuziehen sind? ich würde das nicht automatisch bejahen, und finde, dass es durchaus auch einige argumente für kunsttexte gibt.

zunächst bedeutet das klammern an originaltexte nämlich einmal, dass der lernende fortlaufend mit texten konfrontiert wird, die eigentlich noch zu schwierig für sein niveau sind. dies führt dazu, dass der lernende oft an texten sitzt, bei denen er praktisch jedes einzelne wort bzw. jede einzelne form nachschlagen muss. der effekt: die lektüre kommt nur sehr schleppend voran und der lernende wird rasch frustriert. das stundenlange herumknobeln an schwierigen sätzen müsste in meinen augen jedoch nicht sein: es ist ineffizient und frustrierend. im gegensatz dazu kann mit kunsttexten erreicht werden, dass der lernende zu jedem zeitpunkt einen genau auf sein niveau zugeschnittenen text erhält, der zwar einiges neue beinhaltet, aber jeweils nur gerade soviel, dass es vom lerner noch einigermassen flüssig gelesen werden kann. damit kann die motivation hoch gehalten werden und das lernen erfolgt leichter. ein weiterer vorteil ist, dass die texte an die grammatikthemen der einzelnen lektionen angepasst werden können (z.B. ein text mit vielen konjunktiven zur lektion, wo der konjunktiv eingeführt wird).

die lehrbücher versuchen normalerweise, die (zu) grosse schwierigkeit von originaltexten damit zu kompensieren, dass sie die texte mit ausführlichen glossen versehen. so ist es durchaus möglich, dass stellenweise bis zu der hälfte der wörter/formen marginal oder in fussnoten erklärt/übersetzt werden. damit ist dem lernenden aber m.e. auch nicht wirklich geholfen, und er ist nach meiner erfahrung sogar dazu verleitet, aus den vielen übersetzten einzelwörtern einen sinn "zusammenzubasteln", ohne den originaltext richtig verstanden zu haben.

nach meiner meinung kann es didaktisch gesehen erfolgsversprechender sein, anfangs mit vielen leichten texten zu arbeiten, anstatt die lernenden sich von anfang an die zähne an schwierigen originaltexten ausbeissen zu lassen. aufeinander abgestimmte neukompositionen eignen sich in diesem zusammenhang ausgezeichnet, da die menge an neuem lexikalischen material und auch an neuer grammatik kontrolliert verabreicht werden kann, so dass der lernende kontinuirlich dazu lernt, ohne überfordert zu sein.

ich glaube ferner, dass auch grammatikformen und neues vokabular am einfachsten über die textlektüre aufgenommen werden, was durch die bereitstellung von vielen, leichten kunsttexten unterstützt werden kann. die klassische vokabel-lernmethode mit karteikarten hat nämlich den gravierenden nachteil, dass einzelne wörter ohne kontext gelernt werden. doch gerade der kontext, in dem ein wort verwendet wird, spielt für dessen bedeutung eine grosse rolle (wittgenstein: "die bedeutung eines wortes ist sein gebrauch in der sprache"). dieses problem umschifft man elegant, wenn man die wörter anhand ihres auftretens in einem text erlernt. gleiches gilt für das erlernen von grammatischen formen. ich bin der ansicht, dass sich die formen viel leichter einprägen, wenn man ihnen in einem text begegnet, als wenn man stur paradigmen auswendig lernt. daraus ergibt sich ausserdem automatisch der positive effekt, dass häufige formen früher gelernt werden als seltene - beim paradigmenlernen lernt man jedoch alle formen - ob selten oder geläufig - gleich prioritär.

ein nachteil von kunsttexten ist offensichtlich ihre nicht bis ins letzte detail garantierte verifizierbarkeit. doch glaube ich, dass dies in einem kontext eines lehrbuches für neulerner (erstes jahr griechisch, o.ä.) keine wesentliche rolle spielt. ich bin ohne weiteres bereit zu glauben, dass leute, die sich seit vielen jahren auf akademischem niveau mit einer bestimmten toten sprache auseinander gesetzt haben, diese so gut beherrschen können, dass sie in der lage sind, verlässliche kunsttexte zu produzieren. zwar werden wohl besonders was die stilistik angeht gewisse zweifel bleiben, doch sind diese im genannten zusammenhang m.e. vernachlässigbar.

zusammenfassend noch einmal vor- und nachteile von kunsttexten in lehrmitteln toter sprachen:

  • nachteil: nicht 100% verifizierbar
  • vorteil: texte können perfekt dem niveau des lernenden angepasst werden -> höhere motivation, effizienteres lernen
  • vorteil: da es sich um leichte(re) texte handelt, kann insgesamt mehr text gelesen werden
  • vorteil: texte können an das grammatische thema der lektion angepasst werden
  • vorteil: vokabular kann eher als bei originaltexten via textlektüre (d.h. im kontext) gelernt werden
  • vorteil: neue grammatische formen können eher als bei originaltexten via textlektüre (d.h. im kontext) gelernt werden

Der Name von Istanbul

Der Name der Stadt Istanbul ist, wie so vieles in der Sprachgeschichte, eigentlich ein Missverständnis. Anscheinend ist der Name aus der griechischen Phrase εἰς τὴν πόλιν (bzw. εἰς τὰν πόλιν) entstanden - was soviel bedeutet wie ‘in die Stadt hinein’.

Mann muss sich das wohl so vorstellen, dass nach Konstantinopel reisende Griechen auf die Frage, wo sie hingingen, jeweils εἰς τὴν πόλιν, ‘in die Stadt’ geantwortet haben. Ihre Gegenüber, wohl dem Griechischen weniger mächtige Leute, haben allerdings die Phrase nicht richtig verstanden, und sich gedacht, dass dies der Name der Stadt sein müsse.

-technisch als Wortbildungssuffix

Heute habe ich jemanden im Zug folgenden Satz sagen hören:

Si isch guet zwäg, konditionstechnisch.

Das interessante daran ist, dass -technisch hier semantisch total entleert ist. Die körperliche Verfassung der gemeinten Person hat mit Technik ja nun gar nichts zu tun; -technisch bedeutet in dieser Verwendung nur noch ‘in Beziehung auf’. Das Beispiel zeigt also, wie aus einem Lexem ein Wortbildungsaffix werden kann - ein Vorgang, der in der Sprachgeschichte so sogar recht häufig ist. Bekannte Beispiele sind etwa die nhd. Adjektivendung -lich, aus germ. *līka ‘Körper’, oder die Abstraktsuffixe nhd. -heit aus ahd. heit f. ‘Person, Wesen, Rang etc.’ (auch in ne. -hood in brotherhood) sowie -tum aus ahd. tuom m. n. ‘Verhältnis, Stand, Würde, Zustand’ (ne. -dom in wisdom).

Doch in welchen Kontexten kann die semantische Entleerung von -technisch stattfinden? Sind es Sätze wie:

Leider handelte es sich um eine computertechnisch ziemlich unbegabte Person.

Diese Sätze lassen im Prinzip eine Reanalyse von -technisch als ‘in Bezug auf’ aus ursprünglichem ‘die Technik betreffend’ zu.

Könnte man also eine vorsichtige Prognose stellen, dass wir in Zukunft auch Dinge wie die folgenden sagen/hören werden?

Sie hat liebestechnisch nicht viel Glück gehabt. (= im Bezug auf die Liebe)

Toms Kinder haben schultechnische Schwierigkeiten. (= im Bezug auf die Schule)

Tönt gar nicht so falsch, oder? ;)

against redundancy in academic papers

opinion, uni

it is by many considered good practice to write academic papers with a threefold structure, consisting of an introduction, a main part, and a conclusion. in addition, you are often expected to include an abstract with a summary of the content at the beginning of the paper.

i think that this structure is in fact often a bad idea, because it leads to a lot of redundancy. the result is a paper like this:

Abstract: In this paper it will be shown that chicken lay eggs.
Introduction: We are going to show that chicken lay eggs.
Main part: Chicken lay eggs.
Conclusion: We have shown that chicken lay eggs.

come on, i'm not stupid, there's no need to tell me the same thing four (!) times. if you don't have anything to say in the introduction or the conclusion, then skip it, but don't just repeat what you have said elsewhere pro forma, sometimes even reusing the exact same wording multiple times! i don't want to read that, and the author(s) probably don't want to write it, so why not just concentrate on the relevant parts? looking at the “paper” above, isn't in fact everything relevant included in the main part?

What happened to the Etymological Dictionary of Old English?

Does anyone know what happened to the Etymological Dictionary of Old English by Alfred Bammesberger? Bammesberger talks about this as a project he's working on in the preface of some of his publications (e.g. Aufbau des germanischen Verbalsystems, Heidelberg 1986), but I don't think he ever finished it. I've found only two publications related to this: One [1] seems to be a sort of preliminary study (or rather an addenda/corrigenda to Holthausen [2]?), the other is a speech of his that was published in 1983 about the dictionary [3]. So can anyone tell me whether he has given up on it (he's an emeritus by now) or whether someone is still working on it? Were any of the results ever published?

[1] Bammesberger, Alfred: Beiträge zu einem etymologischen Wörterbuch des Altenglischen. Heidelberg 1979.
[2] Holthausen, Ferdinand: Altenglisches etymologisches Wörterbuch. Heidelberg 1963.
[3] Bammesberger, Alfred: Das etymologische Wörterbuch des Altenglischen: Probleme und Methoden. In: Hasler, Jörg (Hrsg.): Anglistentag 1981: Vorträge. Frankfurt am Main 1983. S. 29-34.

die sechs phasen der etymologischen recherche

  1. wildes assoziieren: das wort X gehört bestimmt zu Y! oder es ist eine ableitung vom verb Z! wobei, zwar... es könnte natürlich auch vom substantiv R rückgebildet sein... oder mit ablaut zu Q? mit grammatischem wechsel zu W?
  2. voreilige triumphgefühle: wie bitte, die etymologischen wörterbücher sagen, es gehört zu P? das kann ja wohl nicht ihr ernst sein? LOL das lässt sich bestimmt leicht zeigen, dass es stattdessen zu Q gehört!
  3. verzettelung: ach so, in diesem wörterbuch steht jetzt, dass das wort gar nicht zu P, sondern zu einer variante P(2) gehört, die ich aber nirgendwo finde? ausserdem stehen hier ein paar formen, die fast gleich aussehen, wie die im anderen wörterbuch, aber doch nicht genau gleich lauten? und was ist mit diesen anderen belegen hier, könnten die nicht vielleicht auch noch dazu gehören? hm, ich muss wohl mal noch in den wörterbüchern L und M und N nachschauen.
  4. komplettes chaos: häh? das passt ja alles gar nicht zusammen? die wörterbücher wiedersprechen sich ja gegenseitig? und wer referiert hier genau wen? habe ich vorher nicht grad gelesen, dass X nicht von Y, sondern umgekehrt Y von X angeleitet sei? aber wo habe ich das bloss gelesen? und wieso ist hier ganz eine andere bedeutungsangabe? ist das vielleicht gar nicht dieselbe wurzel, sondern eine andere, homonyme?
  5. lichtung der nebelschwaden: hmm, aha, wenn man mal die ganze sekundärliteratur systematisch durchliest, macht das alles mehr sinn.
  6. ernüchterung: tja, ich muss zugeben, dass die bisherige etymologie wohl doch die beste ist.

Further Thoughts on Computational Linguistics

I've been talking to various people about the ideas expressed in my last post on computational linguistics. It seems that most people recognize the problems I talked about, but do not draw equally pessimistic conclusions from them. A few interesting points have been brought up. One of them is a possible analogy to the relation between the mind and the brain, using the image of a computer: The brain is the hardware, and the mind is the software, which runs on it. If that analogy is accurate, then we could claim that the mind is basically something like the following algorithm:

while (true) {
	rawData = nerves.readRawData();
	data = patternRecognizer.analyze(rawData);
	store(data, memory);
	conclusions = logicUnit.drawConclusions(memory);
	store(conclusions, memory);
	reactions = judgingModule.calculateReactions(memory);
	send(reactions.getSignals(), nerves);
}

It's just an infinite loop, that cycles through three steps: Read data from nerves, process data, and send output to nerves. That doesn't sound like it's hard to implement, does it? But is that really all our minds do? Does the algorithm cover all ascpects of what's going on in our minds?

A second point that has been brought to my attention is that it might be possible to get some sort of semantics by using a computer to simulate not just a single speaking agent, but to simulate a complete world inside the computer, and put some agents in it that talk about this simulated world. These agents could of course mean things in the simulated world, since the agents and the things all belong to the same domain, all inside the computer. Of course, they could still not talk about the real world, but that does not matter, because at that point, you are only concerned with the simulated world. So that would be the ideal way to experiment with language learning etc. in a "snow globe" environment. The idea originated apparently in KI-research, where it had become obvious that it could often be more rewarding not to work on real-life robots, but to use simulated robots interacting with a simulated world.

So one of the conclusions I've come to so far is that computational linguists are currently somewhat off the track, because they attempt really fancy stuff like syntactical parsing etc., but they completely ignore semantics. In my view, computational linguists should approach the problems differently: They should start out with artificial intelligence and try to model basic requirements like cognition and (primitive) language learning. Semantics should be a central focus from the beginning. Once that is achieved (but only then!), they could proceed to model the more complex aspects of a language, like its morphological or syntactical structure.

Thanks for everyone who commented and showed willingness to discuss these issues with me!

Computational Linguistics and Semiotics

The longer I think about computational linguistics, what the discipline is, what it's trying to achieve and how far it has come by now, the clearer I see some fundamental problems in the field. And with that, I don't mean problems that are currently not solvable, e.g. because research has not advanced far enough, but rather problems which are not solvable on principle.

My reasoning is as follows:

The most fundamental feature of language is the concept of signs (dt. Zeichen). Signs are used to refer to things in the world, and that is what makes them usable for communication. They always consist of two parts: One is the appearance of the sign (its form), the other is its function to refer to something (its meaning). Following F. de Saussure, the man who first established the theory of (linguistic) signs as a scientific discipline (called semiotics), these two parts are often called signifiant and signifié, i.e. “that which is indicating” and “that which is indicated”. Language couldn't exist without either one of these two features: Without a form, the signs couldn't be passed on between humans, and without meaning, they would not be able to refer to anything, and would therefore be without value. Because of that, both of these things are essential for linguistics signs, and consequently for language in general.

It follows from this that anyone who tries to model or reverse engineer human language must be concerned with both aspects of a sign: Both the signifiant and the signifié must be dealt with. This does not pose a problem for the signifiant part of the sign - it can easily be represented graphically or acoustically. However, we are likely to run into a problem with the signifié part of the sign. To model this, the device we are trying to model the language on needs to be able to deal with the concept of reference. It needs to understand the fact that a sign points to something outside of the language, something in the real world.

The way I see it, this makes it necessary for the device we use for modeling the language on to have a concept of the real world and to know about its own place in that world. That, however, is the same thing as saying it needs a consciousness.

So can we emulate consciousness on a computer? I think not. First, the philosophers are still hard at work to figure out what consciousness really is (a subdiscipline which in German is called Bewusstseinsphilosophie), and second, what can be achieved in the field of artificial intelligence that I am aware of is still far, far away from anything like self-consciousness in machines. So as far as I can see, there is currently no way that a computer can have a consciousness of itself in this world, and it does not look likely that this is going to be possible in the near future, if at all.

From the fact that a computer can not have a consciousness, it follows that a computer can not have a concept of reference. From there, it follows that a computer can not properly deal with linguistic signs. And if it can not deal with linguistic signs, it can not deal with language in general.

That's it. Unless I made a mistake, I have just shown that computers can not have real linguistic competence on principle. Please prove me wrong if you can!

I have two more things to say about this:

(1) It may be objected that computational linguists have in fact been concerned with the meaning of linguistic signs, i.e. with semantics. Actually, any text book on computational linguistics has some chapters on semantics. However, if you ask me, what the computational linguists call “semantics” is not actual semantics, but rather something else, which I find quite silly: They model some aspects of the real world inside a computer (calling these models, among other things, ontologies), and then they make the “linguistic signs” they work with point to something inside this virtual model of the world. But if you think about it, you'll see that this is not real “semantics” at all, because the reference is not to the real world outside of the computer, but only to the model of the real world inside the computer. The only thing achieved by this is to add a level of indirection, because the linguistic signs are now referring to elements inside the virtual model, which are in turn pointing to things in the real world. But the problem was just shifted: Instead of the reference from signs to things in the real world, we now have to deal with the reference of elements of our virtual model to things in the real world. In other words, it is not possible to overcome the limitation that a computer can never mean anything in the real world, no matter how elaborate the models of the real world are which we create inside the computer.

(2) I am not saying that computational linguistics is useless. I see two ways in which it can be worthwile: (A) Practical uses. Obviously, some aspects of language can very well be modeled on the computer, and they can be used to get actual work done. For example, we have tools today which can do part-of-speech tagging, syntactic parsing or even rough translations of texts into foreign languages, and they do some of those tasks rather well. But you have to realize that these tools are severely limited by the fact that they operate solely on the signifiant part of the linguistics signs, and that they lack some elementary things for proper treatment of language, i.e. meaning. Put differently, these tools operate on words, but they operate on dead words, and they can never hide the fact that they have no understanding of it. These tools are hacks much rather than proper implementations of linguistic competence. However, I won't question that this is enough for some purposes, some of the time. Those tools work up to some point, and people will be happy with them (and even pay you money for them), if it helps them to get their work done quicker. (B) Theoretical uses. I believe that computational linguistics can be an “auxiliary discipline” for traditional linguistics, because trying to reverse-engineer a complex thing such as language will undoubtedly teach you a lot about the way it works (and maybe just as much about the way it doesn't work). From my personal experience, I know that I was not aware of much of the syntactical complexity of language before I saw how hard it is to write a parser. Keep in mind, however, that only some aspects of language can be modeled on a computer, and that a complete “implementation” can not be the goal of such reverse engineering.

So even though we are already used to the concept of linguistically competent agents, thanks to StarTrek etc., and even though technology evangelists have been predicting it in the real world for years, and still do it today, I do not believe that we will have talking computers/robots in the near future. Actually, I believe that it is quite likely that we will never have talking computers. Computers are extremely powerful tools, and they make many unlikely things possible, but that does not mean that they make everything possible. They are, after all, just that: tools.

NOTE: original comments here.

Next Page »