Forschungsgruppenleiter

profile_image
Dr. Johann-Mattis List
Forschungsgruppenleiter
Telefon:+49 3641 686-822
E-Mail:list@...

Persönliche Webseite

Links

Offizielle Webseite des Projekts
Blog von Johann-Mattis List
LingPy (Python Software, im Rahmen des CALC Projekts entwickelt)
EDICTOR (Tool für die historische Linguistik, im Rahmen des CALC Projekts entwickelt)

Aktuelle Publikationen

1.
Johann-Mattis List, Simon J. Greenhill, and Russell D. Gray, "The Potential of automatic word comparison for historical linguistics," PLoS One , 0170046 (2017).

Computergestützter Sprachvergleich (CALC): Die Vereinigung von computerbasierten und klassischen Ansätzen in der historischen Linguistik

Das vom europäischen Forschungsrat geförderte Forschungsprojekt CALC (Computer-Assisted Language Comparison) hat zum Ziel, ein computer-gestütztes Rahmenwerk für die historische Sprachwissenschaft zu etablieren. Während computerbasierte Ansätze heutzutage sehr geläufig sind, konzentriert sich das Projekt auf die Kommunikation zwischen klassischen Linguisten und Computerlinguisten. Dabei werden Schnittstellen entwickelt, die es Linguisten erlauben, ihre Daten in maschinenlesbarer Form zu produzieren, während die Resultate von Computeranalysen transparent und für Menschen einfach erfassbar dargestellt werden.

Durch den Vergleich der Sprachen der Welt können wir wertvolle Einblicke in die Geschichte der Menschheit gewinnen, die um Jahrtausende weiter zurückreichen als geschriebene Zeugnisse. Die Traditionellen Methoden basieren auf einer manuellen Bearbeitung von linguistischen Daten. Mit der beständig wachsenden Anzahl an digital verfügbaren Daten erreichen diese Methoden ihre praktischen Grenzen. Computermethoden sind jedoch nicht in der Lage, die Intuition und die Erfahrung von Experten zu ersetzen. In einer Situation, in der Computer Experten nicht ersetzen können und Experten nicht genug Zeit haben, die großen Bestände von Daten zu analysieren brauchen wir einen neuen Ansatz, der weder vollständig auf Computer vertraut, noch die Möglichkeiten, die Computermethoden bieten, außer Acht lässt. Solche Ansätze sind seit langem in Biologie und Übersetzungsforschung etabliert, wo Computermethoden die Akkurazität, die für die Analysen benötigt wird, nicht bieten können, aber dennoch wertvolle Hilfe leisten, um die Daten im Voraus zu sichten.

Schnittstellen, Daten, und Software sind die drei Säulen, auf denen das CALC-Framework beruht. Auf dessen Grundlage soll im Forschungsprojekt Licht auf die Geschichte der sinotibetischen Sprachen geworfen werden.
Schnittstellen, Daten, und Software sind die drei Säulen, auf denen das CALC-Framework beruht. Auf dessen Grundlage soll im Forschungsprojekt Licht auf die Geschichte der sinotibetischen Sprachen geworfen werden.

Als Lackmustest für die Tauglichkeit des neuen Rahmenwerkes wird im Rahmen des Projektes eine etymologische Datenbank der Sinotibetischen Sprachen erstellt werden. Die Intensität von Sprachkontakt und die Besonderheit komplexer Prozesse des Sprachwandels, in dessen Verlauf sporadische morphologische Prozesse reguläre Lautwandelprozesse überlagert haben, machen die sinotibetische Sprachfamilie zu einem idealen Testfall für ein neues übergreifendes Rahmenwerk, das das beste aus zwei Welten vereint: die Erfahrung von Experten und die Konsistenz von Computermodellen.

 
loading content