Datalingvistik och typologi i en och samma animation och doktorsavhandling

Reut Tsarfaty har just disputerat i datalingvistik vid Amsterdams universitet. Hennes avhandling handlar om en ny parser som kan parsa icke-engelska språk bättre med hjälp av en metod som drar lärdom av typologisk forskning och hanterar suppletion, kongruens, fri ordföljd osv på ett annat sätt än tidigare parsrar.

I fredag gav hon en föreläsning om sin doktorsavhandling i Uppsala där hon är nu som postdoc. Jag var där och det var jätteintressant och givande. Min favorit i presentationen var "non-configurational languages are not configurational".

Hon inledde sin presentation med en animation som hon gjort tillsammans med sin syster. Den förklara hur syntaktiska träd fungerar och är generellt mycket fin. Jag rekommenderar er verkligen att titta på den. Här är den.

Här är hennes abstract, det säger vad hon gjort mycket bättre än jag gör:

"State-of-the-art statistical parsing models applied to free word-order languages tend to underperform compared to, e.g., parsing English. Constituency-based models often fail to capture generalizations that cannot be stated in structural terms, and dependency-based models employ a 'single-head' assumption that often breaks in the face of multiple exponence. In this paper we suggest that the position of a constituent is a form manifestation of its grammatical function, one among various possible means of realization. We develop the Relational-Realizational approach to parsing in which we untangle the projection of grammatical functions and their means of realization to allow for phrase-structure variability and morphological-syntactic interaction. We empirically demonstrate the application of our approach to parsing Modern Hebrew, obtaining 7% error reduction from previously reported results."

Hed.

Det här inlägget postades i Okategoriserade. Bokmärk permalänken.

Kommentera

E-postadressen publiceras inte. Obligatoriska fält är märkta *


*

Följande HTML-taggar och attribut är tillåtna: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>