Autor Nachricht
Xabotis
BeitragVerfasst am: 15. März 2011 19:29    Titel: Re: Wortformen-Datenbank, Synonym-Datenbank

Eine von einem einem Urverb abstammende Gattung von Worten nennt man Wortgattung oder wortfamilie, möglicherweise findest du unter diesen Begriffen etwas, mir ist eine so komplexe Tabelle aber nicht bekannt, da musst du wahrscheinlich wohl oder übel bei ähnlichen worten auf ein Lexikon zurückgreifen.

Wink
Hubert1965
BeitragVerfasst am: 15. März 2011 09:21    Titel: Wortformen-Datenbank, Synonym-Datenbank

Im Zuge meiner Diplomarbeit muss ich mit Hilfe eines von mir zu schreibenden Computerprogramms deutsche Texte aus dem Internet analysieren. Um genau zu sein geht es darum, aus einer langen Liste von kurzen Texten (durchschnittlich jeweils ca. 80 Zeichen lang) Paare von Texten mit gleichem Inhalt herauszufinden.

Dazu ist es notwendig, dass ich erkennen kann, dass z.B. "Häufchen" und "Haufens" oder "luden" und "geladen" jeweils zwei Formen desselben Wortes sind. Ich muss auch erkennen können, dass mit "Schabe" und "Kakerlake", oder mit "Angst", "Furcht" und "Phobie" (fast) identische Begriffe gemeint sind.

Um diese Aufgabe lösen zu können, brauche ich Tabellen, die mir sagen, dass "längst" und "länglich" Wortformen von "lang" sind, und dass ein "Fernsprechapparat" ein "Telefon" ist.

Weiß jemand, wo man solche Datenbestände beziehen kann? Von großem Vorteil wäre dabei natürlich ein möglichst kleiner Preis (am besten gratis).

Powered by phpBB © 2001, 2005 phpBB Group