Autor |
Nachricht |
Hubert1965
Anmeldungsdatum: 15.03.2011 Beiträge: 1 Wohnort: Wien
|
Verfasst am: 15. März 2011 09:21 Titel: Wortformen-Datenbank, Synonym-Datenbank |
|
|
Im Zuge meiner Diplomarbeit muss ich mit Hilfe eines von mir zu schreibenden Computerprogramms deutsche Texte aus dem Internet analysieren. Um genau zu sein geht es darum, aus einer langen Liste von kurzen Texten (durchschnittlich jeweils ca. 80 Zeichen lang) Paare von Texten mit gleichem Inhalt herauszufinden.
Dazu ist es notwendig, dass ich erkennen kann, dass z.B. "Häufchen" und "Haufens" oder "luden" und "geladen" jeweils zwei Formen desselben Wortes sind. Ich muss auch erkennen können, dass mit "Schabe" und "Kakerlake", oder mit "Angst", "Furcht" und "Phobie" (fast) identische Begriffe gemeint sind.
Um diese Aufgabe lösen zu können, brauche ich Tabellen, die mir sagen, dass "längst" und "länglich" Wortformen von "lang" sind, und dass ein "Fernsprechapparat" ein "Telefon" ist.
Weiß jemand, wo man solche Datenbestände beziehen kann? Von großem Vorteil wäre dabei natürlich ein möglichst kleiner Preis (am besten gratis). |
|
|
Xabotis
Anmeldungsdatum: 29.12.2010 Beiträge: 848
|
Verfasst am: 15. März 2011 19:29 Titel: Re: Wortformen-Datenbank, Synonym-Datenbank |
|
|
Eine von einem einem Urverb abstammende Gattung von Worten nennt man Wortgattung oder wortfamilie, möglicherweise findest du unter diesen Begriffen etwas, mir ist eine so komplexe Tabelle aber nicht bekannt, da musst du wahrscheinlich wohl oder übel bei ähnlichen worten auf ein Lexikon zurückgreifen.
_________________ There is nothing, neither good nor evil, but human thinking makes it so. (W. Shakespeare) |
|
|
|
|