Zusammenfassung
In der vorliegenden Arbeit wird ein anhand von erprobten Methoden aus der Computerlinguistik und dem Maschinellen Lernen entwickeltes Verfahren beschrieben, das für eine automatisierte Analyse von juristischen Dokumenten eingesetzt werden kann. Die Motivation, die dieser Arbeit zugrunde liegt, ist die Verbesserung von Unterstützungssystemen für Juristen und die Entwicklung eines automatisierten Ansatzes im Genehmigungsverfahren von juristischen Schriften, z. B. von Verträgen. Dies soll durch das Verfahren der automatisierten Textanalyse erreicht werden, die so zu einer zeitlichen Straffung des Prozesses und zur Verbesserung der Qualität im Genehmigungsverfahren beiträgt.
Abstract
This paper describes a method developed for the automated analysis of legal documents. The technical procedure is based on proven methods from computational linguistics and machine learning. The motivation underlying this work is the improvement of support systems for legal text production and the development of an automated approach in the approval process of legal writings e.g. contracts. The procedure for automated text analysis is intended to contribute to a time reduction of the process and to the improvement of quality in the approval procedure.
Schlagworte
Analyse analysis automatische Textanalyse approval Automatisierung approval process automatic text analysis Computerlinguistik automation Erkennung computational linguistics Genehmigung Genehmigungsverfahren contracts Juristen detection juristische Texte lawyers legal texts Maschinelles Lernen Prozess machine learning procedure Qualität process Standardisierung Variation quality Verfahren standardization variation Verträge- 319–332 Literaturverzeichnis 319–332
- 333–340 Anhang A: 333–340
- 341–343 Wortindex 341–343
10 Treffer gefunden
- „... Dokumentseite. Ein ausreichend breiter Steg zwi-schen den Spalten führt zu einer besseren Erkennung der ...” „... Textklassenwerden vorkommende Paragrafenzeichen für die Erkennung von Über-schriften eingesetzt.Sonderzeichen und ...” „... . 95f), die auch durch fehlerhafte OCR-Erkennung entstehen, werdenerfasst und für die Vorhersage der ...”
- „... Frieda JosiAutomatisierte Erkennung von Standardisierung und Variation in juristischen ...” „... . pol. Stefan Voigt, Universität HamburgBand 3Frieda JosiAutomatisierte Erkennung von Standardisierung ...” „... , um so häufigeingesetzte Textabschnitte zu erkennen und diese für das Genehmigungsver-fahren zur ...”
- „... die Extraktion dermaschinell zu verarbeitenden Textteile aus den PDF-Dateien und für die Er-kennung ...” „... hinderlich. Für die Erken-nung von Kopf- und Fußzeilen verwenden Déjean und Meunier (2006) ei-nen ...” „... ) erkennen zu können. Maschinelles Lernenwird als Teilbereich der Künstlichen Intelligenz gesehen, hiermit ...”
- „... Seitenlayout-Erkennung und die Strukturanalyse erfolgt ist. Die Textextraktion beinhalteteinige Bereinigungsprozesse, wie ...” „... JuVer-Projektes eine Methode für die Erkennung von OCR-Fehlern entwickelt(Josi, Wartena und Heid 2020).6Die ...” „... Texte und Ähnlichkeitsanalysen5.2.6 Erkennung von Satzgrenzen in juristischen TextenDie ...”
- „... mögliche Interpretationen und Konsequenzen bereits kennenund verorten können.Mithilfe der Erkennung von ...” „... Seitenlayout-Erkennung und Textelementen (z. B. Über-schriften) und die Strukturanalyse der Dokumentseiten. Im ...” „... ausden Textabschnitten gemeint. Die Erkennung von Variabilität ist möglich,weil nicht nach exakt ...”
- „... zahlreiche Fehler bei derOCR-Erkennung gemacht. Nach der Bereinigung der Texte werden diesefür den weiteren ...” „... , beispielsweise für die Klassifizierungenvon Seitenlayout und für die Erkennung von Anhängen in PDF-Dateien. Inder ...” „... haben, wurde eine eigene Dubletten-Erkennung (siehe Kapitel 5.2.2)durchgeführt. Nach dem Herausfiltern ...”
- „... beschrieben. DieseClusterbildung stellt die Ausgangslage für die Erkennung von häufig vor-kommenden Sätzen in ...” „... leicht erkenn-bar.Abbildung 6.8: Zusammengefasste Wörter in einem Textabschnitt, der in allen zwölf ...” „... über die Erkennung der Synonyme auto-matisiert erfolgen. Die Bewertung welche Synonyme in juristischen ...”
- „... , mussdas Seitenlayout identifiziert werden. Diese Seitenlayout-Erkennung mussdes Weiteren für jede einzelne ...”
- „... wurde entwickelt, um eine automatisierte Erkennung vonStandardisierung und Variation in juristischen ...”
- „... sindWorttrennungsfehler, Fehler bei der OCR-Erkennung und erkennbareTippfehler, beispielsweise vertauschte Buchstaben ...”