. . "Information extraction (IE) is the task of automatically extracting structured information from unstructured and/or semi-structured machine-readable documents. In most of the cases this activity concerns processing human language texts by means of natural language processing (NLP). Recent activities in multimedia document processing like automatic annotation and content extraction out of images/audio/video could be seen as information extraction. , from an online news sentence such as: \"Yesterday, New York based Foo Inc. announced their acquisition of Bar Corp.\"" . "Tekstanalyse" . . "La extracci\u00F3n de la informaci\u00F3n (de sus siglas en ingl\u00E9s IE, Information Extraction) es un tipo de recuperaci\u00F3n de la informaci\u00F3n cuyo objetivo es extraer autom\u00E1ticamente informaci\u00F3n estructurada o semiestructurada desde documentos legibles por una computadora. Una aplicaci\u00F3n t\u00EDpica de IE es el escaneado de una serie de documentos escritos en una lengua natural y rellenar una base de datos con la informaci\u00F3n extra\u00EDda. Estos textos pueden estar en forma semiestructurada o desestructurada. Estos documentos pueden ser muy variopintos desde art\u00EDculos de prensa hasta informes cient\u00EDficos que en general est\u00E1n escritos en un lenguaje humano. Las tendencias actuales en relaci\u00F3n con la IE utilizan t\u00E9cnicas de procesamiento de lenguaje natural que se centran en \u00E1reas muy restringidas. El objetivo es procesar estos documentos con un software de procesamiento de lenguaje natural (NLP) para extraer informaci\u00F3n \u00FAtil de ellos. Esta tarea es muy compleja ya que estos programas suelen operar con unos dominios muy restringidos. Lo que dificulta extraer la informaci\u00F3n de textos con un lenguaje poco formal o im\u00E1genes. Por ejemplo, la Message Understanding Conference (MUC), o Conferencia para la Comprensi\u00F3n de Mensajes es una competici\u00F3n que se ha centrado en los siguientes aspectos durante los \u00FAltimos a\u00F1os: \n* MUC-1 1987, MUC-2 1989: Mensajes para operaciones navales. \n* MUC-3 1991: Terrorismo en pa\u00EDses latinoamericanos. \n* MUC-5 1993: Microelectr\u00F3nica. \n* MUC-6 1995: Nuevos art\u00EDculos a cerca de los cambios en la gerencia. \n* MUC-7 1998: Informes de lanzamiento de sat\u00E9lites." . . "732023155"^^ . . "Information extraction (IE) is the task of automatically extracting structured information from unstructured and/or semi-structured machine-readable documents. In most of the cases this activity concerns processing human language texts by means of natural language processing (NLP). Recent activities in multimedia document processing like automatic annotation and content extraction out of images/audio/video could be seen as information extraction. Due to the difficulty of the problem, current approaches to IE focus on narrowly restricted domains. An example is the extraction from news wire reports of corporate mergers, such as denoted by the formal relation: , from an online news sentence such as: \"Yesterday, New York based Foo Inc. announced their acquisition of Bar Corp.\" A broad goal of IE is to allow computation to be done on the previously unstructured data. A more specific goal is to allow logical reasoning to draw inferences based on the logical content of the input data. Structured data is semantically well-defined data from a chosen target domain, interpreted with respect to category and context. Information Extraction is the part of a greater puzzle which deals with the problem of devising automatic methods for text management, beyond its transmission, storage and display. The discipline of information retrieval (IR) has developed automatic methods, typically of a statistical flavor, for indexing large document collections and classifying documents. Another complementary approach is that of natural language processing (NLP) which has solved the problem of modelling human language processing with considerable success when taking into account the magnitude of the task. In terms of both difficulty and emphasis, IE deals with tasks in between both IR and NLP. In terms of input, IE assumes the existence of a set of documents in which each document follows a template, i.e. describes one or more entities or events in a manner that is similar to those in other documents but differing in the details. An example, consider a group of newswire articles on Latin American terrorism with each article is presumed to be based upon one or more terroristic acts. We also define for any given IE task a template, which is a(or a set of) case frame(s) to hold the information contained in a single document. For the terrorism example, a template would have slots corresponding to the perpetrator, victim, and weapon of the terroristic act, and the date on which the event happened. An IE system for this problem is required to \u201Cunderstand\u201D an attack article only enough to find data corresponding to the slots in this template." . "Tekstanalyse is het op gestructureerde wijze analyseren van tekst en context. Het is een werkwijze die in de taalkunde specifiek gevolgd kan worden bij het begrijpend lezen van een tekst en het doorgronden van de betekenis ervan. Tekstanalyse vormt dan een onderdeel van de taalbeheersing als wetenschappelijke discipline. Tekstanalyse is anderzijds ook een technologisch proces om via ICT kennis te putten uit documenten, een manier om tekst te valoriseren." . "\u60C5\u5831\u62BD\u51FA (Information Extraction; IE) \u306F\u975E\u69CB\u9020\u5316\u6587\u66F8\u3068\u6A5F\u68B0\u304C\u8AAD\u307F\u53D6\u308C\u308B (machine-redable\u306A) \u534A\u69CB\u9020\u5316\u6587\u66F8\u306E\u4E21\u65B9\u307E\u305F\u306F\u3044\u305A\u308C\u304B\u3089\u81EA\u52D5\u7684\u306B\u69CB\u9020\u5316\u30C7\u30FC\u30BF\u3092\u62BD\u51FA\u3059\u308B\u30BF\u30B9\u30AF\u3067\u3042\u308B\u3002 \u591A\u304F\u306E\u5834\u5408\u3001\u3053\u306E\u4F5C\u696D\u306F\u4EBA\u9593\u306E\u8A00\u8449\u3067\u66F8\u304B\u308C\u305F\u6587\u66F8\u3092\u81EA\u7136\u8A00\u8A9E\u51E6\u7406 (Natural Language Processing; NLP) \u306E\u624B\u6CD5\u3092\u7528\u3044\u3066\u51E6\u7406\u3059\u308B\u3053\u3068\u3092\u6307\u3059\u3002\u753B\u50CF\u30FB\u97F3\u697D\u30FB\u52D5\u753B\u306E\u81EA\u52D5\u30A2\u30CE\u30C6\u30FC\u30B7\u30E7\u30F3\u3084\u30B3\u30F3\u30C6\u30F3\u30C4\u62BD\u51FA\u306E\u3088\u3046\u306A\u3001\u8FD1\u5E74\u306E\u30DE\u30EB\u30C1\u30E1\u30C7\u30A3\u30A2\u6587\u66F8\u306E\u51E6\u7406\u3082\u307E\u305F\u60C5\u5831\u62BD\u51FA\u3068\u3057\u3066\u6349\u3048\u3089\u308C\u308B\u3002 \u305D\u306E\u554F\u984C\u306E\u96E3\u3057\u3055\u304B\u3089\u3001IE\u306B\u5BFE\u3059\u308B\u73FE\u5728\u306E\u30A2\u30D7\u30ED\u30FC\u30C1\u306F\u72ED\u304F\u5236\u9650\u3055\u308C\u305F\u30C9\u30E1\u30A4\u30F3\u306B\u7126\u70B9\u3092\u5F53\u3066\u3066\u3044\u308B\u3002\u4F8B\u3068\u3057\u3066\u3001\u30CB\u30E5\u30FC\u30B9\u30B5\u30FC\u30D3\u30B9\u306E\u4F01\u696D\u5408\u4F75\u306B\u3064\u3044\u3066\u306E\u5831\u9053\u304B\u3089\u306E\u60C5\u5831\u62BD\u51FA\u304C\u3042\u308A\u3001\u6B21\u306E\u3088\u3046\u306A\u30D5\u30A9\u30FC\u30DE\u30EB\u306A\u95A2\u4FC2\u306B\u3088\u308B\u60C5\u5831 , \u3092\u6B21\u306E\u3088\u3046\u306A\u30CB\u30E5\u30FC\u30B9\u6587 \"Yesterday, New York based Foo Inc. announced their acquisition of Bar Corp.\" \u304B\u3089\u629C\u304D\u51FA\u3059\u3002 IE\u306E\u5E83\u3044\u76EE\u6A19\u306F\u3001\u84C4\u7A4D\u3055\u308C\u305F\u975E\u69CB\u9020\u5316\u30C7\u30FC\u30BF\u306E\u3046\u3048\u3067\u51E6\u7406\u3092\u884C\u3048\u308B\u3088\u3046\u306B\u3059\u308B\u3053\u3068\u3067\u3042\u308B\u3002\u3088\u308A\u5177\u4F53\u7684\u306A\u76EE\u6A19\u306F\u3001\u5165\u529B\u30C7\u30FC\u30BF\u306E\u8AD6\u7406\u7684\u5185\u5BB9\u306B\u57FA\u3065\u3044\u3066\u63A8\u8AD6\u3092\u884C\u3046\u8AD6\u7406\u7684\u63A8\u8AD6\u3092\u53EF\u80FD\u306B\u3059\u308B\u3053\u3068\u3067\u3042\u308B\u3002" . "\u0418\u0437\u0432\u043B\u0435\u0447\u0435\u043D\u0438\u0435 \u0438\u043D\u0444\u043E\u0440\u043C\u0430\u0446\u0438\u0438 (\u0430\u043D\u0433\u043B. information extraction) \u2014 \u044D\u0442\u043E \u0437\u0430\u0434\u0430\u0447\u0430 \u0430\u0432\u0442\u043E\u043C\u0430\u0442\u0438\u0447\u0435\u0441\u043A\u043E\u0433\u043E \u0438\u0437\u0432\u043B\u0435\u0447\u0435\u043D\u0438\u044F (\u043F\u043E\u0441\u0442\u0440\u043E\u0435\u043D\u0438\u044F) \u0441\u0442\u0440\u0443\u043A\u0442\u0443\u0440\u0438\u0440\u043E\u0432\u0430\u043D\u043D\u044B\u0445 \u0434\u0430\u043D\u043D\u044B\u0445 \u0438\u0437 \u043D\u0435\u0441\u0442\u0440\u0443\u043A\u0442\u0443\u0440\u0438\u0440\u043E\u0432\u0430\u043D\u043D\u044B\u0445 \u0438\u043B\u0438 \u0441\u043B\u0430\u0431\u043E\u0441\u0442\u0440\u0443\u043A\u0442\u0443\u0440\u0438\u0440\u043E\u0432\u0430\u043D\u043D\u044B\u0445 \u043C\u0430\u0448\u0438\u043D\u043E\u0447\u0438\u0442\u0430\u0435\u043C\u044B\u0445 \u0434\u043E\u043A\u0443\u043C\u0435\u043D\u0442\u043E\u0432. \u0418\u0437\u0432\u043B\u0435\u0447\u0435\u043D\u0438\u0435 \u0438\u043D\u0444\u043E\u0440\u043C\u0430\u0446\u0438\u0438 \u044F\u0432\u043B\u044F\u0435\u0442\u0441\u044F \u0440\u0430\u0437\u043D\u043E\u0432\u0438\u0434\u043D\u043E\u0441\u0442\u044C\u044E \u0438\u043D\u0444\u043E\u0440\u043C\u0430\u0446\u0438\u043E\u043D\u043D\u043E\u0433\u043E \u043F\u043E\u0438\u0441\u043A\u0430, \u0441\u0432\u044F\u0437\u0430\u043D\u043D\u043E\u0433\u043E \u0441 \u043E\u0431\u0440\u0430\u0431\u043E\u0442\u043A\u043E\u0439 \u0442\u0435\u043A\u0441\u0442\u0430 \u043D\u0430 \u0435\u0441\u0442\u0435\u0441\u0442\u0432\u0435\u043D\u043D\u043E\u043C \u044F\u0437\u044B\u043A\u0435. \u041F\u0440\u0438\u043C\u0435\u0440\u043E\u043C \u0438\u0437\u0432\u043B\u0435\u0447\u0435\u043D\u0438\u044F \u0438\u043D\u0444\u043E\u0440\u043C\u0430\u0446\u0438\u0438 \u043C\u043E\u0436\u0435\u0442 \u0431\u044B\u0442\u044C \u043F\u043E\u0438\u0441\u043A \u0434\u0435\u043B\u043E\u0432\u044B\u0445 \u0432\u0438\u0437\u0438\u0442\u043E\u0432 \u2014 \u0444\u043E\u0440\u043C\u0430\u043B\u044C\u043D\u043E \u044D\u0442\u043E \u0437\u0430\u043F\u0438\u0441\u044B\u0432\u0430\u0435\u0442\u0441\u044F \u0442\u0430\u043A: \u041D\u0430\u043D\u0435\u0441\u043B\u0438\u0412\u0438\u0437\u0438\u0442(\u041A\u043E\u043C\u043F\u0430\u043D\u0438\u044F-\u041A\u0442\u043E, \u041A\u043E\u043C\u043F\u0430\u043D\u0438\u044F-\u041A\u043E\u043C\u0443, \u0414\u0430\u0442\u0430\u0412\u0438\u0437\u0438\u0442\u0430), \u2014 \u0438\u0437 \u043D\u043E\u0432\u043E\u0441\u0442\u043D\u044B\u0445 \u043B\u0435\u043D\u0442, \u0442\u0430\u043A\u0438\u0445 \u043A\u0430\u043A: \u00AB\u0412\u0447\u0435\u0440\u0430, 1 \u0430\u043F\u0440\u0435\u043B\u044F 2007 \u0433\u043E\u0434\u0430, \u043F\u0440\u0435\u0434\u0441\u0442\u0430\u0432\u0438\u0442\u0435\u043B\u0438 \u043A\u043E\u0440\u043F\u043E\u0440\u0430\u0446\u0438\u0438 \u041F\u0435\u043F\u0435\u043B\u0430\u0446 \u0418\u043D\u0442\u0435\u0440\u043D\u044D\u0448\u043D\u043B \u043F\u043E\u0441\u0435\u0442\u0438\u043B\u0438 \u043E\u0444\u0438\u0441 \u043A\u043E\u043C\u043F\u0430\u043D\u0438\u0438 \u0413\u0440\u0430\u0432\u0438\u0446\u0430\u043F \u041F\u0440\u043E\u0434\u0430\u043A\u0448\u043D\u0437\u00BB. \u0413\u043B\u0430\u0432\u043D\u0430\u044F \u0446\u0435\u043B\u044C \u0442\u0430\u043A\u043E\u0433\u043E \u043F\u0440\u0435\u043E\u0431\u0440\u0430\u0437\u043E\u0432\u0430\u043D\u0438\u044F \u2014 \u0432\u043E\u0437\u043C\u043E\u0436\u043D\u043E\u0441\u0442\u044C \u0430\u043D\u0430\u043B\u0438\u0437\u0430 \u0438\u0437\u043D\u0430\u0447\u0430\u043B\u044C\u043D\u043E \u00AB\u0445\u0430\u043E\u0442\u0438\u0447\u043D\u043E\u0439\u00BB \u0438\u043D\u0444\u043E\u0440\u043C\u0430\u0446\u0438\u0438 \u0441 \u043F\u043E\u043C\u043E\u0449\u044C\u044E \u0441\u0442\u0430\u043D\u0434\u0430\u0440\u0442\u043D\u044B\u0445 \u043C\u0435\u0442\u043E\u0434\u043E\u0432 \u043E\u0431\u0440\u0430\u0431\u043E\u0442\u043A\u0438 \u0434\u0430\u043D\u043D\u044B\u0445. \u0411\u043E\u043B\u0435\u0435 \u0443\u0437\u043A\u043E\u0439 \u0446\u0435\u043B\u044C\u044E \u043C\u043E\u0436\u0435\u0442 \u0441\u043B\u0443\u0436\u0438\u0442\u044C, \u043D\u0430\u043F\u0440\u0438\u043C\u0435\u0440, \u0437\u0430\u0434\u0430\u0447\u0430 \u0432\u044B\u044F\u0432\u0438\u0442\u044C \u043B\u043E\u0433\u0438\u0447\u0435\u0441\u043A\u0438\u0435 \u0437\u0430\u043A\u043E\u043D\u043E\u043C\u0435\u0440\u043D\u043E\u0441\u0442\u0438 \u0432 \u043E\u043F\u0438\u0441\u0430\u043D\u043D\u044B\u0445 \u0432 \u0442\u0435\u043A\u0441\u0442\u0435 \u0441\u043E\u0431\u044B\u0442\u0438\u044F\u0445. \u0412 \u0441\u043E\u0432\u0440\u0435\u043C\u0435\u043D\u043D\u044B\u0445 \u0438\u043D\u0444\u043E\u0440\u043C\u0430\u0446\u0438\u043E\u043D\u043D\u044B\u0445 \u0442\u0435\u0445\u043D\u043E\u043B\u043E\u0433\u0438\u044F\u0445 \u0440\u043E\u043B\u044C \u0442\u0430\u043A\u043E\u0439 \u043F\u0440\u043E\u0446\u0435\u0434\u0443\u0440\u044B, \u043A\u0430\u043A \u0438\u0437\u0432\u043B\u0435\u0447\u0435\u043D\u0438\u0435 \u0438\u043D\u0444\u043E\u0440\u043C\u0430\u0446\u0438\u0438, \u0432\u0441\u0451 \u0431\u043E\u043B\u044C\u0448\u0435 \u0432\u043E\u0437\u0440\u0430\u0441\u0442\u0430\u0435\u0442 \u2014 \u0438\u0437-\u0437\u0430 \u0441\u0442\u0440\u0435\u043C\u0438\u0442\u0435\u043B\u044C\u043D\u043E\u0433\u043E \u0443\u0432\u0435\u043B\u0438\u0447\u0435\u043D\u0438\u044F \u043A\u043E\u043B\u0438\u0447\u0435\u0441\u0442\u0432\u0430 \u043D\u0435\u0441\u0442\u0440\u0443\u043A\u0442\u0443\u0440\u0438\u0440\u043E\u0432\u0430\u043D\u043D\u043E\u0439 (\u0431\u0435\u0437 \u043C\u0435\u0442\u0430\u0434\u0430\u043D\u043D\u044B\u0445) \u0438\u043D\u0444\u043E\u0440\u043C\u0430\u0446\u0438\u0438, \u0432 \u0447\u0430\u0441\u0442\u043D\u043E\u0441\u0442\u0438, \u0432 \u0418\u043D\u0442\u0435\u0440\u043D\u0435\u0442\u0435. \u042D\u0442\u0430 \u0438\u043D\u0444\u043E\u0440\u043C\u0430\u0446\u0438\u044F \u043C\u043E\u0436\u0435\u0442 \u0431\u044B\u0442\u044C \u0441\u0434\u0435\u043B\u0430\u043D\u0430 \u0431\u043E\u043B\u0435\u0435 \u0441\u0442\u0440\u0443\u043A\u0442\u0443\u0440\u0438\u0440\u043E\u0432\u0430\u043D\u043D\u043E\u0439 \u043F\u043E\u0441\u0440\u0435\u0434\u0441\u0442\u0432\u043E\u043C \u043F\u0440\u0435\u043E\u0431\u0440\u0430\u0437\u043E\u0432\u0430\u043D\u0438\u044F \u0432 \u0440\u0435\u043B\u044F\u0446\u0438\u043E\u043D\u043D\u0443\u044E \u0444\u043E\u0440\u043C\u0443 \u0438\u043B\u0438 \u0434\u043E\u0431\u0430\u0432\u043B\u0435\u043D\u0438\u0435\u043C XML \u0440\u0430\u0437\u043C\u0435\u0442\u043A\u0438. \u041F\u0440\u0438 \u043C\u043E\u043D\u0438\u0442\u043E\u0440\u0438\u043D\u0433\u0435 \u043D\u043E\u0432\u043E\u0441\u0442\u043D\u044B\u0445 \u043B\u0435\u043D\u0442 \u0441 \u043F\u043E\u043C\u043E\u0449\u044C\u044E \u0438\u043D\u0442\u0435\u043B\u043B\u0435\u043A\u0442\u0443\u0430\u043B\u044C\u043D\u044B\u0445 \u0430\u0433\u0435\u043D\u0442\u043E\u0432 \u043A\u0430\u043A \u0440\u0430\u0437 \u0438 \u043F\u043E\u0442\u0440\u0435\u0431\u0443\u044E\u0442\u0441\u044F \u043C\u0435\u0442\u043E\u0434\u044B \u0438\u0437\u0432\u043B\u0435\u0447\u0435\u043D\u0438\u044F \u0438\u043D\u0444\u043E\u0440\u043C\u0430\u0446\u0438\u0438 \u0438 \u043F\u0440\u0435\u043E\u0431\u0440\u0430\u0437\u043E\u0432\u0430\u043D\u0438\u044F \u0435\u0451 \u0432 \u0442\u0430\u043A\u0443\u044E \u0444\u043E\u0440\u043C\u0443, \u0441 \u043A\u043E\u0442\u043E\u0440\u043E\u0439 \u0431\u0443\u0434\u0435\u0442 \u0443\u0434\u043E\u0431\u043D\u0435\u0435 \u0440\u0430\u0431\u043E\u0442\u0430\u0442\u044C \u043F\u043E\u0437\u0436\u0435. \u0422\u0438\u043F\u0438\u0447\u043D\u0430\u044F \u0437\u0430\u0434\u0430\u0447\u0430 \u0438\u0437\u0432\u043B\u0435\u0447\u0435\u043D\u0438\u044F \u0438\u043D\u0444\u043E\u0440\u043C\u0430\u0446\u0438\u0438: \u043F\u0440\u043E\u0441\u043A\u0430\u043D\u0438\u0440\u043E\u0432\u0430\u0442\u044C \u043D\u0430\u0431\u043E\u0440 \u0434\u043E\u043A\u0443\u043C\u0435\u043D\u0442\u043E\u0432, \u043D\u0430\u043F\u0438\u0441\u0430\u043D\u043D\u044B\u0445 \u043D\u0430 \u0435\u0441\u0442\u0435\u0441\u0442\u0432\u0435\u043D\u043D\u043E\u043C \u044F\u0437\u044B\u043A\u0435, \u0438 \u043D\u0430\u043F\u043E\u043B\u043D\u0438\u0442\u044C \u0431\u0430\u0437\u0443 \u0434\u0430\u043D\u043D\u044B\u0445 \u0432\u044B\u0434\u0435\u043B\u0435\u043D\u043D\u043E\u0439 \u043F\u043E\u043B\u0435\u0437\u043D\u043E\u0439 \u0438\u043D\u0444\u043E\u0440\u043C\u0430\u0446\u0438\u0435\u0439. \u0421\u043E\u0432\u0440\u0435\u043C\u0435\u043D\u043D\u044B\u0435 \u043F\u043E\u0434\u0445\u043E\u0434\u044B \u0438\u0437\u0432\u043B\u0435\u0447\u0435\u043D\u0438\u044F \u0438\u043D\u0444\u043E\u0440\u043C\u0430\u0446\u0438\u0438 \u0438\u0441\u043F\u043E\u043B\u044C\u0437\u0443\u044E\u0442 \u043C\u0435\u0442\u043E\u0434\u044B \u043E\u0431\u0440\u0430\u0431\u043E\u0442\u043A\u0438 \u0435\u0441\u0442\u0435\u0441\u0442\u0432\u0435\u043D\u043D\u043E\u0433\u043E \u044F\u0437\u044B\u043A\u0430, \u043D\u0430\u043F\u0440\u0430\u0432\u043B\u0435\u043D\u043D\u044B\u0435 \u043B\u0438\u0448\u044C \u043D\u0430 \u043E\u0447\u0435\u043D\u044C \u043E\u0433\u0440\u0430\u043D\u0438\u0447\u0435\u043D\u043D\u044B\u0439 \u043D\u0430\u0431\u043E\u0440 \u0442\u0435\u043C (\u0432\u043E\u043F\u0440\u043E\u0441\u043E\u0432, \u043F\u0440\u043E\u0431\u043B\u0435\u043C) \u2014 \u0447\u0430\u0441\u0442\u043E \u0442\u043E\u043B\u044C\u043A\u043E \u043D\u0430 \u043E\u0434\u043D\u0443 \u0442\u0435\u043C\u0443. \u041D\u0430\u043F\u0440\u0438\u043C\u0435\u0440, \u00AB\u041A\u043E\u043D\u0444\u0435\u0440\u0435\u043D\u0446\u0438\u044F \u043F\u043E \u041F\u043E\u043D\u0438\u043C\u0430\u043D\u0438\u044E \u0441\u043E\u043E\u0431\u0449\u0435\u043D\u0438\u0439\u00BB (en:Message Understanding Conference, MUC) \u2014 \u044D\u0442\u043E \u043A\u043E\u043D\u0444\u0435\u0440\u0435\u043D\u0446\u0438\u044F \u0441\u043E\u0440\u0435\u0432\u043D\u043E\u0432\u0430\u0442\u0435\u043B\u044C\u043D\u043E\u0433\u043E \u0445\u0430\u0440\u0430\u043A\u0442\u0435\u0440\u0430 \u0438 \u0432 \u043F\u0440\u043E\u0448\u043B\u043E\u043C \u043E\u043D\u0430 \u0444\u043E\u043A\u0443\u0441\u0438\u0440\u043E\u0432\u0430\u043B\u0430\u0441\u044C \u043D\u0430 \u0442\u0430\u043A\u0438\u0445 \u0432\u043E\u043F\u0440\u043E\u0441\u0430\u0445: \n* MUC-1 (1987), MUC-2 (1989): \u0412\u043E\u0435\u043D\u043D\u043E-\u043C\u043E\u0440\u0441\u043A\u0438\u0435 \u043E\u043F\u0435\u0440\u0430\u0446\u0438\u0438. \n* MUC-3 (1991), MUC-4 (1992): \u0422\u0435\u0440\u0440\u043E\u0440\u0438\u0437\u043C \u0432 \u043B\u0430\u0442\u0438\u043D\u043E\u0430\u043C\u0435\u0440\u0438\u043A\u0430\u043D\u0441\u043A\u0438\u0445 \u0441\u0442\u0440\u0430\u043D\u0430\u0445. \n* MUC-5 (1993): \u0412\u0435\u043D\u0447\u0443\u0440\u043D\u044B\u0435 \u043E\u043F\u0435\u0440\u0430\u0446\u0438\u0438 \u0432 \u043E\u0431\u043B\u0430\u0441\u0442\u0438 \u043C\u0438\u043A\u0440\u043E\u044D\u043B\u0435\u043A\u0442\u0440\u043E\u043D\u0438\u043A\u0438. \n* MUC-6 (1995): \u041D\u043E\u0432\u043E\u0441\u0442\u043D\u044B\u0435 \u0441\u0442\u0430\u0442\u044C\u0438 \u043E\u0431 \u0438\u0437\u043C\u0435\u043D\u0435\u043D\u0438\u044F\u0445 \u0432 \u0443\u043F\u0440\u0430\u0432\u043B\u044F\u044E\u0449\u0438\u0445 \u043F\u0440\u043E\u0446\u0435\u0441\u0441\u0430\u0445. \n* MUC-7 (1998): \u041E\u0442\u0447\u0451\u0442\u044B \u043E \u0437\u0430\u043F\u0443\u0441\u043A\u0430\u0445 \u0441\u043F\u0443\u0442\u043D\u0438\u043A\u043E\u0432. \u0422\u0435\u043A\u0441\u0442\u044B \u043D\u0430 \u0435\u0441\u0442\u0435\u0441\u0442\u0432\u0435\u043D\u043D\u043E\u043C \u044F\u0437\u044B\u043A\u0435 \u043C\u043E\u0433\u0443\u0442 \u043F\u043E\u0442\u0440\u0435\u0431\u043E\u0432\u0430\u0442\u044C \u043D\u0435\u043A\u043E\u0435\u0433\u043E \u043F\u0440\u0435\u0434\u0432\u0430\u0440\u0438\u0442\u0435\u043B\u044C\u043D\u043E\u0433\u043E \u043F\u0440\u0435\u043E\u0431\u0440\u0430\u0437\u043E\u0432\u0430\u043D\u0438\u044F \u043D\u0430 \u044F\u0437\u044B\u043A (\u043D\u0430\u043F\u0440\u0438\u043C\u0435\u0440, RDF \u2014 Resource Description Framework), \u043F\u043E\u043D\u044F\u0442\u043D\u044B\u0439 \u0434\u043B\u044F \u043A\u043E\u043C\u043F\u044C\u044E\u0442\u0435\u0440\u0430. \u0422\u0438\u043F\u0438\u0447\u043D\u044B\u0435 \u043F\u043E\u0434\u0437\u0430\u0434\u0430\u0447\u0438 \u0438\u0437\u0432\u043B\u0435\u0447\u0435\u043D\u0438\u044F \u0438\u043D\u0444\u043E\u0440\u043C\u0430\u0446\u0438\u0438: \n* \u0420\u0430\u0441\u043F\u043E\u0437\u043D\u0430\u0432\u0430\u043D\u0438\u0435 \u0438\u043C\u0435\u043D\u043E\u0432\u0430\u043D\u043D\u044B\u0445 \u044D\u043B\u0435\u043C\u0435\u043D\u0442\u043E\u0432 (\u0441\u0443\u0449\u043D\u043E\u0441\u0442\u0435\u0439), \u043D\u0430\u043F\u0440\u0438\u043C\u0435\u0440: \u0438\u043C\u0451\u043D \u043B\u044E\u0434\u0435\u0439, \u043D\u0430\u0437\u0432\u0430\u043D\u0438\u0439 \u043E\u0440\u0433\u0430\u043D\u0438\u0437\u0430\u0446\u0438\u0439, \u0433\u0435\u043E\u0433\u0440\u0430\u0444\u0438\u0447\u0435\u0441\u043A\u0438\u0445 \u043D\u0430\u0437\u0432\u0430\u043D\u0438\u0439, \u0441\u043E\u0431\u044B\u0442\u0438\u0439, \u0432\u0440\u0435\u043C\u0435\u043D\u043D\u044B\u0301\u0445 \u0438 \u0434\u0435\u043D\u0435\u0436\u043D\u044B\u0445 \u043E\u0431\u043E\u0437\u043D\u0430\u0447\u0435\u043D\u0438\u0439 \u0438 \u043F\u0440. \n* \u0420\u0430\u0437\u0440\u0435\u0448\u0435\u043D\u0438\u0435 \u0430\u043D\u0430\u0444\u043E\u0440\u044B \u0438 \u043A\u043E\u0440\u0435\u0444\u0435\u0440\u0435\u043D\u0446\u0438\u0439 : \u043F\u043E\u0438\u0441\u043A \u0441\u0432\u044F\u0437\u0435\u0439, \u043E\u0442\u043D\u043E\u0441\u044F\u0449\u0438\u0445\u0441\u044F \u043A \u043E\u0434\u043D\u043E\u043C\u0443 \u0438 \u0442\u043E\u043C\u0443 \u0436\u0435 \u043E\u0431\u044A\u0435\u043A\u0442\u0443. \u0422\u0438\u043F\u0438\u0447\u043D\u044B\u0439 \u0441\u043B\u0443\u0447\u0430\u0439 \u0442\u0430\u043A\u0438\u0445 \u0441\u0441\u044B\u043B\u043E\u043A \u2014 \u043C\u0435\u0441\u0442\u043E\u0438\u043C\u0435\u043D\u043D\u0430\u044F \u0430\u043D\u0430\u0444\u043E\u0440\u0430. \n* \u0412\u044B\u0434\u0435\u043B\u0435\u043D\u0438\u0435 \u0442\u0435\u0440\u043C\u0438\u043D\u043E\u043B\u043E\u0433\u0438\u0438: \u043D\u0430\u0445\u043E\u0436\u0434\u0435\u043D\u0438\u0435 \u0434\u043B\u044F \u0434\u0430\u043D\u043D\u043E\u0433\u043E \u0442\u0435\u043A\u0441\u0442\u0430 \u043A\u043B\u044E\u0447\u0435\u0432\u044B\u0445 \u0441\u043B\u043E\u0432 \u0438 \u0441\u043B\u043E\u0432\u043E\u0441\u043E\u0447\u0435\u0442\u0430\u043D\u0438\u0439 (\u043A\u043E\u043B\u043B\u043E\u043A\u0430\u0446\u0438\u0439). \n* \u0410\u0432\u0442\u043E\u0440\u0435\u0444\u0435\u0440\u0438\u0440\u043E\u0432\u0430\u043D\u0438\u0435: \u0432\u044B\u0434\u0435\u043B\u0435\u043D\u0438\u0435 \u0438\u0437 \u0442\u0435\u043A\u0441\u0442\u0430 \u0441\u043C\u044B\u0441\u043B\u043E\u0432\u043E\u0439, \u044D\u043C\u043E\u0442\u0438\u0432\u043D\u043E\u0439, \u043E\u0446\u0435\u043D\u043E\u0447\u043D\u043E\u0439 \u0438 \u043F\u0440. \u0438\u043D\u0444\u043E\u0440\u043C\u0430\u0446\u0438\u0438. \u0411\u044B\u0432\u0430\u0435\u0442 \u0433\u0435\u043D\u0435\u0440\u0430\u0442\u0438\u0432\u043D\u044B\u043C \u0438 \u0434\u0435\u043A\u043B\u0430\u0440\u0430\u0442\u0438\u0432\u043D\u044B\u043C." . . "\u0418\u0437\u0432\u043B\u0435\u0447\u0435\u043D\u0438\u0435 \u0438\u043D\u0444\u043E\u0440\u043C\u0430\u0446\u0438\u0438 (\u0430\u043D\u0433\u043B. information extraction) \u2014 \u044D\u0442\u043E \u0437\u0430\u0434\u0430\u0447\u0430 \u0430\u0432\u0442\u043E\u043C\u0430\u0442\u0438\u0447\u0435\u0441\u043A\u043E\u0433\u043E \u0438\u0437\u0432\u043B\u0435\u0447\u0435\u043D\u0438\u044F (\u043F\u043E\u0441\u0442\u0440\u043E\u0435\u043D\u0438\u044F) \u0441\u0442\u0440\u0443\u043A\u0442\u0443\u0440\u0438\u0440\u043E\u0432\u0430\u043D\u043D\u044B\u0445 \u0434\u0430\u043D\u043D\u044B\u0445 \u0438\u0437 \u043D\u0435\u0441\u0442\u0440\u0443\u043A\u0442\u0443\u0440\u0438\u0440\u043E\u0432\u0430\u043D\u043D\u044B\u0445 \u0438\u043B\u0438 \u0441\u043B\u0430\u0431\u043E\u0441\u0442\u0440\u0443\u043A\u0442\u0443\u0440\u0438\u0440\u043E\u0432\u0430\u043D\u043D\u044B\u0445 \u043C\u0430\u0448\u0438\u043D\u043E\u0447\u0438\u0442\u0430\u0435\u043C\u044B\u0445 \u0434\u043E\u043A\u0443\u043C\u0435\u043D\u0442\u043E\u0432. \n* MUC-1 (1987), MUC-2 (1989): \u0412\u043E\u0435\u043D\u043D\u043E-\u043C\u043E\u0440\u0441\u043A\u0438\u0435 \u043E\u043F\u0435\u0440\u0430\u0446\u0438\u0438. \n* MUC-3 (1991), MUC-4 (1992): \u0422\u0435\u0440\u0440\u043E\u0440\u0438\u0437\u043C \u0432 \u043B\u0430\u0442\u0438\u043D\u043E\u0430\u043C\u0435\u0440\u0438\u043A\u0430\u043D\u0441\u043A\u0438\u0445 \u0441\u0442\u0440\u0430\u043D\u0430\u0445. \n* MUC-5 (1993): \u0412\u0435\u043D\u0447\u0443\u0440\u043D\u044B\u0435 \u043E\u043F\u0435\u0440\u0430\u0446\u0438\u0438 \u0432 \u043E\u0431\u043B\u0430\u0441\u0442\u0438 \u043C\u0438\u043A\u0440\u043E\u044D\u043B\u0435\u043A\u0442\u0440\u043E\u043D\u0438\u043A\u0438. \n* MUC-6 (1995): \u041D\u043E\u0432\u043E\u0441\u0442\u043D\u044B\u0435 \u0441\u0442\u0430\u0442\u044C\u0438 \u043E\u0431 \u0438\u0437\u043C\u0435\u043D\u0435\u043D\u0438\u044F\u0445 \u0432 \u0443\u043F\u0440\u0430\u0432\u043B\u044F\u044E\u0449\u0438\u0445 \u043F\u0440\u043E\u0446\u0435\u0441\u0441\u0430\u0445. \n* MUC-7 (1998): \u041E\u0442\u0447\u0451\u0442\u044B \u043E \u0437\u0430\u043F\u0443\u0441\u043A\u0430\u0445 \u0441\u043F\u0443\u0442\u043D\u0438\u043A\u043E\u0432. \u0422\u0438\u043F\u0438\u0447\u043D\u044B\u0435 \u043F\u043E\u0434\u0437\u0430\u0434\u0430\u0447\u0438 \u0438\u0437\u0432\u043B\u0435\u0447\u0435\u043D\u0438\u044F \u0438\u043D\u0444\u043E\u0440\u043C\u0430\u0446\u0438\u0438:" . "\u4FE1\u606F\u62BD\u53D6\uFF08Information Extraction\uFF0C\u7C21\u7A31IE\uFF0C\u53C8\u8B6F\u8CC7\u8A0A\u64F7\u53D6\u6280\u8853\uFF09\u4E3B\u8981\u662F\u5F9E\u5927\u91CF\u6587\u5B57\u8CC7\u6599\u4E2D\u81EA\u52D5\u62BD\u53D6\u7279\u5B9A\u8A0A\u606F\uFF08Particular Information\uFF09\uFF0C\u4EE5\u4F5C\u70BA\u8CC7\u6599\u5EAB\u5B58\u53D6\uFF08Database Access\uFF09\u4E4B\u7528\u7684\u6280\u8853\u3002 \u4FE1\u606F\u62BD\u53D6\u7684\u4E00\u500B\u5EE3\u6CDB\u76EE\u6A19\u662F\u5141\u8A31\u5C0D\u4EE5\u5F80\u975E\u7D50\u69CB\u5316\u7684\u8CC7\u6599\u53BB\u505A\u8A08\u7B97\uFF0C\u5177\u9AD4\u4F86\u8AAA\u5C31\u662F\u8981\u5141\u8A31\u908F\u8F2F\u63A8\u7406\u80FD\u5C0D\u8F38\u5165\u8CC7\u6599\u7684\u908F\u8F2F\u5167\u5BB9\u53EF\u4EE5\u8209\u4E00\u53CD\u4E09\u3002\u5176\u610F\u7FA9\u5728\u65BC\u6C7A\u5B9A\u4E86\u4F8B\u5982\u5728\u7DB2\u969B\u7DB2\u8DEF\u4E0A\u5176\u975E\u7D50\u69CB\u5316\uFF08\u4F8B\uFF1A\u4E0D\u5305\u542B\u5143\u6578\u64DA\uFF09\u5F62\u5F0F\u4E2D\u6709\u7528\u8CC7\u8A0A\u6578\u91CF\u7684\u6210\u9577\u3002\u5728\u9019\u65B9\u9762\u7684\u6280\u8853\u4E0A\u662F\u900F\u904E\u8F49\u63DB\u5230\u95DC\u4FC2\u5F62\u5F0F\u6216\u662F\u7D93\u7531XML\u6A19\u7C64\u7684\u6A19\u8A18\u4F86\u9054\u5230\u66F4\u591A\u7684\u53EF\u5B58\u53D6\u6027\u2500\u2500\u4E00\u500B\u667A\u6167\u578B\u4EE3\u7406\u7A0B\u5E8F\uFF0C\u76E3\u7763\u4E00\u65B0\u805E\u8CC7\u6599\u994B\u6D41\uFF0C\u9700\u8981\u8CC7\u8A0A\u64F7\u53D6\u6280\u8853\u4F86\u8F49\u63DB\u975E\u7D50\u69CB\u5316\u8CC7\u6599\u5230\u67D0\u7A2E\u53EF\u63A8\u8AD6\u7684\u65B9\u5F0F\u3002" . . . . . . "\u4FE1\u606F\u62BD\u53D6" . . . . "\u0627\u0633\u062A\u062E\u0631\u0627\u062C \u0627\u0644\u0645\u0639\u0644\u0648\u0645\u0627\u062A (\u0622\u064A \u0625\u064A) \u0647\u0648 \u0646\u0648\u0639 \u0645\u0646 \u0627\u0633\u062A\u0631\u062C\u0627\u0639 \u0627\u0644\u0645\u0639\u0644\u0648\u0645\u0627\u062A \u0627\u0644\u062A\u064A \u062A\u0647\u062F\u0641 \u0625\u0644\u0649 \u0627\u0633\u062A\u062E\u0631\u0627\u062C \u0627\u0644\u0645\u0639\u0644\u0648\u0645\u0627\u062A \u0627\u0644\u0645\u0647\u064A\u0643\u0644\u0629 \u062A\u0644\u0642\u0627\u0626\u064A\u0627 \u0645\u0646 \u0627\u0644\u0648\u062B\u0627\u0626\u0642 \u063A\u064A\u0631 \u0627\u0644\u0645\u0647\u064A\u0643\u0644\u0629 \u0627\u0644\u0645\u0642\u0631\u0648\u0621\u0629 \u0622\u0644\u064A\u0627\u060C \u0628\u0634\u0643\u0644 \u0639\u0627\u0645 \u0627\u0633\u062A\u062E\u0631\u0627\u062C \u0627\u0644\u0645\u0639\u0644\u0648\u0645\u0627\u062A \u0627\u0644\u0645\u0647\u064A\u0643\u0644\u0629 \u0645\u0646 \u0646\u0635\u0648\u0635 \u0627\u0644\u0644\u063A\u0627\u062A \u0627\u0644\u0628\u0634\u0631\u064A\u0629 \u0639\u0646 \u0637\u0631\u064A\u0642 \u0645\u0639\u0627\u0644\u062C\u0629 \u0627\u0644\u0644\u063A\u0629 \u0627\u0644\u0637\u0628\u064A\u0639\u064A\u0629. \u0648\u0646\u0638\u0631\u0627 \u0644\u0635\u0639\u0648\u0628\u0629 \u0627\u0644\u0645\u0634\u0643\u0644\u0629\u060C \u0641\u0625\u0646 \u0627\u0644\u0646\u0647\u062C \u0627\u0644\u062D\u0627\u0644\u064A \u0644\u0627\u0633\u062A\u062E\u0631\u0627\u062C \u0627\u0644\u0645\u0639\u0644\u0648\u0645\u0627\u062A \u0647\u0648 \u0627\u0644\u062A\u0631\u0643\u064A\u0632 \u0639\u0644\u0649 \u0645\u062C\u0627\u0644\u0627\u062A \u0645\u062D\u062F\u0648\u062F\u0629 \u0636\u064A\u0642\u0629. \u0648\u0645\u0646 \u0627\u0644\u0623\u0645\u062B\u0644\u0629 \u0639\u0644\u0649 \u0630\u0644\u0643 \u0647\u0648 \u0627\u0644\u0627\u0633\u062A\u062E\u0631\u0627\u062C \u0645\u0646 \u062A\u0642\u0627\u0631\u064A\u0631 \u0648\u0643\u0627\u0644\u0627\u062A \u0627\u0644\u0623\u0646\u0628\u0627\u0621\u0645\u0646 \u0639\u0645\u0644\u064A\u0627\u062A \u0627\u0644\u062F\u0645\u062C \u0628\u064A\u0646 \u0627\u0644\u0634\u0631\u0643\u0627\u062A\u060C \u0643\u0645\u0627 \u062A\u0648\u0636\u062D \u0627\u0644\u0639\u0644\u0627\u0642\u0629 \u0627\u0644\u062A\u0627\u0644\u064A\u0629: \u062F\u0645\u062C_\u0628\u064A\u0646(\u0627\u0644\u0634\u0631\u0643\u0629_1\u060C \u0627\u0644\u0634\u0631\u0643\u0629_2\u060C \u062A\u0627\u0631\u064A\u062E)\u060C \u0645\u0646 \u0627\u0644\u062C\u0645\u0644\u0629 \u0627\u0644\u0623\u062E\u0628\u0627\u0631\u064A\u0629 \u0639\u0644\u0649 \u0627\u0644\u0625\u0646\u062A\u0631\u0646\u062A \u0645\u062B\u0644: \u0627\u0645\u0633\u060C \u0623\u0639\u0644\u0646\u062A \u0634\u0631\u0643\u0629 \u063A\u0632\u0644 \u0627\u0644\u0646\u0633\u064A\u062C \u0627\u0644\u0645\u062D\u062F\u0648\u062F\u0629 \u0639\u0646 \u062D\u0635\u0648\u0644\u0647\u0627 \u0639\u0644\u0649 \u0634\u0631\u0643\u0629 \u0627\u0644\u0627\u0642\u0637\u0627\u0646 \u0627\u0644\u0639\u0631\u0628\u064A\u0629."@ar . "\u0418\u0437\u0432\u043B\u0435\u0447\u0435\u043D\u0438\u0435 \u0438\u043D\u0444\u043E\u0440\u043C\u0430\u0446\u0438\u0438" . "\u0627\u0633\u062A\u062E\u0631\u0627\u062C \u0627\u0644\u0645\u0639\u0644\u0648\u0645\u0627\u062A"@ar . . . "La extracci\u00F3n de la informaci\u00F3n (de sus siglas en ingl\u00E9s IE, Information Extraction) es un tipo de recuperaci\u00F3n de la informaci\u00F3n cuyo objetivo es extraer autom\u00E1ticamente informaci\u00F3n estructurada o semiestructurada desde documentos legibles por una computadora. El objetivo es procesar estos documentos con un software de procesamiento de lenguaje natural (NLP) para extraer informaci\u00F3n \u00FAtil de ellos. Esta tarea es muy compleja ya que estos programas suelen operar con unos dominios muy restringidos. Lo que dificulta extraer la informaci\u00F3n de textos con un lenguaje poco formal o im\u00E1genes." . . . . . . . . . . "\u60C5\u5831\u62BD\u51FA" . . . "\u60C5\u5831\u62BD\u51FA (Information Extraction; IE) \u306F\u975E\u69CB\u9020\u5316\u6587\u66F8\u3068\u6A5F\u68B0\u304C\u8AAD\u307F\u53D6\u308C\u308B (machine-redable\u306A) \u534A\u69CB\u9020\u5316\u6587\u66F8\u306E\u4E21\u65B9\u307E\u305F\u306F\u3044\u305A\u308C\u304B\u3089\u81EA\u52D5\u7684\u306B\u69CB\u9020\u5316\u30C7\u30FC\u30BF\u3092\u62BD\u51FA\u3059\u308B\u30BF\u30B9\u30AF\u3067\u3042\u308B\u3002 \u591A\u304F\u306E\u5834\u5408\u3001\u3053\u306E\u4F5C\u696D\u306F\u4EBA\u9593\u306E\u8A00\u8449\u3067\u66F8\u304B\u308C\u305F\u6587\u66F8\u3092\u81EA\u7136\u8A00\u8A9E\u51E6\u7406 (Natural Language Processing; NLP) \u306E\u624B\u6CD5\u3092\u7528\u3044\u3066\u51E6\u7406\u3059\u308B\u3053\u3068\u3092\u6307\u3059\u3002\u753B\u50CF\u30FB\u97F3\u697D\u30FB\u52D5\u753B\u306E\u81EA\u52D5\u30A2\u30CE\u30C6\u30FC\u30B7\u30E7\u30F3\u3084\u30B3\u30F3\u30C6\u30F3\u30C4\u62BD\u51FA\u306E\u3088\u3046\u306A\u3001\u8FD1\u5E74\u306E\u30DE\u30EB\u30C1\u30E1\u30C7\u30A3\u30A2\u6587\u66F8\u306E\u51E6\u7406\u3082\u307E\u305F\u60C5\u5831\u62BD\u51FA\u3068\u3057\u3066\u6349\u3048\u3089\u308C\u308B\u3002 \u305D\u306E\u554F\u984C\u306E\u96E3\u3057\u3055\u304B\u3089\u3001IE\u306B\u5BFE\u3059\u308B\u73FE\u5728\u306E\u30A2\u30D7\u30ED\u30FC\u30C1\u306F\u72ED\u304F\u5236\u9650\u3055\u308C\u305F\u30C9\u30E1\u30A4\u30F3\u306B\u7126\u70B9\u3092\u5F53\u3066\u3066\u3044\u308B\u3002\u4F8B\u3068\u3057\u3066\u3001\u30CB\u30E5\u30FC\u30B9\u30B5\u30FC\u30D3\u30B9\u306E\u4F01\u696D\u5408\u4F75\u306B\u3064\u3044\u3066\u306E\u5831\u9053\u304B\u3089\u306E\u60C5\u5831\u62BD\u51FA\u304C\u3042\u308A\u3001\u6B21\u306E\u3088\u3046\u306A\u30D5\u30A9\u30FC\u30DE\u30EB\u306A\u95A2\u4FC2\u306B\u3088\u308B\u60C5\u5831 , \u3092\u6B21\u306E\u3088\u3046\u306A\u30CB\u30E5\u30FC\u30B9\u6587 \"Yesterday, New York based Foo Inc. announced their acquisition of Bar Corp.\" \u304B\u3089\u629C\u304D\u51FA\u3059\u3002 IE\u306E\u5E83\u3044\u76EE\u6A19\u306F\u3001\u84C4\u7A4D\u3055\u308C\u305F\u975E\u69CB\u9020\u5316\u30C7\u30FC\u30BF\u306E\u3046\u3048\u3067\u51E6\u7406\u3092\u884C\u3048\u308B\u3088\u3046\u306B\u3059\u308B\u3053\u3068\u3067\u3042\u308B\u3002\u3088\u308A\u5177\u4F53\u7684\u306A\u76EE\u6A19\u306F\u3001\u5165\u529B\u30C7\u30FC\u30BF\u306E\u8AD6\u7406\u7684\u5185\u5BB9\u306B\u57FA\u3065\u3044\u3066\u63A8\u8AD6\u3092\u884C\u3046\u8AD6\u7406\u7684\u63A8\u8AD6\u3092\u53EF\u80FD\u306B\u3059\u308B\u3053\u3068\u3067\u3042\u308B\u3002" . "\u0627\u0633\u062A\u062E\u0631\u0627\u062C \u0627\u0644\u0645\u0639\u0644\u0648\u0645\u0627\u062A (\u0622\u064A \u0625\u064A) \u0647\u0648 \u0646\u0648\u0639 \u0645\u0646 \u0627\u0633\u062A\u0631\u062C\u0627\u0639 \u0627\u0644\u0645\u0639\u0644\u0648\u0645\u0627\u062A \u0627\u0644\u062A\u064A \u062A\u0647\u062F\u0641 \u0625\u0644\u0649 \u0627\u0633\u062A\u062E\u0631\u0627\u062C \u0627\u0644\u0645\u0639\u0644\u0648\u0645\u0627\u062A \u0627\u0644\u0645\u0647\u064A\u0643\u0644\u0629 \u062A\u0644\u0642\u0627\u0626\u064A\u0627 \u0645\u0646 \u0627\u0644\u0648\u062B\u0627\u0626\u0642 \u063A\u064A\u0631 \u0627\u0644\u0645\u0647\u064A\u0643\u0644\u0629 \u0627\u0644\u0645\u0642\u0631\u0648\u0621\u0629 \u0622\u0644\u064A\u0627\u060C \u0628\u0634\u0643\u0644 \u0639\u0627\u0645 \u0627\u0633\u062A\u062E\u0631\u0627\u062C \u0627\u0644\u0645\u0639\u0644\u0648\u0645\u0627\u062A \u0627\u0644\u0645\u0647\u064A\u0643\u0644\u0629 \u0645\u0646 \u0646\u0635\u0648\u0635 \u0627\u0644\u0644\u063A\u0627\u062A \u0627\u0644\u0628\u0634\u0631\u064A\u0629 \u0639\u0646 \u0637\u0631\u064A\u0642 \u0645\u0639\u0627\u0644\u062C\u0629 \u0627\u0644\u0644\u063A\u0629 \u0627\u0644\u0637\u0628\u064A\u0639\u064A\u0629. \u0648\u0646\u0638\u0631\u0627 \u0644\u0635\u0639\u0648\u0628\u0629 \u0627\u0644\u0645\u0634\u0643\u0644\u0629\u060C \u0641\u0625\u0646 \u0627\u0644\u0646\u0647\u062C \u0627\u0644\u062D\u0627\u0644\u064A \u0644\u0627\u0633\u062A\u062E\u0631\u0627\u062C \u0627\u0644\u0645\u0639\u0644\u0648\u0645\u0627\u062A \u0647\u0648 \u0627\u0644\u062A\u0631\u0643\u064A\u0632 \u0639\u0644\u0649 \u0645\u062C\u0627\u0644\u0627\u062A \u0645\u062D\u062F\u0648\u062F\u0629 \u0636\u064A\u0642\u0629. \u0648\u0645\u0646 \u0627\u0644\u0623\u0645\u062B\u0644\u0629 \u0639\u0644\u0649 \u0630\u0644\u0643 \u0647\u0648 \u0627\u0644\u0627\u0633\u062A\u062E\u0631\u0627\u062C \u0645\u0646 \u062A\u0642\u0627\u0631\u064A\u0631 \u0648\u0643\u0627\u0644\u0627\u062A \u0627\u0644\u0623\u0646\u0628\u0627\u0621\u0645\u0646 \u0639\u0645\u0644\u064A\u0627\u062A \u0627\u0644\u062F\u0645\u062C \u0628\u064A\u0646 \u0627\u0644\u0634\u0631\u0643\u0627\u062A\u060C \u0643\u0645\u0627 \u062A\u0648\u0636\u062D \u0627\u0644\u0639\u0644\u0627\u0642\u0629 \u0627\u0644\u062A\u0627\u0644\u064A\u0629: \u062F\u0645\u062C_\u0628\u064A\u0646(\u0627\u0644\u0634\u0631\u0643\u0629_1\u060C \u0627\u0644\u0634\u0631\u0643\u0629_2\u060C \u062A\u0627\u0631\u064A\u062E)\u060C \u0645\u0646 \u0627\u0644\u062C\u0645\u0644\u0629 \u0627\u0644\u0623\u062E\u0628\u0627\u0631\u064A\u0629 \u0639\u0644\u0649 \u0627\u0644\u0625\u0646\u062A\u0631\u0646\u062A \u0645\u062B\u0644: \u0627\u0645\u0633\u060C \u0623\u0639\u0644\u0646\u062A \u0634\u0631\u0643\u0629 \u063A\u0632\u0644 \u0627\u0644\u0646\u0633\u064A\u062C \u0627\u0644\u0645\u062D\u062F\u0648\u062F\u0629 \u0639\u0646 \u062D\u0635\u0648\u0644\u0647\u0627 \u0639\u0644\u0649 \u0634\u0631\u0643\u0629 \u0627\u0644\u0627\u0642\u0637\u0627\u0646 \u0627\u0644\u0639\u0631\u0628\u064A\u0629. \u0627\u0644\u0647\u062F\u0641 \u0627\u0644\u0627\u0634\u0645\u0644 \u0644\u0639\u0645\u0644\u064A\u0629 \u0627\u0633\u062A\u062E\u0631\u0627\u062C \u0627\u0644\u0645\u0639\u0644\u0648\u0645\u0627\u062A \u0647\u0648 \u0627\u0644\u0633\u0645\u0627\u062D \u0644\u0644\u0645\u0639\u0627\u0644\u062C\u0629 \u0627\u0644\u062D\u0627\u0633\u0648\u0628\u064A\u0629 \u0627\u0646 \u062A\u062A\u0645 \u0633\u0644\u0641\u0627 \u0639\u0644\u0649 \u0627\u0644\u0628\u064A\u0627\u0646\u0627\u062A \u063A\u064A\u0631 \u0627\u0644\u0647\u064A\u0643\u0644\u064A\u0629. \u0648\u062B\u0645\u0629 \u0647\u062F\u0641 \u0623\u0643\u062B\u0631 \u062A\u062D\u062F\u064A\u062F\u0627 \u0647\u0648 \u0627\u0644\u0633\u0645\u0627\u062D \u0644\u0644\u062A\u0641\u0643\u064A\u0631 \u0627\u0644\u0645\u0646\u0637\u0642\u064A \u0623\u0646 \u064A\u0642\u0648\u0645 \u0628\u0627\u0644\u0627\u0633\u062A\u062F\u0644\u0627\u0644 \u0639\u0644\u0649 \u0623\u0633\u0627\u0633 \u0627\u0644\u0645\u062D\u062A\u0648\u0649 \u0627\u0644\u0645\u0646\u0637\u0642\u064A \u0644\u0644\u0628\u064A\u0627\u0646\u0627\u062A \u0627\u0644\u0645\u062F\u062E\u0644\u0629. \u0627\u0644\u0628\u064A\u0627\u0646\u0627\u062A \u0627\u0644\u0647\u064A\u0643\u0644\u064A\u0629 \u0647\u064A \u0628\u064A\u0627\u0646\u0627\u062A \u0648\u0627\u0636\u062D\u0629 \u0627\u0644\u0645\u0639\u0627\u0644\u0645 \u062F\u0644\u0627\u0644\u064A\u0627 \u0645\u0646 \u0627\u0644\u0645\u062C\u0627\u0644 \u0627\u0644\u0645\u062E\u062A\u0627\u0631\u060C \u062A\u0645 \u062A\u0641\u0633\u064A\u0631\u0647 \u0628\u062F\u0642\u0629 \u0648\u0639\u0646\u0627\u064A\u0629 \u0648\u0641\u0642\u0627 \u0644\u0644\u062A\u0635\u0646\u064A\u0641 \u0648\u0627\u0644\u0633\u064A\u0627\u0642."@ar . "Information extraction" . "Tekstanalyse is het op gestructureerde wijze analyseren van tekst en context. Het is een werkwijze die in de taalkunde specifiek gevolgd kan worden bij het begrijpend lezen van een tekst en het doorgronden van de betekenis ervan. Tekstanalyse vormt dan een onderdeel van de taalbeheersing als wetenschappelijke discipline. Tekstanalyse is anderzijds ook een technologisch proces om via ICT kennis te putten uit documenten, een manier om tekst te valoriseren." . "\u4FE1\u606F\u62BD\u53D6\uFF08Information Extraction\uFF0C\u7C21\u7A31IE\uFF0C\u53C8\u8B6F\u8CC7\u8A0A\u64F7\u53D6\u6280\u8853\uFF09\u4E3B\u8981\u662F\u5F9E\u5927\u91CF\u6587\u5B57\u8CC7\u6599\u4E2D\u81EA\u52D5\u62BD\u53D6\u7279\u5B9A\u8A0A\u606F\uFF08Particular Information\uFF09\uFF0C\u4EE5\u4F5C\u70BA\u8CC7\u6599\u5EAB\u5B58\u53D6\uFF08Database Access\uFF09\u4E4B\u7528\u7684\u6280\u8853\u3002 \u4FE1\u606F\u62BD\u53D6\u7684\u4E00\u500B\u5EE3\u6CDB\u76EE\u6A19\u662F\u5141\u8A31\u5C0D\u4EE5\u5F80\u975E\u7D50\u69CB\u5316\u7684\u8CC7\u6599\u53BB\u505A\u8A08\u7B97\uFF0C\u5177\u9AD4\u4F86\u8AAA\u5C31\u662F\u8981\u5141\u8A31\u908F\u8F2F\u63A8\u7406\u80FD\u5C0D\u8F38\u5165\u8CC7\u6599\u7684\u908F\u8F2F\u5167\u5BB9\u53EF\u4EE5\u8209\u4E00\u53CD\u4E09\u3002\u5176\u610F\u7FA9\u5728\u65BC\u6C7A\u5B9A\u4E86\u4F8B\u5982\u5728\u7DB2\u969B\u7DB2\u8DEF\u4E0A\u5176\u975E\u7D50\u69CB\u5316\uFF08\u4F8B\uFF1A\u4E0D\u5305\u542B\u5143\u6578\u64DA\uFF09\u5F62\u5F0F\u4E2D\u6709\u7528\u8CC7\u8A0A\u6578\u91CF\u7684\u6210\u9577\u3002\u5728\u9019\u65B9\u9762\u7684\u6280\u8853\u4E0A\u662F\u900F\u904E\u8F49\u63DB\u5230\u95DC\u4FC2\u5F62\u5F0F\u6216\u662F\u7D93\u7531XML\u6A19\u7C64\u7684\u6A19\u8A18\u4F86\u9054\u5230\u66F4\u591A\u7684\u53EF\u5B58\u53D6\u6027\u2500\u2500\u4E00\u500B\u667A\u6167\u578B\u4EE3\u7406\u7A0B\u5E8F\uFF0C\u76E3\u7763\u4E00\u65B0\u805E\u8CC7\u6599\u994B\u6D41\uFF0C\u9700\u8981\u8CC7\u8A0A\u64F7\u53D6\u6280\u8853\u4F86\u8F49\u63DB\u975E\u7D50\u69CB\u5316\u8CC7\u6599\u5230\u67D0\u7A2E\u53EF\u63A8\u8AD6\u7684\u65B9\u5F0F\u3002" . . . . "383162"^^ . "Extracci\u00F3n de la informaci\u00F3n" . . "Unter Informationsextraktion (engl. Information Extraction, IE) versteht man die ingenieursm\u00E4\u00DFige Anwendung von Verfahren aus der praktischen Informatik, der k\u00FCnstlichen Intelligenz und der Computerlinguistik auf das Problem der automatischen maschinellen Verarbeitung von unstrukturierter Information mit dem Ziel, Wissen bez\u00FCglich einer im Vorhinein definierten Dom\u00E4ne zu gewinnen. Ein typisches Beispiel ist die Extraktion von Informationen \u00FCber Firmenzusammenschl\u00FCsse (engl. merger events), wobei etwa aus Online-Nachrichten Instanzen der Relation merge(Firma1, Firma2, Datum) extrahiert werden. Der Informationsextraktion kommt eine gro\u00DFe Bedeutung zu, da viele Informationen in unstrukturierter (nicht relational modellierter) Form vorliegen, zum Beispiel im Internet, und dieses Wissen durch Informationsextraktion besser erschlie\u00DFbar wird." . . . . "Unter Informationsextraktion (engl. Information Extraction, IE) versteht man die ingenieursm\u00E4\u00DFige Anwendung von Verfahren aus der praktischen Informatik, der k\u00FCnstlichen Intelligenz und der Computerlinguistik auf das Problem der automatischen maschinellen Verarbeitung von unstrukturierter Information mit dem Ziel, Wissen bez\u00FCglich einer im Vorhinein definierten Dom\u00E4ne zu gewinnen. Ein typisches Beispiel ist die Extraktion von Informationen \u00FCber Firmenzusammenschl\u00FCsse (engl. merger events), wobei etwa aus Online-Nachrichten Instanzen der Relation merge(Firma1, Firma2, Datum) extrahiert werden. Der Informationsextraktion kommt eine gro\u00DFe Bedeutung zu, da viele Informationen in unstrukturierter (nicht relational modellierter) Form vorliegen, zum Beispiel im Internet, und dieses Wissen durch " . . . . "Informationsextraktion" . . . . . .