| - Параллельный текст (битекст) — текст на одном языке вместе с его переводом на другой язык. «Выравнивание параллельного текста» — это идентификация соответствующих друг другу предложений в обеих половинах параллельного текста.Большие собрания параллельных текстов называются «параллельным корпусом» (англ. parallel corpora). Выравнивание параллельного корпуса на уровне предложений является необходимой предпосылкой для различных аспектов лингвистических исследований. В процессе перевода предложения могут разделяться, сливаться, удаляться, вставляться или менять последовательность. В связи с этим выравнивание часто становится сложной задачей.
- Un concordancier multilingue est un outil informatique permettant de gérer des corpus parallèles. Par métonymie, le concordancier multilingue désigne aussi ces corpus. Un corpus parallèle est un ensemble de groupes de textes tels que, deux à deux, dans chaque groupe, ces textes sont des traductions mutuelles. L'Acquis communautaire européen est un exemple où chaque groupe comporte un texte, pour chacune des Langues officielles de l'Union européenne. L'ensemble des groupes désignant les lois régissant la communauté européenne.
- Tekst równoległy (dwu- bądź wielojęzyczny) to tekst składający się z zestawionych obok siebie tekstów w co najmniej dwóch językach. Najczęściej jeden z tekstów jest oryginałem, a pozostałe jego tłumaczeniami, choć niekiedy nie da się już określić, który tekst był opracowany jako pierwotny, gdyż wszystkie były opracowywane równolegle i wzajemnie do siebie dostosowywane.
- A parallel text is a text placed alongside its translation or translations. Parallel text alignment is the identification of the corresponding sentences in both halves of the parallel text. The Loeb Classical Library and the Clay Sanskrit Library are two examples of dual-language series of texts. Reference Bibles may contain the original languages and a translation, or several translations by themselves, for ease of comparison and study; Origen's Hexapla (Greek for "sixfold") placed six versions of the Old Testament side by side. The most famous example is the Rosetta Stone.
- 平行文本(parallel text)是与译文并行放置的文本。平行文本对齐 是指确定平行文本中原文和译文的对应句子。洛布古典丛书和克莱梵语丛书就是双语文本的两个例子。圣经参考书中可能会同时包含原文和译文或者多种译文,以便于比较和研究;俄利根的《圣经六国译文合璧》为旧约并排提供了六个版本。另外还要注意的一个最著名例子是罗塞塔石碑。 平行文本的大集合被称为平行语料库 (见语料库)。在句子层面对齐平行语料库是很多语言学研究领域的前提条件。在翻译过程中,翻译人员可以对句子进行拆分、合并、删除、插入或重新排列。这使得对齐任务变得异常重要。
- El corpus paralelo es un recurso lingüístico consistente en textos de dos lenguas (en algún formato electrónico adecuado) que están alineados a cierto nivel de granularidad; generalmente a nivel de párrafo, aunque también a nivel de sección, página o incluso a veces de palabra. Se usa en traducción automática y, principalmente, en memorias de traducción y para el desarrollo de sistemas de traducción estadística.
έχει περίληψη
| - Параллельный текст (битекст) — текст на одном языке вместе с его переводом на другой язык. «Выравнивание параллельного текста» — это идентификация соответствующих друг другу предложений в обеих половинах параллельного текста.Большие собрания параллельных текстов называются «параллельным корпусом» (англ. parallel corpora). Выравнивание параллельного корпуса на уровне предложений является необходимой предпосылкой для различных аспектов лингвистических исследований. В процессе перевода предложения могут разделяться, сливаться, удаляться, вставляться или менять последовательность. В связи с этим выравнивание часто становится сложной задачей.
- 平行文本(parallel text)是与译文并行放置的文本。平行文本对齐 是指确定平行文本中原文和译文的对应句子。洛布古典丛书和克莱梵语丛书就是双语文本的两个例子。圣经参考书中可能会同时包含原文和译文或者多种译文,以便于比较和研究;俄利根的《圣经六国译文合璧》为旧约并排提供了六个版本。另外还要注意的一个最著名例子是罗塞塔石碑。 平行文本的大集合被称为平行语料库 (见语料库)。在句子层面对齐平行语料库是很多语言学研究领域的前提条件。在翻译过程中,翻译人员可以对句子进行拆分、合并、删除、插入或重新排列。这使得对齐任务变得异常重要。
- El corpus paralelo es un recurso lingüístico consistente en textos de dos lenguas (en algún formato electrónico adecuado) que están alineados a cierto nivel de granularidad; generalmente a nivel de párrafo, aunque también a nivel de sección, página o incluso a veces de palabra. Se usa en traducción automática y, principalmente, en memorias de traducción y para el desarrollo de sistemas de traducción estadística.
- Un concordancier multilingue est un outil informatique permettant de gérer des corpus parallèles. Par métonymie, le concordancier multilingue désigne aussi ces corpus. Un corpus parallèle est un ensemble de groupes de textes tels que, deux à deux, dans chaque groupe, ces textes sont des traductions mutuelles. L'Acquis communautaire européen est un exemple où chaque groupe comporte un texte, pour chacune des Langues officielles de l'Union européenne. L'ensemble des groupes désignant les lois régissant la communauté européenne. De nombreux corpus sont bilingues. Le corpus de l'Hansard du parlement canadien (anglais↔français) en est un exemple connu car il fut l'un des premiers à être numérisé et mis à disposition des chercheurs en linguistique. Dans ces cas, les outils sont des concordanciers bilingues. Depuis ces corpus sont plus nombreux et accessibles (voir la liste des liens externes). Leur origine est:
* l'obligation de publier dans un certain nombre de langues officielles pour les organisations internationales
* les États ayant plusieurs langues officielles
* les publications de journaux dans plusieurs langues
* la traduction des livres
* la documentation des logiciels les corpus parallèles numérisés sont une source importante pour tous les outils de traductique. À partir de ces corpus :
* On peut exploiter directement les documents, en recherchant un mot ou une expression et afficher son occurrence dans le texte source et aligner le texte cible sur le même passage. L'avantage est de montrer l'expression dans son contexte complet.
* en segmentant les phrases des documents et en alignant les phrases, on peut produire une mémoire de traduction ou des corpus d'entrainement pour la traduction automatique
* en analysant les cooccurrences des termes dans les documents entre les différentes langues et ainsi construire un lexique multilingue.
- A parallel text is a text placed alongside its translation or translations. Parallel text alignment is the identification of the corresponding sentences in both halves of the parallel text. The Loeb Classical Library and the Clay Sanskrit Library are two examples of dual-language series of texts. Reference Bibles may contain the original languages and a translation, or several translations by themselves, for ease of comparison and study; Origen's Hexapla (Greek for "sixfold") placed six versions of the Old Testament side by side. The most famous example is the Rosetta Stone. Large collections of parallel texts are called parallel corpora (see text corpus). Alignments of parallel corpora at sentence level are prerequisite for many areas of linguistic research. During translation, sentences can be split, merged, deleted, inserted or reordered by the translator. This makes alignment a non-trivial task.
- Tekst równoległy (dwu- bądź wielojęzyczny) to tekst składający się z zestawionych obok siebie tekstów w co najmniej dwóch językach. Najczęściej jeden z tekstów jest oryginałem, a pozostałe jego tłumaczeniami, choć niekiedy nie da się już określić, który tekst był opracowany jako pierwotny, gdyż wszystkie były opracowywane równolegle i wzajemnie do siebie dostosowywane. Dopasowanie tekstów równoległych polega na określaniu odpowiadających sobie zdań w poszczególnych językach. Przykładami tekstów równoległych mogą być Biblioteka klasyczna opracowana przez Loeba czy Biblioteka sanskrycka Claya, ale również takie teksty jak wielojęzyczna instrukcja obsługi lub strona internetowa oraz niektóre wydania tłumaczeń Biblii zawierające tekst w językach oryginalnych zestawiony z tłumaczeniem na przykład na polski, lub też po prostu kilka różnych tłumaczeń zestawionych w celu łatwiejszego porównania. Jednym z najwcześniejszych przykładów takiej poligloty czyli "wielojęzycznej Biblii" jest opracowana przez Orygenesa Hexapla, w której zestawił on w równoległych kolumnach sześć wersji Starego Testamentu. Inny słynnym przykładem tekstu równoległego jest Kamień z Rosetty. Teksty równoległe w znaczeniu ogólnym rozumieć można również jako różne teksty o bardzo zbliżonej tematyce, lub formie, których zestawienie na poziomie zdań nie jest możliwe, jednak mimo to ich porównanie może być użyteczne dla językoznawcy, terminologa lub tłumacza. Dobrym przykładem są tu wielojęzyczne hasła Wikipedii, które zawierają podobne informacje w różnych językach. Nawet jeśli początkowo są to tłumaczenia haseł z innego języka, to uzupełniane i rozbudowywane są niezależnie w ramach danej wspólnoty językowej i najczęściej funkcjonują zupełnie niezależnie od siebie. Większe zasoby tekstów równoległych określane są mianem korpusów równoległych (zob. korpus). Dopasowanie korpusów równoległych na poziomie zdań jest niezbędnym warunkiem do prowadzenia badań w wielu dziedzinach językoznawstwa. Należy jednak pamiętać, że dopasowanie poszczególnych segmentów tłumaczenia nie zawsze jest proste, gdyż poszczególne zdania oryginału mogą być przez tłumacza podzielone, złączone, usunięte, przesunięte w inne miejsce lub zastąpione zupełnie nowym elementem.