About: Language model

Powered by OpenLink Virtuoso

Description
Metadata
Settings
- owl:sameAs
- Inference Rule:

About: Language model

An Entity of Type : PhysicalEntity100001930, within Data Space : lodserver.iula.upf.edu
Start faceted browsing from this Type

Attributes	Values
type	yago:PhysicalEntity100001930 yago:Object100002684 yago:YagoLegalActorGeo yago:Worker109632518 yago:Assistant109815790 yago:Model110324560 yago:YagoLegalActor yago:Organism100004475 yago:Person100007846 yago:CausalAgent100007347 yago:LivingThing100004258 yago:Whole100003553 yago:WikicatMarkovModels
label	語言模型 Language model Modelación del lenguaje قالب اللغة 言語モデル Model de llenguatge Модель мови Modèle de langage
comment	Un modelo del lenguaje estadístico asigna una probabilidad a una secuencia de m palabras mediante una distribución de probabilidad. Tener una forma de estimar la verosimilitud de diferentes frases es útil en muchas aplicaciones de procesamiento de lenguaje natural. Modelación del lenguaje se utiliza en el reconocimiento de voz, traducción automática, , análisis, reconocimiento de escritura, y otras aplicaciones. 言語モデルとは、単語列に対する確率分布である。長さmの単語列が与えられたとき、単語列全体に対しての確率を与える。言語モデルを用いると異なるフレーズに対して相対的な尤度を求めることができるため、自然言語処理の分野で広く使われている。言語モデルは音声認識、機械翻訳、、構文解析、手書き文字認識、情報検索などに利用されている。 En traitement automatique des langues, un modèle de langage est un modèle statistique qui modélise la distribution de séquences de mots, plus généralement de séquences de symboles discrets (lettres, phonèmes, mots), dans une langue naturelle. Un modèle de langage peut par exemple prédire le mot suivant une séquence de mots. BERT et GPT-3 sont des modèles de langage. remet en cause la pertinence des énormes modèles de langage préentrainés. قوالب اللغات هي قوالب إحصائية تقوم بتعيين قيمة محتملة لكل سلسلة من الكلمات عن طريق التوزيع الاحتمالي. تستخدم قوالب اللغات في العديد من تطبيقات معالجة اللغة الطبيعية مثل التعرف على الكلام، الترجمة الآلية، وتحليل واسترجاع المعلومات. Статистична моде́ль мо́ви (англ. language model) — це розподіл імовірності над послідовностями слів. Заданій такій послідовності, скажімо, довжини m, вона призначує ймовірність усієї цієї послідовності. Модель мови забезпечує контекст для розрізнювання слів та фраз, які звучать схоже. Наприклад, в американській англійській фрази «recognize speech» (розпізнавати мовлення) та «wreck a nice beach» (вбити гарний пляж) звучать схоже, але означають різні речі. En processament de llenguatge natural (PLN), anomenem model de llenguatge al model probabilístic P(e) que assigna a cada possible frase "e" la probabilitat que pertanyi a una determinada llengua. Per exemple, si tenim un model de llenguatge del català, ens donaria la probabilitat que la frase "Són les dues de la matinada" sigui una frase en català. Aquests models poden ser útils en diverses tasques del PLN, com el reconeixement de la parla, la desambiguació lèxica, traducció automàtica, etc. 統計式的語言模型是一個機率分佈，给定一个长度为的字詞所組成的字串，派機率給字串：。语言模型提供上下文来区分听起来相似的单词和短语。例如，短语“再给我两份葱，让我把记忆煎成饼”和“再给我两分钟，让我把记忆结成冰”听起来相似，但意思不同。語言模型經常使用在許多自然語言處理方面的應用，如語音識別，機器翻譯，詞性標註，句法分析，手写体识别和資訊檢索。由於字詞與句子都是任意組合的長度，因此在訓練過的語言模型中會出現未曾出現的字串(資料稀疏的問題)，也使得在語料庫中估算字串的機率變得很困難，這也是要使用近似的平滑n-元語法(N-gram)模型之原因。在語音辨識和在資料壓縮的領域中，這種模式試圖捕捉語言的特性，並預測在語音串列中的下一個字。在语音识别中，声音与单词序列相匹配。当来自语言模型的证据与发音模型和声学模型相结合时，歧义更容易解决。當用於資訊檢索，語言模型是與文件有關的集合。以查詢字「Q」作為輸入，依據機率將文件作排序，而該機率代表該文件的語言模型所產生的語句之機率。
owl:sameAs	dbpedia:Language_modelling dbpedia:Language_model fbase:m.065lv0 dbpedia:Language_models dbpedia:Language_modeling dbpedia:Statistical_Language_Model dbpedia:Statistical_language_modeling http://dbpedialite.org/things/1911810#id http://dbpedialite.org/things/1911840#id http://dbpedialite.org/things/4443375#id http://dbpedialite.org/things/4443384#id http://dbpedialite.org/things/13699797#id http://dbpedialite.org/things/25634340#id fbase:en.language_model fbase:guid.9202a8c04000641f800000000062cb40 http://yago-knowledge.org/resource/Language_model http://ca.dbpedia.org/resource/Model_de_llenguatge http://www.wikidata.org/entity/Q3621696 dbpedia:Unigram_model http://es.dbpedia.org/resource/Modelación_del_lenguaje http://bg.dbpedia.org/resource/\u0415\u0437\u0438\u043A\u043E\u0432_\u043C\u043E\u0434\u0435\u043B http://nn.dbpedia.org/resource/Spr\u00E5kmodell http://zh.dbpedia.org/resource/\u8A9E\u8A00\u6A21\u578B http://ja.dbpedia.org/resource/言語モデル http://ar.dbpedia.org/resource/قالب_اللغة http://fa.dbpedia.org/resource/مدل_زبانی http://uk.dbpedia.org/resource/Модель_мови http://fi.dbpedia.org/resource/Kielimalli http://fr.dbpedia.org/resource/Modèle_de_langage http://zh.dbpedia.org/resource/語言模型 http://nn.dbpedia.org/resource/Språkmodell https://global.dbpedia.org/id/3LhpA http://bg.dbpedia.org/resource/Езиков_модел
Subject	category:Statistical_natural_language_processing category:Markov_models category:Language_modeling
is primary topic of	http://en.wikipedia.org/wiki/Language_model
depiction
Link from a Wikipage to an external page	http://www.phontron.com/kylm http://kheafield.com/code/kenlm http://www.keithv.com/software/csr/ http://sifaka.cs.uiuc.edu/~ylv2/pub/plm/plm.htm http://nlg.isi.edu/software/nplm https://web.archive.org/web/20190112092141/http:/www-lium.univ-lemans.fr/cslm/ http://www.speech.sri.com/projects/srilm/ http://www.opengrm.org/twiki/bin/view/GRM/NGramLibrary https://web.archive.org/web/20140425033736/http:/rnnlm.org/ https://blog.openai.com/language-unsupervised/ https://vsiivola.github.io/variKN
έχει περίληψη	言語モデルとは、単語列に対する確率分布である。長さmの単語列が与えられたとき、単語列全体に対しての確率を与える。言語モデルを用いると異なるフレーズに対して相対的な尤度を求めることができるため、自然言語処理の分野で広く使われている。言語モデルは音声認識、機械翻訳、、構文解析、手書き文字認識、情報検索などに利用されている。 En traitement automatique des langues, un modèle de langage est un modèle statistique qui modélise la distribution de séquences de mots, plus généralement de séquences de symboles discrets (lettres, phonèmes, mots), dans une langue naturelle. Un modèle de langage peut par exemple prédire le mot suivant une séquence de mots. BERT et GPT-3 sont des modèles de langage. remet en cause la pertinence des énormes modèles de langage préentrainés. قوالب اللغات هي قوالب إحصائية تقوم بتعيين قيمة محتملة لكل سلسلة من الكلمات عن طريق التوزيع الاحتمالي. تستخدم قوالب اللغات في العديد من تطبيقات معالجة اللغة الطبيعية مثل التعرف على الكلام، الترجمة الآلية، وتحليل واسترجاع المعلومات. En processament de llenguatge natural (PLN), anomenem model de llenguatge al model probabilístic P(e) que assigna a cada possible frase "e" la probabilitat que pertanyi a una determinada llengua. Per exemple, si tenim un model de llenguatge del català, ens donaria la probabilitat que la frase "Són les dues de la matinada" sigui una frase en català. Aquests models poden ser útils en diverses tasques del PLN, com el reconeixement de la parla, la desambiguació lèxica, traducció automàtica, etc. 統計式的語言模型是一個機率分佈，给定一个长度为的字詞所組成的字串，派機率給字串：。语言模型提供上下文来区分听起来相似的单词和短语。例如，短语“再给我两份葱，让我把记忆煎成饼”和“再给我两分钟，让我把记忆结成冰”听起来相似，但意思不同。語言模型經常使用在許多自然語言處理方面的應用，如語音識別，機器翻譯，詞性標註，句法分析，手写体识别和資訊檢索。由於字詞與句子都是任意組合的長度，因此在訓練過的語言模型中會出現未曾出現的字串(資料稀疏的問題)，也使得在語料庫中估算字串的機率變得很困難，這也是要使用近似的平滑n-元語法(N-gram)模型之原因。在語音辨識和在資料壓縮的領域中，這種模式試圖捕捉語言的特性，並預測在語音串列中的下一個字。在语音识别中，声音与单词序列相匹配。当来自语言模型的证据与发音模型和声学模型相结合时，歧义更容易解决。當用於資訊檢索，語言模型是與文件有關的集合。以查詢字「Q」作為輸入，依據機率將文件作排序，而該機率代表該文件的語言模型所產生的語句之機率。 Un modelo del lenguaje estadístico asigna una probabilidad a una secuencia de m palabras mediante una distribución de probabilidad. Tener una forma de estimar la verosimilitud de diferentes frases es útil en muchas aplicaciones de procesamiento de lenguaje natural. Modelación del lenguaje se utiliza en el reconocimiento de voz, traducción automática, , análisis, reconocimiento de escritura, y otras aplicaciones. En el reconocimiento de voz, la computadora intenta hacer coincidir los sonidos con secuencias de palabras. El modelo del lenguaje proporciona un contexto para distinguir entre las palabras y frases que suenan similares. Por ejemplo, en , las frases "recognize speech " y " wreck a nice beach " se pronuncian de forma similar pero significan cosas muy diferentes. Estas ambigüedades son más fáciles de resolver cuando se incorpora la evidencia del modelo del lenguaje con el modelo de pronunciación y el modelo acústico. Los modelos del lenguaje se utilizan en la recuperación de información en el . Aquí un modelo del lenguaje está asociado con cada documento en una colección. Los documentos se clasifican sobre la base de la probabilidad de la consulta en el modelo del lenguaje del documento . Comúnmente, el modelo del lenguaje se utiliza para este propósito—además conocido como el . La escasez de datos es un problema importante en la construcción de modelos de lenguaje. La mayoría de las posibles secuencias de palabras no serán observadas en el entrenamiento. Una solución es hacer la hipótesis de que la probabilidad de una palabra sólo depende de las palabras anteriores. Esto se conoce como un modelo de N-grama o modelo unigrama cuando . Статистична моде́ль мо́ви (англ. language model) — це розподіл імовірності над послідовностями слів. Заданій такій послідовності, скажімо, довжини m, вона призначує ймовірність усієї цієї послідовності. Модель мови забезпечує контекст для розрізнювання слів та фраз, які звучать схоже. Наприклад, в американській англійській фрази «recognize speech» (розпізнавати мовлення) та «wreck a nice beach» (вбити гарний пляж) звучать схоже, але означають різні речі. У побудові моделей мов основною проблемою є розрідженість даних. Більшість можливих послідовностей слів під час тренування не спостерігаються. Одним з розв'язків цієї проблеми є припустити, що ймовірність слова залежить лише від попередніх n слів. Це є відомим як n-грамна модель, або уніграмна модель, коли n = 1. Уніграмна модель є також відомою як модель «торба слів». Оцінювання відносної правдоподібності різних фраз є корисним у багатьох застосуваннях обробки природної мови, особливо в тих, що породжують текст як вихід. Моделювання мов використовують у розпізнаванні мовлення, машиннім перекладі, розмічуванні частин мови, синтаксичнім аналізі, оптичнім розпізнаванні символів, розпізнаванні рукописного введення, інформаційнім пошуку та інших застосуваннях. У розпізнаванні мовлення звуки зіставляють з послідовностями слів. Неоднозначності розв'язувати легше, коли свідчення від моделі мови поєднують з моделлю вимови та . Моделі мови використовують в інформаційнім пошуку в . Там окрему модель мови пов'язують з кожним документом сукупності. Документи ранжують на основі ймовірності запиту Q в моделі мови документа : . Для цього зазвичай використовують модель.
wasDerivedFrom	http://en.wikipedia.org/wiki/Language_model?oldid=1035600729&ns=0
Wikipage page ID	1911810(xsd:integer)
Wikipage revision ID	1035600729(xsd:integer)
Link from a Wikipage to another Wikipage	dbpedia:Parsing dbpedia:Information_retrieval dbpedia:Machine_translation dbpedia:Part-of-speech_tagging dbpedia:Natural_language_processing dbpedia:Treebank dbpedia:Speech_recognition category:Statistical_natural_language_processing category:Markov_models category:Language_modeling dbpedia:N-gram dbpedia:Markov_property dbpedia:Exponential_growth

Alternative Linked Data Views: Sponger | iSPARQL | ODE Raw Data in: CXML | CSV | RDF ( N-Triples N3/Turtle JSON XML ) | OData ( Atom JSON ) About

This material is Open Knowledge

W3C Semantic Web Technology

[RDF Data]

This material is Open Knowledge

Creative Commons License

Valid XHTML + RDFa

This work is licensed under a Creative Commons Attribution-Share Alike 3.0 Unported License.
OpenLink Virtuoso version 06.01.3127, on Linux (x86_64-pc-linux-gnu), Standard Edition
Copyright © 2009-2011 OpenLink Software