Кросс-энтропия (Перекрестная энтропия) (Cross-entropy) – это функция потерь (Loss Function), которую можно использовать для количественной оценки разницы между двумя распределениями вероятностей. [37]
Курирование данных (Data Curation) – это процессы, связанные с организацией и управлением данными, которые собираются из различных источников.
«Л»
Ленивое обучение (Lazy learning) в искусственном интеллекте – это метод обучения, при котором обобщение данных обучения откладывается до тех пор, пока в систему не будет сделан запрос, в отличие от активного обучения, когда система пытается обобщить данные обучения до получения запросов. Этот тип обучения также известен как обучение на основе экземпляров. Ленивые классификаторы очень полезны при работе с большими наборами данных, которые имеют несколько атрибутов.
Лингвистическая аннотация (Linguistic annotation) – также известная как текстовая аннотация корпуса, – это маркировка языковых данных в текстовой или устной форме. Лингвистическая аннотация направлена на выявление и пометку грамматических, фонетических и семантических лингвистических элементов в тексте или аудиозаписи.
Линейная регрессия (Linear regression) – это метод моделирования, который помогает в построении отношений между зависимой скалярной переменной и одной или несколькими независимыми переменными. Они также известны как переменная результата и предикторная переменная. Хотя линейная регрессия уходит своими корнями в статистику, она также является важным инструментом машинного обучения для таких задач, как прогнозное моделирование. Линейная регрессия пытается смоделировать взаимосвязь между двумя переменными, подгоняя линейное уравнение к наблюдаемым данным.
Лисп (LISt Processing – «обработка списков») – это семейство языков программирования, основанных на представлении программы системой линейных списков символов, которые притом являются основной структурой данных языка. Лисп считается вторым после Fortran старейшим высокоуровневым языком программирования. [38]
Личная информация (Personally Identifiable Information) – это любая часть информации, которая может использоваться сама по себе или в сочетании с какой-либо другой информацией для идентификации конкретного человека.
Ловушка NaN (NaN trap) – это элемент числового типа данных, который можно интерпретировать как неопределенное или непредставимое значение, особенно в арифметике с плавающей запятой. Когда одно число в вашей модели становится NaN во время обучения, что приводит к тому, что многие или все другие числа в вашей модели в конечном тоже итоге становятся NaN. [39]
Логарифм отношения шансов (Log-odds) – это логарифм отношения вероятностей наступления и не наступления события. Log-odds – это краткий способ обозначения взятия натурального логарифма из шансов. Когда вы берете натуральный логарифм чего-то, вы в основном делаете его более нормально распределенным. Когда мы делаем что-то более нормально распределенное, мы ставим его в таком масштабе, с которым очень легко работать.
Логика описания (Description logic) – это семейство формальных языков представления знаний. DL используются в искусственном интеллекте для описания и обоснования соответствующих концепций предметной области (известных как терминологические знания). Это особенно важно для обеспечения логического формализма для онтологий и Semantic Web: Web Ontology Language (OWL). Наибольшее применение DL и OWL находит в биомедицинской информатике, где DL помогает в кодификации биомедицинских знаний.
Логика первого порядка (также известная как исчисление предикатов первого порядка и логика предикатов) (First-order logic)