Лингвистика - топик

Билет 1

1. Сущность прикладной лингвистики как особого подхода к языковым явлениям. Характерные черты прикладных методик.

В языкознании всегда присутствовали три глобальных исследовательских направления:

· теоретическое (объяснение языковых систем и процессов)

· описательное (конкретное описание языковых явлений)

· прикладное (совершенствование языковой системы).

В рамках последнего направления сформировалась научная дисциплина, которая получила название прикладной лингвистики. Ее отличает подход к языку как к деятельности, а не мертвому продукту.

Прикладная лингвистика

· это комплексная научная дисциплина, изучающая язык в различных ситуациях его применения и разрабатывающая методы совершенствования языковых систем и языковых процессов.

· учение о методах решения разнообразных практических задач с использованием знаний о языке

· учение о совершенствовании языковой способности человека и общества в целом.

Термин прикладная лингвистика появился в конце 20 гг. 20 в., когда была осознана необходимость строгого научного решения прикладных задач с использованием методов формального лингвистического анализа письменных и акустико-лингвистического анализа устных сообщений.

За рубежом под ПЛ часто понимают совершенствование методов преподавания языка (дидактическая лингвистика). В нашей стране ПЛ понимают как компьютерную лингвистику, которая становится сейчас все более широкой дисциплиной почти синонимом ПЛ.

Синонимы ПЛ: компьютерная Л, структурная Л, машинная Л, статистическая Л, математическая Л, искусственный интеллект (ИИ), ...

ПЛ требует строгого структурного подхода к языку и отводит важную роль математике.

Основные задачи ПЛ:

· автоматическое распознавание и синтез речи

· автоматические методы переработки текстовой информации

· создание автоматизированных систем информационного поиска

· составление автоматических словарей и систем машинного перевода

· разработка методов автоматического аннотирования, реферирования и перевода

· разработка экспертных систем

· лингвистическое обеспечение АСУ

· стандартизация научно-технической терминологии

Прикладные модели отличаются определенным упрощением, огрублением языковой реальности, но это не значит , что они игнорируют реальную сложность моделируемого объекта. Методология прикладного исследования должна учитывать многоаспектность, многоуровневость, открытость языкового механизма.

Методология - совокупность общих принципов, определяющая способ исследования какого-либо явления; определяет взгляд на объект, как к нему подойти; философские принципы исследования явлений.

Метод - определенный тип способа исследования, определяемый инструментами, которые используются при изучении объекта исследования (метод компьютерного моделирования, статистический метод)

Собственно лингвистические методы:

· дистрибутивный метод

· трансформационный метод

· метод компонентного анализа

· метод различительных признаков

Методика - конкретный способ исследования, определяемый целью исследования; может объединять несколько методов (методика построения ассоциативных тезаурусов).

Характерные черты прикладных методик

· ведущая роль метода моделирования

· экспериментальный характер прикладных методик

· применение точного метаязыка

· формализованность самих операций исследования (хотя результат может быть приближенным)

· использование искусственного метаязыка описания

· комплексное сочетание разных наук

2. Автоматизированные переводные словари. Принципы построения.

АС - это словарь, который при переводе некоторые операции делает за человека. Компьютерный словарь - аналог бумажного на магнитных носителях. АС = ТБД с общеупотребительной лексикой. EURODICAUTOM (11, 1.200.000 ЛЕ), LEXIS (8, 1.500.000 ЛЕ).

Отличительные свойства АС:

многоязычие

· обратимость ( полная: всякая ЛЕ может выступать в роли входной при запросе и выходной при ответе; частичная: наличие индекса)

· гибкость (удобное, упрощенное обращение к словарю: несколько входов в словарь)

· динамичность (постоянное пополнение словарного состава; оперативность редактирования)

· состав (структура) словаря:

макроструктура - структура словаря:

микроструктура - структура словарной статьи

основная единица словаря

· слово (композиционно)

· словосочетание (статистически); 80% обращений к словарю - СС; причина -уклон в терминологию

3 главных компонента АС:

· блок обработки запроса (блок лемматизации - сведения текстовых форм к их словарным (каноническим) форме)

· блок лексических массивов (в АС ЛЕ могут храниться и в виде основ, и виде словоформ)

(· блок морфологического анализа) (иногда)

· блок выдачи ответа (ПЭ; главная задача - варьирование ответа в зависимости от пожеланий пользователя)

Желательно также, чтобы АС обладал:

· блоком лемматизации

· алгоритмом обработки некорректных запросов

· алгоритмом словообразовательного анализа)

АС не СМП, он берет на себя только работу с лексемой, оставляя человеку проблему выбора ПЭ и синтеза текста. На вход АПС поступают отдельные слова и СС, с помощью анализа которых можно получить сведения о грамм. классе слова и его грамм. форме. решить на основании этой информации проблемы омонимии и многозначность, определить синтас. функцию ПЭ в тексте невозможно, поэтому разработчики АПС таких задач перед собой и не ставят. Тем не менее индекс тематической принадлежности в какой-то мере разрешает многозначность лексики.

Словарная статья:

Ее структура и наполнение определяется назначением словаря.

Структура словарной статьи (13 зон):

1. Заголовок - основа, СС (больше всех по количеству), морфема, фрагменты текста

2.Зона лексического грамматического класса - ЛЕ по частям речи, далее - категоризация.

3. Зона морфологической информации

4. Рубрика подрубрика стиль (вся информация - в виде цифровых кодов)

5. Зона индекса надежности отражает степень общепринятости данного ПЭ:

А - официальный стандарт

Б - уважаемые словари

В - тетради новых терминов

Г - плавающие

6. Зона ПЭ (при нескольких ПЭ - у каждого свой номер)

7. Зона пояснительных помет - уточнение значения данной ЛЕ

· семантические

· лексические

· синтаксические (обязат. управление)

8. Зона толкований (для многозначных слов и новых терминов)

9. Зона примеров употребления выполняет две функции:

· иллюстративную

· смыслоразличительную

10. Зона фразеологии.

11. Составитель словарной статьи

12. Источник составления словарной статьи -> необязательные

13. Дата составления словарной статьи

Билет 7

1. Лексикография как прикладная дисциплина. Внутренняя и внешняя типология словарей.

Лексикография - прикладная лингвистическая дисциплина, занимающаяся практикой и теорией составления словарей.

Словарь - способ организации и представления знаний. Чем полнее и адекватнее в словаре представлены знания, тем лучше словарь выполняет свою функцию.

Лексикография как научная дисциплина носит комплексный характер, но определяющей чертой лексикографии является ее прикладная направленность. Все многообразие различных типов словарей (нормативные, учебные, переводные, терминологические, идеологические, этимологические ... ) получает практическую ориентацию исходя из целевой установки словаря.

Лексикография разрабатывает оптимальные средства выявления и фиксации семантических фактов определенных практических целях. Главная проблема в разработке оптимальной стратегии новых словарей - проблема обоснованности словарей как с точки зрения их состава, так и в плане адекватности подаваемой в них информации. Лексикография в широком смысле охватывает все множество инвентарей языковых единиц с приписанной им информацией того или иного рода. Наиболее богата и сложна для отражения семантическая информация.

Лексикографическая деятельность распадается на ряд этапов:

1. разработка системы требований, касающихся внешних параметров словаря (назначения, круга пользователей, инф. области ...)

2. разработка системы требований, касающихся внутренней параметров словаря (единиц описания, основных свойств метаязыка. объема, структуры, видов словарной информации ...)

3. формальная инвентаризация выбранных подъязыков (отбор текстов, расписывание контекстов, характеристика грамм. форм, составление предварительных словников ...)

4. экспериментальные исследования семантики описываемых единиц (дистрибутивный анализ текстов, тесты с носителями языка ...)

5. обобщение экспериментальных данных

6. построение дефиниций на соответствующем метаязыке и их проверка в ходе новых экспериментов

7. сбор и систематизация дополнительной информации о каждой языковой единице

8. оформление словарных статей

9. системный анализ и упорядочение словарных статей

10. оформление словаря в целом, включая вспомогательные указатели.

Аспекты лексикографии:

· историко-филологический - изучение истории словарей как части истории культуры общества

· гносеологический (когнитивный) - изучение словарей как сокровищниц знаний. накопленных обществом

· семантико-лексикологический - использование словарей для лексико-семантического описания языка

· прикладной (самый важный) - прикладная лексикография направлена на совершенствование словарей с точки зрения тех или иных практических требований к словарям

Виды информации подаваемой в словаре определяют внутреннюю типологию словарей:

I. Объекты описания:

1) формальные/ семантические

2) природа объектов (лекс.-семантический или морфо-семантический уровень; в парадигматическом или в синтагматическом аспекте)

3) статус объекта (является ли словарь нормативным или описательным)

4) хронологический период

5) по сфере общения (подъязык)

6) степень охвата языка

II. Системные свойства

1) какая грамматическая информация дается об описываемых единицах?

2) какие стилистические пометы используются?

3) какой тип определения (дефиниции) дается?

4) включается ли экстралингвистическая информация?

5) в какой мере учитываются семантические отношения?

6) объясняется ли мотивированность описываемой единицы?

III. Актуализация в языковой жизни

1) указывается ли происхождение единиц?

2) указывается ли активность единицы в языковой жизни (частотность)?

3) показывается ли реализация единиц в контексте

IY. Прагматика пользователя

1) количество входов в словарь

2) каков порядок расположения единиц в словаре (по формальному или семантическому признаку?

3) имеются ли в словаре указатели?

4) даются ли металингвитсические сведения (история изучения, разные трактовки)?

Y. Связь с другими языками

1) производится ли генетическое сопоставление единиц и их значений с родственными языками?

2) производится ли типологическое сопоставление материала неродственных языков?

Цели словаря задают внешнюю (функциональную) типологию словарей:

Типы словарей	Цель
учебные словари	обучение
переводные словари	перевод
нормативные словари	нормирование
терминологические словари	систематизация, уточнение научных понятий

Типология словарей по Ожегову:

· большой (представляет совр. русский язык в широкой ист. перспективе)

· средний (с детальной разработкой исторически оправданного стилистического многообразия лит. РЯ)

· краткий (популярного типа, стремящийся к активной нормализации совр. лит. речи)

Типология словарей по Щербе:

· словарь-справочник - словарь академического типа

· энциклопедический - общий словарь

· тезаурус - обычный толковый или переводной словарь

· обычный толковый или переводной словарь - идеологический словарь

· толковый словарь - переводной словарь

2. Автоматизированные информационно-поисковые системы: их структуры, функции, критерии оценки. Информационные языки.

АИПС предназначены для инф. обслуживания пользователей информации в заданной тематической области.

2 основные задачи АИПС:

· хранение информации

· поиск и выдача информации

Из сведений о ТО. поступающих на хранение в систему формируется информационный массив (ИМ). От потребителя поступают запросы, и система ищет сведения в ИМ, Соответствующие данному запросу. Всякая поисковая операция в системе сводится к сравнению поступившего запроса с имеющимися в системе сведениями. в современных ИПС все это происходит автоматически. Для этого и запрос и сведения должны быть представлены на таком языке, который обладает смысловой однозначностью - ИПЯ.

Индексирование - перевод содержания текста, хранящегося в ИМ на ИПЯ. в результате индексирования образуется поисковый образ, у документа - ПОД, у запроса - ПОЗ.

Критерий смыслового соответствия - мера соответствия между содержанием запроса и документа, достаточная для признания данного документа релевантным данному запросу. Вводится совокупность признаков, на основании которых устанавливается степень необходимого и достаточного соответствия между поисковым предписанием и поисковым образом документа, выраженными на одном и том же ИПЯ.

Результатом поисковой операции является выборка релевантных ПОДов.

Абстрактная ИПС - некий логико-семантический аппарат, состоящий из ИПС, правил индексирования и критерия выдачи.

В зависимости от характера сведений и запроса различаются документальная и фактографическая ИПС. Фактографическая ИПС не хранит документы, а только факты. Документальная хранит документы. Но существует прием, позволяющий в процессе поиска определенного документа извлекать факт: В документальной системе хранится информация о содержании документа + документографическая информация (автор, год ...)

выделение нужной пользователю информации осложняется двумя обстоятельствами:

· несоответствие между формулировкой запроса и реальной информацией нужной потребителю

· перевод запроса в ПОЗ

Мера соответствия документа информационной потребности называется пертенетностью.

Соответствие документа запросу называется релевантностью:

· смысловая (соответствие запроса поисковому предписанию) - просто релевантность, зависит от ИПЯ (его семантической силы, глубины индексирования, совершенства логико-сем. аппарата)

· формальная (соответствие документа поисковому предписанию)

ИПЯ - специализированный ИЯ, предназначенный для эксплицитной записи содержания документов и запросов в форме, удобной для автоматического поиска.

Классификация ИПЯ:

предкоординированные ИПЯ

присутствует заранее заданная классификационная схема

посткоординируемые ИПЯ

отсутствует заранее заданная классификационная схема

Типы классификаций

иерархическая

задает дерево знаний, например всей литературы по лингвистике

алфавитно-предметная

например, телефонный справочник

фасетная

опирается на разные аспекты описания, задается так называемая фасетная формула (Ж1 Ц2 Ф1), представляющая собой шаблон, рассматривается класс, аспект предмета

Фасетная классификация: фильмы:

жанр

цвет

формат

Ж1

Ж2

Ц1 цветной

Ц2 черно-белый

Ф1 широкоформатный

фасетная формула: Ж1 Ц2 Ф1

Общие недостатки предкоординированных ИПЯ:

· не позволяют вести поиск по заранее непредусмотренному сочетанию признаков

· все классификации имеют недостаточную глубину

· процесс индексирования принципиально не автоматизирован, т. е ручное индексирование

Посткоординируемые ИПЯ:

семантические коды

в ЛЕ в явном виде заданы парадигматические отношения

дескрипторы

оперируют монолитными СЕ, в основу положен принцип координированного индексирования, который выражается в том. что основная тема документа выражается в виде набора слов или СС, т. о документ помещается в n-мерное пространство

Семантические коды Перри и Кента (США) м.б простыми и составными, простая ЛЕ - сем. множитель;

RX коды

ручное индексирование

грамматики мешочного типа

(теоретико-множественные грамматики) задаются отношением совместного вхождения в класс, ПОД составляется вручную, ПОД -перечень ключевых слов.

позиционно-скобочные грамматики

сохранение всего исходного текста документа с явным указанием порядка следования, деления на абзацы, предложения:

сетевые грамматики

в явном виде задается смысл связи между элементами текста (Скрэгг)

ИПЯ с ПСГ:

· индексирование без лексического контроля, до индексирования могут не иметь словаря, словарь формируется в результате индексирования.

· индексирование с лексическим контролем - все словоформы приводятся к стандартному виду

2. Назначение и принципы организации Субд на ПЭВМ

СУБД состоит из совокупности взаимосвязанных данных и набора программ, обеспечивающих доступ к данным и манипуляцию ими. Совокупность взаимосвязанных данных принято называть БД. [Henry F. Korth]

Более узкое определение СУБД - набор компьютерных программ, предназначенных для создания, поддержки, и использования БД

СУБД обеспечивает доступ к данным в процессе диалога с пользователем, отвечая на его вопросы (запросы).

Выделяется три уровня абстракции, на которых можно просмотреть данные.

· Физический уровень - уровень минимальной абстракции; на нем хранятся физические данные.

· Концептуальный уровень содержит описание данных, хранящихся в БД и отношений между ними. Он описывает всю БД в целом, используя несколько относительно простых структур - концептуальных схем; предназначен для администратора БД.

· Уровень представления - уровень максимальной абстракции; предназначен для основной массы пользователей БД. В одной БД может одновременно существовать несколько уровней представления.

· Модель данных представляет собой набор концептуальных инструментов для описания данных, отношений между ними, семантики данных и ограничений их целостности (consistency constraints).

Выделяют три класса моделей:

· логические модели, опирающиеся на понятие объекта (object-based logical models);

· логические модели, опирающиеся на понятие записи; (record-based logical models);

· физические модели данных (physical data models).

Объектные логические модели.

Объектные логические модели описывают данные на концептуальном уровне и уровне представления. Они позволяют определять структуру и ограничения целостности. На сегодняшний день существует свыше 30 моделей этого класса. Из них самые известные:

· модель сущность-связь;

· бинарная модель;

· семантическая модель данных;

· инфологическая модель.

Модель сущность-связь - основной представитель класса объектных моделей. Она считается наиболее адекватной для архитектуры БД и наиболее распространенной.

В основе модели сущность-связь лежит представление о реальном мире как о совокупности основных объектов, называемых сущностями и связей между ними.

· Под сущностью понимают любой реально существующий объект, отличный от других объектов. Чтобы отличить один объект от другого, каждому из них приписывается набор атрибутов, описывающих данный объект.

· Связь - это соединение между несколькими сущностями. Для того, чтобы различать сущности и связи, каждому набору сущностей приписывается первичный ключ.

· Первичный ключ - это один или несколько атрибутов, позволяющих однозначно идентифицировать сущность в наборе сущностей.

БД, удовлетворяющая диаграмме сущность-связь, может быть представлена в виде набора таблиц. Для каждого набора сущностей, как и для каждого набора отношений, создается отдельная таблица, которой присваивается имя соответствующего набора. В свою очередь, каждая таблица состоит из столбцов, каждый из которых имеет свое название.

Логические модели, опирающиеся на понятие записи.

Логические модели, опирающиеся на понятие записи, как и объектные логические модели, описывают данные на концептуальном уровне и уровне представления, но, в отличие от последних, эти модели определяют не только архитектуру БД, но и дают общее описание ее реализации. Однако модели этого класса уже не позволяют вводить ограничения на содержимое БД, как это делают объектные логические модели.

Самые распространенные модели:

· реляционная

· сетевая

· иерархическая.

Реляционная модель была предложена в 1970 году Е.Ф. Коддом и на сегодняшний день является признанным лидером среди моделей своего класса. Она основана на математическом понятии отношения.

Согласно реляционной модели, общая структура данных (отношение) может быть представлена в виде таблицы, в которой каждая строка значений (кортеж) соответствует логической записи, а заголовки столбцов являются названиями полей (элементов) в записях. Таким образом, данные и отношения между ними в реляционной модели представлены в виде набора таблиц, аналогичным по своей структуре таблицам модели сущность-связь.

Примеры реляционных БД: dBASE IY, FoxPro, Paradox.

Наиболее уязвимой частью реляционной модели являются проблемы целостности. Для их разрешения приняты ограничения, соответствующие строгой реляционной модели. До сих пор не удавалось создать СУБД полностью реляционную СУБД. Можно говорить лишь о большей или меньшей степени реляционности в отношении коммерческих СУБД. Однако для того чтобы называться реляционной СУБД должна обязательно отвечать следующим условиям:

· данные в ней должны храниться в таблицах;

· указатели и связи не должны быть видны пользователю;

· язык запросов должен быть реляционно полным.

Сетевая модель появилась в конце 1960-х гг. Она более привязана к реализации БД, чем реляционная модель.

Сетевая БД состоит из набора записей, соединенных друг с другом при помощи ссылок (links), которые могут быть видны пользователю как указатели (pointers). Ссылка соединяет ровно две записи. Записи организованы в виде произвольного графа (arbitrary graph).

Иерархическая модель представляет собой разновидность сетевой.

Иерархическая БД, как и сетевая, состоит из совокупности записей, соединенных между собой при помощи ссылок. Каждая запись состоит из набора полей, каждое из которых содержит ровно один параметр данных.

Основное отличие иерархической модели от сетевой заключается в способе организации записей. В иерархической модели записи организованы в виде деревьев, а не произвольных графов, как в сетевой модели. Общая логическая структура иерархической БД описывается при помощи диаграммы структуры дерева (tree- structure diagram), состоящей из записей и ссылок.

Пример иерархической БД: ACCESS.

Физические модели данных.

Физические модели данных используются на уровне минимальной абстракции. Это самый малочисленный класс моделей. Наиболее известные из них: отождествляющая модель (unifying model) и модель фреймовой памяти (frame memory).

Язык определения данных.

План БД определяется набором выражений (дефиниций), написанных на специальном языке, который называется язык определения данных (ЯОД) (data definition language).

Результатом компиляции выражений на ЯОД является набор таблиц, хранящийся в специальном файле, который называется словарь данных (data dictionary). В словаре данных хранятся метаданные, то есть данные о данных.

Разновидностью ЯОД является язык хранения и определения данных (data storage and manipulation language), на котором написаны выражения, определяющие методы доступа к данным и способ хранения структуры.

Язык манипуляции данными.

Под манипуляцией данными понимают:

· извлечение информации, хранящейся в БД;

· добавление новой информации в БД;

· уничтожение хранящейся в БД информации.

Язык манипуляции данными (ЯМД) обеспечивает пользователю доступ и манипуляцию данными. Различают два основных типа ЯМД:

· процедурный, который требует от пользователя указать тип нужных ему данных и способ их получения, то есть содержит процедуры поиска данных;

· непроцедурный, который требует указать только тип данных, не уточняя способ их получения, то есть не включает процедуры поиска.

Часть ЯМД, отвечающая за выборку данных, называется языком запросов.

Запрос (query) - выражение, задающее поиск данных в СУБД.

Менеджер БД - программный модуль, обеспечивающий интерфейс между данными низкого уровня, хранящимися в БД, прикладными программами и адресованными системе запросами.

Развернутая структура СУБД: СУБД состоит из модулей, каждый из которых выполняет определенную функцию. Некоторые функции СУБД могут выполняться операционной системой. Архитектура СУБД должна обеспечивать интерфейс между СУБД и операционной системой. СУБД состоит из следующих функциональных компонентов:

· Менеджер файлов управляет распределением места на диске и структурами данных; обеспечивает взаимодействие между данными низкого уровня, хранящимися в БД, прикладными программами и запросами, адресованными системе.

· Процессор запросов переводит выражения на языке запросов в инструкции, понятные менеджеру БД.

· Прекомпилятор ЯМД переводит выражения на ЯМД, вложенные в прикладную программу.

· Компилятор ЯОД переводит выражения на ЯОД в набор таблиц, содержащих

Структуры данных

· Файлы данных содержат собственно данные.

· Словарь данных содержит информацию о структуре БД.

· Индексы служат для быстрого поиска данных с конкретными значениями (атрибутами).

Билет 9

1. Формальные модели синтаксической структуры предложения.

Динамические и статистические модели

1. Дескриптивная модель Задача - описание структуры языка

нормирование (определение всех правил синтаксических структур)

исчисление

1) Грамматика зависимостей (европейская традиция, близка к НС, один из авторов - Гладкий) - указание для каждого слова тех слов, которые ему непосредственно подчинены.

Дерево синтаксических зависимостей есть дерево, множество узлов которого служит множеством вхождений слов в предложение. Деревом называется множество, между элементами которого - узлами - установлено бинарное отношение - отношение подчинения и графически изображают стрелками. идущими от подчиняющих узлов к подчиненным,- такое, что:

· среди узлов имеется один - корень - неподчиненный никакому другому узлу

· каждый из остальных узлов подчинен точно одному узлу

· нельзя, отправившись из к.л. узла вдоль стрелок вернутся в тот же узел.

ДЗ (дерево зависимостей) обычно используется в описаниях языков со свободным порядком слов (в частности, русского). Стрелки ДЗ обычно помечаются символами синтаксических отношений (предикативное, определительное и т.п.).

2) Метод НС составляющие - Для описания синтаксической структуры предложения выделяются группы слов, функционирующие как отдельные синт. единицы - составляющие.

Система составляющих - это множество отрезков предложения которое обладает тем свойством, что каждые два входящих в него отрезка либо не пересекаются либо один из них содержится в другом.

· Одна из НС - ядро конструкции, остальные - маргинальные элементы.

· При графическом изображении система составляющих тоже приобретает вид дерева (дерева непосредственных составляющих - ДНС).

· ДНС используются преим. в описаниях языков с жестким порядком слов.

· Составляющие обычно помечаются символами грамм. категорий (именная группа, группа переходного глагола и т.п.)

2. Трансформационная грамматика (Харрис, 50-е гг.) (грамматика деревьев) служит не для порождения предложений, а для преобразования деревьев, интерпретируемых как деревья подчинения или деревья составляющих, например грамматика - система правил преобразования деревьев, интерпретируемых как "чистые" деревья подчинения предложений (без линейного порядка слов).

три уровня описания

1) правила НС

2) трансформационные правила

3) морфологические правила

Допущения:

· синт. система может быть разбита на ряд подсистем, одна из которых - исходная (ядерная), остальные - производные. Ядерная Т - набор предложений (утвердительных, простых, с глаголом в изъяв. форме, активного залога, наст. времени.)

· ядерное предложение описывает элементарные ситуации, а класс ЯП - все множество элем. ситуаций.

· любой сложный синт. тип можно получить при применении упорядоченного набора обязательных и факультативных трансформаций к ядерному предложению.

Представление синт. структуры предложения - указание ядерного типа, лежащего в основе предложения и трансформаций, которые к нему применялись, а также их последовательности.

Метод явился основой порождающей грамматики Хомского.

3. Порождающая грамматика Хомского, представляющая собой упорядоченную систему Г =(V,W,П,R), где V и W - непересекающиеся конечные множества - основное (терминальное) и вспомогательное (нетерминальное), П - элемент W, называемый начальным символом и R - конечное множество правил вида , где цепочки (конечные последовательности) из основных и вспомогательных символов. Множество тех цепочек из основных символов, которые выводимы в Г из ее начального символа, называют языком, порождаемым грамматикой Г и обозначают L(Г). Если все правила Г имеют вид , где - правый и левый контексты, то Г называется грамматикой составляющих или грамматикой непосредственно составляющих (ГНС). Чаще всего основные символы интерпретируются как слова, вспомогательные - как символы грамматических категорий, начальный символ - как символ категории "предложение".

4. Реляционная модель

5. Аппликационная модель (Шаумяна?)

Доминационная грамматика, которая порождает множество цепочек, интерпретируемых обычно как предложения и вместе с их синтакс. структурами в виде ДЗ.

Грамматики Монтегю служат одновременно для описания синтакс. и семант. структуры предложения. В них используется сложный математико-логический аппарат (так называемая интенциональная логика).

2. Экспертные системы и их архитектура. Функции основных компонентов.

Экспертная система - это компьютерная программа, которая моделирует рассуждение человека-эксперта в определенной области, используя для этого БЗ, содержащую факты и правила об этой области и некоторую процедуру логического вывода.

Разработка ЭС - сравнительно новое направление в системах ИИ; второе название - инженерия знаний (термин ввел в 1977 Фегенбаум), сформировалась в середине 70 гг.

Раньше была цепочка: аналитик - программист - оператор - пользователь; теперь пользователь может обращаться прямо к ЭВМ (либо только через инженера по знаниям).

Структура ЭС:

раньше:

входные данные

программ

теперь:

входные данные

интерпретатор БЗ

БЗ

Обычные программы имеют фиксированную последовательность шагов, строго определенную программистом, ЭС пользуются нахождением удовлетворительного решения методом проб и ошибок.

ЭС решают трудно формализуемые задачи. не имеющие алгоритмического решения () медицина, геология, управление, юридические науки).

Попов: три причины появления ЭС:

· ориентированы на решение задач в неформализованных областях

· предназначены для пользователей, не имеющих спец. навыков программирования

· ЭС решают задачи лучше, чем человек.

3 принципа разработки ЭС:

1. мощность ЭС определяется мощностью БЗ и процедурами ее пополнения, т.о. компонент приобретения знаний важнее компонента логического вывода. (Раньше большее внимание уделялось лог. выводу).

2. Знание. используемое ЭС, является в основном эвристическим, экспериментальным, поэтому используется коэффициент достоверности.

3. ЭС реализуется в форме диалоговой системы.

ЭС должна обладать способностью приобретать знания.

2 источника приобретения знаний:

1) от эксперта

2) из текстов (не разработано)

ЭС решают практические задачи. а не экспериментальные; решения ЭС могут быть объяснены пользователю, т.е обладают свойством прозрачности, для этого существует специальный компонент - объяснительный.

Формальная основа ЭС: базовое понятие - правило продукции или формальные процедуры системы: правила вида условие -> действие если -> то (если была разлита горючая жидкостью то вызовите пожарных).

Термин продукция ввел Пост (1943)

Свойство продукции - всякая формальная система. оперирующая символами, может быть реализована одной из продукционных систем.

Архитектура ЭС

Пользователь ЭС Общение на ЕЯ	Лигвитсический компонент анализа с синтеза входных сообщений	рабочая память текущее состояние проведения экспертизы	объяснительный компонент

			интерпретатор

			компонент приобретения знаний

			БЗ

· БЗ имеет динамический характер, содержит факты и правила в форме продукций

· интерпретатор (решатель) имеет дело с процедурами логического вывода, на основе имеющихся данных решает задачу

· лингвистический процессор осуществляет диалог с пользователем

· рабочая память хранит данные

· компонент приобретения знаний - с его помощью знания извлекаются из эксперта или текста и заносятся в БЗ

· объяснительный компонент отвечает на вопрос, почему принято данное решение и чем мотивирован выбор.

2 режима работы ЭС:

· приобретение знаний: участвует эксперт и инженер по знаниям (посредник)ручные и автоматизированные методы (brainstorm)

· режим решения задач: главный участник - пользователь, заинтересованный в результате.

Типы ЭС:

· демонстрационные прототипы (56)

· исследовательские (92)

· действующие (12)

· промышленные (4)

· коммерческие (9)

Примеры ЭС

две старейшие ЭС:

DENDRAL (химическая тематика, определяет структуру хим. элементов)

MAXIMA (решение мат. задач)

Система FOBS

Санджай, Чадна и др., "Использование известных ситуаций (cases) для построения" ЭС MEDIA (выбор оптимального СМИ для маркетинга на материале Harvard Business School) на основе оболочки ADVISOR. Система задает вопросы и анализирует все факторы, связанные с продуктом (поведение покупателя, ориентация на конкретного покупателя, конъюнктура), рекомендует средство рекламы, перечисляет возможные альтернативы и аргументирует свой выбор.

Билет 10

1. Типы экспериментальных методов в лингвистике

Экспериментальные методы в лингвистике - это методы , позволяющие изучать факты языка в условиях. управляемых и контролируемых исследователем. Философской основой применения экспериментальных методов в лингвистике является тезис о единстве теоретического и эмпирического уровней познания.

В современной лингвистике термин "экспериментальный метод" не является четким; лингвисты часто говорят об эксперименте там, где имеет место наблюдение, прежде всего наблюдение над текстами (письменными и устными). Существенно. что текст как таковой, будучи данностью не может быть объектом ЭМ; именно поэтому ЭМ не применимы к изучению истории языка, особенностей стиля автора и т.п. в этих случаях следует говорить о наблюдении. Объектом ЭМ является человек - носитель языка, порождающий текст, воспринимающий тексты и выступающий как информант для исследователя. в лингвистическом эксперименте исследователь может иметь в качестве подобного объекта самого себя или других носителей языка; в первом случае следует