Поиск

Полнотекстовый поиск:
Где искать:
везде
только в названии
только в тексте
Выводить:
описание
слова в тексте
только заголовок

Рекомендуем ознакомиться

'Документ'
под приварку 500\400ру 5-1шт 30тр 30с7 нж 150ру 3(зил)-1шт 8тр 30с7 нж 80ру 3(зил)-3шт по 1500тр 30с 4нж1 100ру 5(пенза)-3шт по тр 30ч бр 300ру10- 1шт...полностью>>
'Документ'
По результатам работы Конференции планируется издание сборника статей (включая присвоение кодов ISBN, УДК и ББК, рассылку по библиотекам, регистрацию ...полностью>>
'Памятка'
Напоминаем, что основными причинами гибели людей на воде является грубое нарушение правил безопасного поведения на воде, купание в неустановленных мес...полностью>>
'Документ'
Всероссийская политическая партия «Партия Великое Отечество» обращает Ваше внимание, что на спортивной форме российской олимпийской сборной слово РОСС...полностью>>

Главная > Программа дисциплины

Сохрани ссылку в одной из сетей:
Информация о документе
Дата добавления:
Размер:
Доступные форматы для скачивания:

Правительство Российской Федерации

Федеральное государственное автономное образовательное учреждение высшего профессионального образования

«Национальный исследовательский университет

«Высшая школа экономики»

Факультет БИЗНЕС-ИНФОРМАТИКИ

Отделение ПРИКЛАДНОЙ МАТЕМАТИКИ И ИНФОРМАТИКИ

Программа дисциплины

Компьютерная лингвистика

для направления 010400.68 «Прикладная математика и информатика» подготовки магистров

Авторы: Большакова Е.И. (eibolshakova@),

Лукашевич Н.В. (louk_nat@)

Рекомендована секцией УМС

«Прикладная математика

и информатика»

Председатель

__________________ Кузнецов С.О.

«_____» __________________ 20___ г.

Одобрена на заседании кафедры

Анализа данных

и искусственного интеллекта

Зав. кафедрой

__________________ Кузнецов С.О.

«_____» __________________ 20___ г.

Утверждена УС факультета

бизнес-информатики

Ученый секретарь

__________________

« ____» ___________________20___ г.

Москва

I.Пояснительная записка

Авторы программы

кандидат физико-математических наук Е.И. Большакова,

кандидат физико-математических наук Н.В. Лукашевич

Требования к студентам

Предполагаются базовые знания по дисциплинам «Дискретная математика», «Информатика и программирование», «Алгоритмы и структуры данных».

Аннотация

Курс «Компьютерная лингвистика» продолжает изучение методов и средств автоматической обработки текстов (АОТ) на естественном языке, начатое в рамках магистерского курса «Введение в интеллектуальные информационные системы». Задачей курса является рассмотрение различных моделей компьютерной лингвистики, применяемых в современных предметно-ориентированных информационных системах. Изучаются виды используемых лингвистических ресурсов и методы их создания. Рассматриваются прикладные задачи АОТ, требующие многоуровневого анализа и синтеза текста (такие как машинный перевод, генерация текста, задача извлечения информации и знаний из текста).

Учебные задачи курса

Основная задача курса – изучение основных принципов и методов автоматической обработки текстов на естественном языке (ЕЯ). В результате изучения дисциплины студенты должны:

  • Знать основные уровни обработки текста на ЕЯ и существующие модели статистического, морфологического и синтаксического анализа текстов;

  • Знать основные принципы представления знаний о предметной области в виде рубрикаторов, тезаурусов, онтологий;

  • Понимать существенные отличия естественных языков от искусственных и особенности компьютерных моделей естественного языка;

  • Знать типичные программные системы (приложения) в области АОТ и их архитектурные особенности;

  • Уметь работать с одной из систем АОТ и/или инструментальным средством для разработки систем АОТ.

II.Тематический план курса
«Компьютерная лингвистика»

Название темы

Всего часов по дисциплине

Аудиторные часы

Самосто-ятельная работа

Лекции

Сем. и практика занятия

1

Введение

10

4

0

6

2

Статистические модели

20

4

4

12

3

Морфологические модели

22

4

4

14

4

Методы синтаксического анализа

28

6

4

18

5

Модели дискурса и семантики

20

4

4

12

6

Разработка и применение лингвистических ресурсов

38

6

10

22

7

Построение приложений КЛ

24

4

6

14

Итого

162

32

32

98

III.Источники информации

Базовый учебник – ридер «Автоматическая обработка текста», составленный по следующим источникам:

  1. Автоматическая обработка текстов на естественном языке и компьютерная лингвистика: учеб. пособие / Большакова Е.И. и др. – М.: МИЭМ, 2011.

  2. Лукашевич Н.В. Тезаурусы в задачах информационного поиска. – М.: Изд-во Московского университета, 2011.

  3. The Oxford Handbook on Computational Linguistics. R. Mitkov (Ed.). Oxford University Press, 2005.

Дополнительная литература

  1. Белоногов Г.Г. Компьютерная лингвистика и перспективные информационные технологии. – М.: Русский мир, 2004.

  2. Болховитянов А.В., Гусев А.В., Чеповский А.М. Морфологические модели компьютерной лингвистики: учеб. пособие – М. МГУП, 2010.

  3. Ван Дейк Т.А., Кинч В. Стратегия понимания связного текста.// Новое в зарубежной лингвистике. Вып. XXIII — М., Прогресс, 1988, с. 153-211.

  4. Васильев В. Г., Кривенко М. П. Методы автоматизированной обработки текстов. – М.: ИПИ РАН, 2008.

  5. Гладкий А.В. Синтаксические структуры естественного языка в автоматизированных системах общения. — М., Наука, 1985.

  6. Зубов А.В., Зубова И.И. Основы искусственного интеллекта для лингвистов. – М., Логос, 2007.

  7. Касевич В.Б. Элементы общей лингвистики. — М., Наука, 1977.

  8. Кобозева И.М. Лингвистическая семантика. – М., 2009.

  9. Кронгауз М.А. Семантика. - М.: Издательский центр «Академия», 2005.

  10. Маккьюин К. Дискурсивные стратегии для синтеза текста на естественном языке // Новое в зарубежной лингвистике. Вып. XXIV. М.: Прогресс, 1989, с.311-356.

  11. Леонтьева Н. Н. Автоматическое понимание текстов: Системы, модели, ресурсы: Учебное пособие – М.: Академия, 2006.

  12. Пиотровский Р.Г. , Бектаев К.Б., Пиотровская А.А. Математическая лингвистика. – М.: Высшая школа, 1977.

  13. Чатуев М.Б., Чеповский А.М. Частотные методы в компьютерной лингвистике: учебное пособие – М. МГУП, 2011.

  14. Biber, D., Conrad S., and Reppen D. Corpus Linguistics. Investigating Language Structure and Use. Cambridge University Press, Cambridge, 1998.

  15. Bolshakov, I.A., Gelbukh A. Computational Linguistics. Models, Resources, Applications. Mexico, IPN, 2004.

  16. Jurafsky D., Martin J. Speech and Language Processing. An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition, Prentice Hall, 2000.

  17. Manning, Ch. D., H. Schütze. Foundations of Statistical Natural Language Processing. MIT Press, 1999.

  18. Word Net: an Electronic Lexical Database. /Edit. by Christiane Fellbaum. Cambridge, MIT Press, 1998.



Похожие документы:

  1. Программа дисциплины Ведение в интеллектуальные информационные системы для направления 010400. 68 «Прикладная математика и информатика» подготовки магистра Авторы программы

    Программа дисциплины
    ... И ИНФОРМАТИКИ Программа дисциплины Ведение в интеллектуальные информационные системы для направления 010400.68 «Прикладная математика и информатика» подготовки магистра Авторы программы: Большакова Е.И., кандидат физ.-мат. наук, доцент (eibolshakova ...

Другие похожие документы..