Поиск

Полнотекстовый поиск:
Где искать:
везде
только в названии
только в тексте
Выводить:
описание
слова в тексте
только заголовок

Рекомендуем ознакомиться

'Учебно-методический комплекс'
Курс «Основы перевода» посвящен вопросам общей теории перевода, т.е. научной дисциплине, изучающей различными методами и приемами структуру и наиболее...полностью>>
'Документ'
1.4. Главный распорядитель средств (полное наименование и идентификационный код по ЕГРПОУ Министерство здравоохранения Республики Крым, код ЕГРПОУ: 47...полностью>>
'Документ'
Химки, ул. Кирова, д. 1 /10 Адрес: 143441, Московская область, Красногорский р-н, п/о «Путилково», 9 км МКАД, офисно-общественный комплекс ЗАО «Гринву...полностью>>
'Документ'
м 5- 0 -05 7-40 8-30 1 -45 15-05 17-15 18-55 -05 7-15 8-45 9-40 13-50 1 -10 18- 5 0-00 13 Середняя Ежед - - - - - - - -10 7- 0 8- 5 11-50 14- 0 15-55 ...полностью>>

Главная > Документ

Сохрани ссылку в одной из сетей:
Информация о документе
Дата добавления:
Размер:
Доступные форматы для скачивания:

/

Категория:Онтологии

Материал из Semantic Future

Ключевое звено любой семантически-ориентированной системы - семантика предметной области, т.е. смысл тех категорий, в которых мы описываем предметную область для системы. В жёстко структурированных моделях данных, таких как реляционная модель, семантика закладывается в схему базы данных: мы даем имя полю таблицы базы данных, хотя бы отчасти отражающих смысл значений в этом поле.

Однако, ставить знак равенства между схемой базы данных и онтологией, между XML DTD (или XML Schema) и онтологией неверно. Почему? Те, кто знаком с философскими категориями, наверняка вспомнят, что онтология - это, буквально, учение о бытии (ontos + logos)- о том, как устроен мир, какова его структура, каковы и насколько сильны слабы взаимодействия между элементами этого мира.

Однако, в середине 80х гг. XX века происходит переоткрытие понятия "онтология". Отчасти это случилось в связи с нашумевшим тогда проектом CYC - проектом создания базы так называемых "общеизвестных" знаний (common sense knowledge). Оказалось, что многие "кусочки" знаний, закодированные в CYC, имеют универсальное значение и одинаково воспринимаются разными людьми и сообществами. Так появилось понимание того факта, что взаимодействие разных исследовательских сообществ невозможно без наличия "слоя-посредника". В таком "слое-посреднике" должен определяться словарь некой предметной области - те термины, которые используют все исследователи в этой области. Таким посредником и выступили онтологии предметных областей (domain ontologies).

На первых порах, в сфере информационных технологий часто противопоставляли два определения онтологии: более философское (определение Николы Гуарино) и более практическое (определение Томаса Грабера).

В философском контексте, онтология[1] – система категорий, используемая для рассмотрения с учетом конкретного видения мира. John Sowa так и пишет: предметом онтологии являются категории (потенциально) существующих вещей.

В контексте информационных систем, онтология[2] – формализованное описание общепринятого понимания некоторой предметной области, с помощью которого могут общаться люди, компьютерные системы.

На самом деле, вопрос в отличии двух определений сводится к разным требованиям к "слою-посреднику": в одном случае нужна строгая формальная теория, формальный язык (например, язык исчисления предикатов 1-го порядка, или его фрагменты, лежащие в основе логик дескрипций - description logics), в другом - достаточно списка терминов предметной области (онтологии - словари).

  1. ↑ Guarino N. Formal Ontology and Information Systems / N. Guarino // Formal Ontology in Information Systems : (Frontiers in Artificial Intelligence and Applications) : proceedings. — Amsterdam : IOS Press / Ohmsha, 1998. — P. 3—15.

  2. ↑ Uschold M. Ontologies: Principles, Methods and Applications / M. Uschold, M. Gruninger // Knowledge Engineering Review. — 1996. — Vol. 11, No. 2. — P. 99—155.

Подкатегории

Показано 2 подкатегории из 2.

O

  • [+] OWL (0)

  • [×] Ontology (0)

Страницы в категории «Онтологии»

Показано 10 страниц этой категории из 10.

"

  • "Семейная история" или как применить онтологию на практике

P

  • Pronto

В

  • Вероятностные онтологии

Н

  • На пути к 4D

  • Некоторые аспекты анализа развития нечетких онтологий

  • Немного о неопределенности и нечеткости в онтологиях

  • Несколько слов о протоколе Open Knowledge Base Connectivity (OKBC) и редакторе онтологий Protégé

О

  • О формальных основах OWL

Ч

  • Что же такое онтология?

Э

  • Экстенсивное развитие онтологических структур

На пути к 4D

Материал из Semantic Future

Щербак Сергей Сергеевич

Shcherbak Sergey

Род деятельности:

научно-исследовательская деятельность, блогинг, web-разработка

Роль участника:

Участник, Бюрократ

Основной раздел:

Semantic Web

Круг интересов:

Искусственный интеллект, Инженерия знаний

Дата рождения:

15.12.1979

Место рождения:

Богодухов, Украина

Гражданство:

Украина

Сайт:

Nickname

Shcherbak

Подробнее:

рус.

Рассуждая на тему онтологий, столкнулся с тем, что Semantic Web при всей своей полезности может уйти с арены намного раньше, чем получит широкое признание и внедрение.

Причем его уход будет связан с введением какого-то нового понятия или бренда, типа Semantic Web 2 или Web 3.0. Естественно, опыт полученный в рамках Semantic Web не будет утрачен и в полной мере будет использоваться в рамках «нового бренда», но вот Semantic Web в том виде который мы знаем (пирог Semantic Web) вряд ли будет существовать. Уже четыре года Semantic Web пытается привлечь к себе внимание, а результаты с учетом глобальности Web не очень то и большие.

Конечно, сделано очень много... и стандарты представления знаний, алгоритмы обработки и программные средства, позволяющие обрабатывать знания(?!). Но все упирается в то, что человек должен (!) сам подготовить информацию в доступном для «машинного понимания» виде.

А это как минимум требует определенных знаний и навыков в моделировании предметных областей и т.п.

Кроме того, мы говорим пока, не о том, что самый посещаемый ресурс на сегодня – это DBpedia, где собраны в машинопонятном виде огромные запасы знаний о различных предметных областях, а о том, что зайдя, например, на WikiPedia мы получаем информацию быстро и по существу. Подчеркивая тот факт, что мы(!) что-то ищем и мы (!) потребляем какую-то информацию. А ведь одна из целей Semantic Web именно в том, что бы вы набрали запрос, а ваш программный агент, нашел и самую-самую интересную(и главное релевантную) информацию Вам предоставил. Т.е. нужно для начала хотя бы исключить один элемент из цепочки “потребления” информации – наше участие в поиске.

Читая, интервью с Тимом Бернесом Ли на тему “Semantic Web открыт для бизнеса”, смотрю на все изменяющуюся картинку «пирога» Semantic Web и понимаю, что упрощение Semantic Web приведет, конечно, к увеличению числа пользователей, активно использующих технологии и сервисы Semantic Web, но революции, которая наблюдалась при появлении технологии XML в 1999 году не будет. По крайней мере пока. А жаль!

Скорее всего, тенденции развития Semantic Web будут идти в сторону интеграции с другими не поддерживаемыми W3C стандартами. Здесь прежде всего стоит упомянуть о языке веб-онтологий OWL.

OWL – это язык для представления знаний о реальном мире. Причем описание объектов осуществляется в настоящем времени и нет ни какой возможности на уровне языка посмотреть состояния объектов ” вчера ”, «позавчера» и т.д . Т.Е. в OWL нет поддержки «версионности» объектов. Что, на мой взгляд, является серьезным недостатком.

Конечно, версионность в онтологии на OWL можно привнести извне, например, применяя системы контроля версии SVN или CVS. Но это возможно только в случаях, если мы говорим о «файловых» онтологиях. А что делать с онтологиями, которые хранятся в базах данных или в rdf store? Здесь тоже можно найти весьма эффективное решение, но это все частности, а ведь Semantic Web претендует прежде всего на универсализм и унифицированные решения.

В OWL, представляются знания о трехмерных объектах вне учета изменения их состояния во времени. OWL – онтологии называют еще трехмерными онтологиями или 3D онтологиями. В тоже время, онтологии, которые поддерживают четвертое измерение – время – называют четырехмерными онтологиями или 4D онтологиями.

Вот бы поддержку 4D в OWL… Но в скором времени, это вряд ли возможно. Скорее всего подобная функциональность будет привлечена из других стандартов онтологий. Например, из стандарта ISO-15926 ([1]). В рамках которого в части 2 (ISO 15926-2) описана модель 4D-онтологии, а в ISO 15926-7 предложены способы реализации методов интеграции распределенных систем на основе стандартов W3C.

Для скорейшей интеграции стандартов онтологий можно разрабатывать средства трансляции онтологий, например, на языке ATL (ATLAS Transformation Language) ([2]).

Поддерживая оптимизм Тима Бернеса Ли по поводу дальнейшего развития Semantic Web надеемся на лучшее :)

/dialog2008/materials/html/Zagorulko.htm

Портал знаний по компьютерной лингвистике: содержательный доступ к лингвистическим информационным ресурсам1[1]

Загорулько Ю.А. (zagor@), Боровикова О.И. (olesya@), Загорулько Г.Б. (gal@)

Институт систем информатики имени А.П.Ершова СО РАН, Новосибирск, Россия

Рассматривается Интернет-портал знаний, обеспечивающий систематизацию знаний и информационных ресурсов по компьютерной лингвистике, их интеграцию в единое информационное пространство, а также содержательный доступ к ним (поиск информации в терминах предметной области портала и управляемую знаниями навигацию).

Введение

В связи с постоянно растущими потребностями в средствах автоматической обработки документов и естественно-языковых, в том числе речевых, интерфейсах, возникает необходимость в эффективном доступе не только к публикациям, описывающим методы и подходы к обработке текстов, но и разного рода словарям, программным компонентам и алгоритмам, реализующим различные задачи обработки текста или речи. И, хотя в настоящее время в сети Интернет представлен большой объем знаний и информационных ресурсов по этой тематике, доступ к таким ресурсам значительно затруднен, так как они лишь частично систематизированы и при этом рассредоточены по различным Интернет-сайтам, каталогам и электронным архивам.

Для решения этой проблемы существует несколько подходов. В рамках одного из них создаются различные Интернет-ресурсы (форумы, рассылки, комьюнити-порталы), выполняющие информационную поддержку разнообразных тематических сообществ. Самым известным ресурсом такого рода, имеющим отношение к компьютерной лингвистике, является англоязычный каталог LINGUIST List (/), созданный для общения и обмена знаниями между лингвистами и содержащий информацию о публикациях, персоналиях, научных учреждениях и других организациях лингвистического направления, грантах, конкурсах, проектах, фондах и источниках финансирования, конференциях и семинарах лингвистической тематики. LINGUIST List предоставляет возможность поиска ресурсов по таким параметрам, как страна, язык, раздел лингвистики.

К российским аналогам LINGUIST List можно отнести научно-образовательный портал "Лингвистика в России: ресурсы для исследователей" (/linguist/index.jsp) и сайт “Российская лингвистика (RUSLING)” (), создаваемый в Отделении лингвистических исследований ВИНИТИ РАН. Портал "Лингвистика в России” содержит иерархически организованный каталог ссылок на наиболее значимые лингвистические ресурсы и позволяет осуществлять навигацию по разделам портала с помощью иерархических связей внутри этих разделов и по ссылкам на связанные с ними области (разделы). Тематические категории этого портала представлены разделами по компьютерной, теоретической и прикладной лингвистике и их приложениям (смежным областям), а также разделами, посвященными русскому языку, языкам мира и народов РФ. Портал “Российская лингвистика” предлагает лингвистам «информационную карту» для поиска информации об организациях, научных исследованиях и публикациях, лингвистических ресурсах и персоналиях. Он содержит обширный каталог ссылок на словари и корпуса текстов для различных языков (в том числе славянских), а также сведения о российских лингвистах, предоставляя возможность их поиска не только по алфавиту, но и по области и объекту (языку) исследования.

Информационное наполнение порталов такого типа в значительной мере зависит от способа сбора информации (его автоматизированности) и личного вклада и активности каждого участника сообщества.

Другой подход направлен на представление лингвистических ресурсов непосредственно для работы с лингвистическими данными. К таким проектам относятся работы по переводу текстов в цифровые форматы, созданию средств их хранения и обработки, построению лингвистических онтологий и web-интерфейсов для описания и наполнения ресурсов лингвистическими данными. Среди таких проектов можно отметить проект E-MELD (), в рамках которого создается лингвистическая онтология GOLD (General Ontology for Linguistic Description), представляющая общеязыковые знания в виде иерархических структур.

Как правило, проекты, разрабатываемые в рамках описанных выше подходов, направлены на описание и сохранение общеязыковой лингвистической информации, а не для интеграции ресурсов по компьютерной лингвистике и обеспечения к ним содержательного доступа широкому кругу пользователей.

Для решения этой проблемы нами разрабатывается специализированный Интернет-портал знаний – портал знаний по компьютерной лингвистике. Как информационный ресурс такой портал знаний обеспечивает следующие возможности:

  • представление научной дисциплины «компьютерная лингвистика» (используемых в ней терминов и понятий, тематических разделов, объектов и методов исследования, научных результатов и т.п.) и участников научной деятельности в рамках этой дисциплины (персоналий, групп, сообществ и других организаций, включенных в процесс исследования);

  • интеграцию доступных информационных ресурсов по компьютерной лингвистике в единое информационное пространство;

  • содержательный доступ к систематизированным знаниям и данным, относящимся к компьютерной лингвистике, т.е. возможность поиска и получения информации в терминах предметной области портала, а также удобную навигацию по всему информационному пространству портала, базирующуюся на модели предметной области;

  • персонификацию пользовательского интерфейса (способа и степени подробности предоставления информации, поиска и навигации по порталу);

  • информационную поддержку пользователей, т.е. анонсирование разного рода событий и мероприятий, касающихся данной дисциплины.

1. Информационная модель портала

Информационная модель портала должна обеспечивать унифицированное представление и хранение знаний и информационных ресурсов по компьютерной лингвистике, а также содержательный доступ к ним: поиск информации в терминах предметной области портала и удобную навигацию по его информационному пространству. Поэтому в качестве основы такой модели выбрана онтология [1], содержащая наряду с традиционным описанием проблемной и предметной областей соотнесенное с ним описание соответствующих сетевых ресурсов [2].

С содержательной точки зрения, онтология портала служит для представления понятий, необходимых для описания как научной деятельности и научного знания в целом, так и конкретной научной дисциплины, в частности. В связи с этим онтология портала включает универсальные онтологии научной деятельности и научного знания [3], а также онтологию предметной области.

Первые две из перечисленных онтологий не зависят от предметной области (ПО) и могут использоваться практически в любом портале знаний, независимо от его тематики. В связи с этим эти онтологии выделе в качестве базовых (Рис.1). Рассмотрим их подробнее.

Рис. 1 Базовые онтологии портала

Онтология научной деятельности является онтологией верхнего уровня и включает базовые понятия, относящиеся к организации научно-исследовательской деятельности, такие как Персона, Организация, Событие, Деятельность, Публикация, используемые для описания участников научной деятельности, мероприятий, научных программ и проектов, различного типа публикаций. В эту онтологию также включено понятие Информационный ресурс, которое служит для описания информационных ресурсов, представленных в сети Интернет.

Онтология научного знания, по своей сути, является метаонтологией. Она содержит метапонятия и отношения, задающие структуры для описания рассматриваемой предметной области, такие как Раздел науки, Предмет исследования, Объект исследования, Метод исследования, Научный результат, позволяющие выделить в данной науке значимые разделы и подразделы, задать типизацию предметов, объектов и методов исследования, описать результаты научной деятельности.

Понятия базовых онтологий связаны между собой ассоциативными отношениями (см. Рис.1), выбор которых осуществлялся не столько исходя из полноты представления проблемной и предметной областей портала, сколько исходя из удобства навигации по его информационному пространству и поиска информации. Свойства каждого понятия описываются с помощью атрибутов и ограничений, наложенных на область их значений.

Так как портал предназначен для организации содержательного доступа к лингвистическим ресурсам, то в качестве онтологии предметной области он включает онтологию компьютерной лингвистики (КЛ). Понятия этой онтологии являются реализациями метапонятий онтологии научного знания и организованы в 5 иерархий «общее-частное»: Иерархия Объектов исследования, Иерархия Предметов исследования, Иерархия Методов исследования, Иерархия Разделов науки, Иерархия Научных результатов (см. Рис.2). Все эти иерархии связаны между собой посредством ассоциативных отношений, часть которых наследуется из базовых онтологий, а часть отражает специфику данной предметной области.

Рис. 2 Ядро онтологии компьютерной лингвистики

Таким образом, вводя формальные описания понятий проблемной и предметной области в виде понятий и отношений между ними, онтология портала задает структуры для представления реальных объектов и связей между ними.

В соответствии с принятой моделью данные на портале представлены в виде множества разнотипных информационных объектов и связей между ними. Информационный объект (ИО) – это структурированная совокупность данных, представляющая описание некоторого объекта выбранной области знаний или релевантного ей информационного ресурса. Каждый ИО соответствует некоторому понятию онтологии (является экземпляром этого понятия) и имеет заданную им структуру. Между конкретными информационными объектами могут существовать связи, семантика которых определяется отношениями, заданными между соответствующими понятиями онтологии.

2. Информационное содержание портала

Информационное содержание (контент) портала включает как знания общего характера (представлены в онтологии), так и конкретные знания о реальных объектах и информационных ресурсах, систематизированные в соответствии с онтологиями портала.

Так как портал посвящен компьютерной лингвистике, в его контенте, в первую очередь, представлены знания об основных разделах компьютерной лингвистики, о ее предметах и объектах исследования, используемых в ней моделях и методах, разработанных прикладных и инструментальных системах, алгоритмах и лингвистических ресурсах. Кроме этого, пользователи портала могут получить представление не только о компьютерной лингвистике как научной дисциплине, но и найти информацию о выполняемой в этой области научной деятельности. В первую очередь, это информация об ученых, исследовательских группах и организациях и их деятельности.

В деятельности организаций и исследователей особое место занимают научные и коммерческие проекты, в рамках которых большей частью и создаются лингвистические знания и ресурсы. Результаты этой деятельности находят отражение в публикациях - монографиях, статьях, материалах конференций и семинаров, отчетах и других текстовых ресурсах, доступ к которым обеспечивается порталом.

Таким образом, ресурсы компьютерной лингвистики представлены непосредственно результатами деятельности организаций и отдельных исследователей, полученных в ходе выполнения научных и коммерческих проектов. К таким ресурсам относятся как технологии, программные продукты, прикладные системы, так и лингвистические ресурсы: словари, корпуса и лингвистические БД. Для организации более эффективного доступа к таким ресурсам в контенте представлена информация о различных аспектах их разработки: организациях, персонах и проектах, с которыми связано их появление, а также о таких содержательных характеристиках ресурсов, как отнесенность к разделу науки, объекту или предмету исследования, методам исследования. Эта информация связывает ресурсы с остальными данными и знаниями, представленными в контенте портала, что позволяет пользователю выделить группы ресурсов, созданные, например, в ходе осуществления некоторой исследовательской деятельности (гранта, проекта, конкурса) или с использованием определенного класса методов исследования.

Важным компонентом информационного контента портала является описание Интернет-ресурсов. К таким ресурсам относятся сайты организаций, конференций, проектов, порталы и каталоги, а также отдельные страницы с материалами графического, мультимедийного или текстового типа. Как было сказано выше, каждый Интернет-ресурс, представленный на портале, соответствует такому понятию онтологии, как Информационный ресурс. Описание каждого ресурса включает экземпляр данного понятия (информационный объект) и набор экземпляров отношений, связывающих данный ИО с другими информационными объектами, представляющими организации, персоны, публикации, события, разделы науки и т.д.



Похожие документы:

  1. Особенности отношений с матерью

    Документ
    ... Time Perspective Inventory, the Semantic Differential Technique L.I.Vasserman), family ... характеристикам – разделение с матерью и слияние с матерью. Из предъявляемых изображений было выбрано ... S.L. The Present of Things Future: Exploration of Time in ...
  2. Вадим Руднев Прочь от реальности: Исследования по философии текста

    Документ
    ... веры, интуиции и неопределенности – the future (будущее), – но и чувственное восприятие, ... не выводит вытесненный материал из бессознательного, однако непосредственно ... . (Mass.), 1960. Wiersbicka A. Semantics primitives. Frankfurt a. M., 1972. Wiersbicka ...
  3. Актуальные вопросы германистики

    Документ
    ... пословиц……………………….. Cheremnykh F., Mashinskya N. Semantic analysis of English «colour» ... having qualities that promise future success. Golden Rose is ... воде, как о важнейшей формообразующей материи, из которой происходят центральные образы в творчестве ...
  4. В. Н. Брюшинкиным главы 11-17 и примечания к ним

    Документ
    ... сущность, глубочайшая сущность души, материал, из которого она сделана (скорее, воля ... Any Metaphysics Which In Future May Justly Claim Scientific ... 1 и след., а также R. Carnap, Introduction to Semantics, 1942). Благодаря развитию Тарским оснований ...
  5. В. Б. Боброва Общая редакция и вступительная статья

    Документ
    ... Форма камеры, ее размеры, вес, материал, из которого она сделана, цвет, футляр ... James H. Myers and Mark L. AIpert. „Semantic Confusion in Attitude Research: Salience ... Enis. „Marketing a City of the Future”. — „Marketing is Everybody's Business”. Santa ...

Другие похожие документы..