Тема: Семантическое аннотирование с помощью онтологий

Здраствуйте,ребята! Пожалуйста,помогите разобраться, с чего мне начать.Нужно разработать прогу -семантического аннотирования на основе онтологий при создании репозиториев. Желательно на С++. Буду благодарна за помощь . Нигде не могу  найти примеров,или материала!Выручайте! Мой е-мейл marykate90@mail.ru

Thumbs up +1 Thumbs down

2

Re: Семантическое аннотирование с помощью онтологий

Добрый день.
Ваша задача - автоматизировать аннотирование учебных материалов, расположенных в удаленном репозитарии?
Уточнить, пожалуйста, цель аннотирования.

Для хранения знаний может быть использована модель SKOS http://semanticfuture.net/index.php?tit … D0%B8_SKOS

Thumbs up +1 Thumbs down

3

Re: Семантическое аннотирование с помощью онтологий

Спасибо за отзыв. 
Разработка информационного и лингвистического обеспечения задачи семантического аннотирования на основе онтологий при создании репозиториев. 
Согласно моему пониманию..,цель аннотирование заключается в  кратком содержании текста по определенной предметной области, тоесть по идеи..программа должна выбирать онтологии-понятия,связи.. которые заданы..(построены до программы) и по ним делать аннотацию. Я этим никогда не занималась, пытаюсь освоить. Буду благодарна за дальнейшую помощь!

Thumbs up Thumbs down

4

Re: Семантическое аннотирование с помощью онтологий

Давайте еще немного уточним. Какую практическую задачу необходимо решить?
Аннотация составляется по текущему (одному) документу в репозитарии  или по блоку тематических документов в репозитарии?
Или вы разрабатываете тему "с нуля" и от вас в итоге зависит конечный результат и цель (в случае диссертационного исследования)?

Отредактировано Danallen (2011-03-07 18:53:56)

Thumbs up Thumbs down

5

Re: Семантическое аннотирование с помощью онтологий

Тема разрабатывается с нуля.
Это моя бакалаврская работа. Научный руководитель не может помочь с темой. Поэтому все зависит от меня - конечный результат и цель.  Наверное блок тематических документов  больше подходит.Но может для начала можно начать с аннотации 1 документа.  Очень надеюдсь на Вашу помощь. Заранее спасибо.

Thumbs up Thumbs down

6

Re: Семантическое аннотирование с помощью онтологий

Добрый день.
Все же нужно определиться с задачей. Где ее применять?
В метаданных ресурсов репозитария обычно присутствует описание, ключевые слова - в зависимости от цели ресурса.
Тут и аннотация к доку не очень то нужна.
Нужно представить что-то конкретное.

Я так понимаю для бакалаврской вам понадобится теоретический материал.

Посмотрите пока: http://efunds.com.ua/blog/ithea/1.html

Эти ссылки я показывала буквально на днях на другой ветке форума.
Здесь http://www.aot.ru/docs/sokirko/sokirko-candid-2.html
про семантический анализ.

Пример реферирования: http://visualworld.ru/.

Самое главное сейчас  - определить научно-практическую задачу где это полезно, причем так полезно, чтобы все сразу согласились.
Например:
Архив неупорядоченных данных (мед. архив истории болезней)
Архив библиотеки (в которых сейчас приличный бардак),
Проекты предприятий
Архив бакалаврских работ на кафедре.... !!!!!! Кстати, очень даже интересно. Смотрите, текст работы большой, не  одна страница, после защиты - просмотреть аннотацию по все работам, чтобы написать отчет. На кафедре можно взять образец, перед раздачей тем дипломов программа может сгенерировать отчет - можно посмотреть что сделано, как сделано и т.д.
Опять-таки работа упрощается - ресурсы структурированы: есть ключевые слова и реферат, которые можно сравнивать в качестве эталона со сгенерированной аннотацией, студенты могут добавлять свои работы в репозитарий по нужному вам алгоритму - это легко организовать. Уже этом году у вас накопится приличный объем работ. Ну а в следующем вы будете защищать диплом, продолжая эту же работу...
По-моему неплохая идея. Надо своим дипломникам подсказать.  smile

Отредактировано Danallen (2011-03-08 09:10:43)

Thumbs up +1 Thumbs down

7

Re: Семантическое аннотирование с помощью онтологий

ДА,отличная идея спасибо!!!!!
Только аннотации по всем этим работам мне нужно сделать с помощью онтологий - структурированных метаданных. Допустим предметная область -Компьютерные технологии. С чего теперь начинать. Есть,допустим, 3 работы. Как теперь построить по ним онтологии ..и написать прогу,чтоб делала аннотацию по онтологиям по каждой работе??????? Я так понимаю, что онтология должна быть одна, но работать для всех-чтоб совершалась выжимка материала по всем документам.

Thumbs up Thumbs down

8

Re: Семантическое аннотирование с помощью онтологий

Один объект онтологии = одна аннотация.
В принципе мы можем говорить с вами в терминах онтологий?
Если нет, то сначала надо почитать
http://shcherbak.net/mat_obez/
http://semanticfuture.net/index.php?tit … 0%BA%D0%B5
ну и напоследок посмотреть сюда...
http://semanticfuture.net/index.php?tit … 0%B8%D0%B8

А потом можно и о постановке задачи поговорить...

9

Re: Семантическое аннотирование с помощью онтологий

Спасибо,материал прочитала. Научно-практическая задача - архив рефератов -тематика -Компьютерные технологии. С чего начать?Ребят, подскажите,пожалуйста, может кто-то из Харькова, кто бы мог помочь разобраться с темой при встрече?Заранее спасибо

Thumbs up Thumbs down

10

Re: Семантическое аннотирование с помощью онтологий

Начать надо с создания онтологии, чтобы структурировать предметную область, чтобы определить что будет классом, а что его экземплярами.
потом надо определиться с хранилищем, что будет в онтологии, а что будет храниться например в базе данных. то есть надо определить, где будут аннотации храниться, а где рефераты.

некоторые моменты по вашей тематике можно читать в темах выше...

11

Re: Семантическое аннотирование с помощью онтологий

Для начала зайдите на кафедру (подключите преподавателя) и возьмите приказы на назначение тем дипломов, а также посмотрите документацию, которая оформляется после защит. Это приблизит вас к практике, вы почувствуете заинтересованность к к некоторым аспектам вашей темы (генерация документации очень мотивирует на помощь студентам). Потом поработайте с руководителем пусть он с вами посидит и вы обсудите процесс выбора темы диплома. Обсудите, из каких соображений исходит преподаватель определяя тему исследований - это будут ваши Правила.

Теперь Сущности...
Смотрим на структуру рефератов-дипломов. Изучаем характеристики по которым ставят оценку - оцениваемые показатели документов.

Вас будут интересовать приблизительно такие категории - Направление, Тематика, Специализация (для определения класса онтологии, который закрепит тему диплома в определенной нише).
Это надо рисовать ручкой на листе бумаги в виде графа.

Далее в рефератах или дипломах:  ключевые слова, реферат (как часть работы обычно там есть такой листик, который уже содержит аннотацию - посмотрите и выделите в них общую структуру. Возможно вашу задачу надо будет свести к проверке соответствия авторской аннотации содержимому реферата).

Ссылки на сайты (потом можно подзадачу плагиата подключить).

Ключевые слова рецензий можно представить в виде свойств: новизна, наличие плагиата, отсутствие плагиата, наличие практических примеров либо уровень абстракции, устаревшая литература (тут кстати вопрос времени автоматом можно рассчитывать). К литературе можно добавить подкласс фундаментальной литературы, которая в принципе не устаревает.
Практическая ценность, научная ценность...

и т.д.

Посмотрите какие бывают ключевые слова в рефератах. Подумайте какой семантикой вы будете их соединять (внешние связи). Для этого SKOS вам может помочь, еще понадобится КЛАСС-ПОДКЛАСС, ВЫШЕ-НИЖЕ, больше не надо. Ведь на практике глубже никто не лезет.

Не уходите в далекие дали, иначе потонете в информации.

Главное, возьмите за основу реальные документы. Вы сможете в них быстро разобраться. И работа получится прозрачной и проработанной.

Ну а потом Протеже и строим онтологию. Делаем несколько тестовых объектов онтологии (документ, реферат или диплом, называйте как угодно), заносим ключевые слова, результаты рецензирования - и смотрим, какой вывод мы можем сделать из этих данных.

Отредактировано Danallen (2011-03-13 14:51:53)

Thumbs up +1 Thumbs down