1

Тема: RDF конструкции простых описаний ресурса

Здравствуйте.

В общем так получилось, что увлёкся я разными семантичными технологиями. Поскольку мне для понимания проще было начинать с верхних уровней т.е. RDFa и HTML, то и начал я именно с них и при этом упустил где-то кусочек важной информации.

Хотя тема очень даже интересует меня, до сих пор не понимаю нафига оно надо. big_smile  Есть ряд крупных игроков на рынке и как-то вяло шевелятся в отношении семантизации интернет, тема развита слабо и практически нет примеров того как и чем эти данные экстрагируются.

Ладно, что-то я не в то русло. Вопрос по сути простой, хочу сделать модуль для Drupal, который будет динамически билдить карту с описаниями сайта и всех материалов. На друпал это реализовать достаточно просто, но у меня есть пробуксовки которые касаются непосредственно чистого RDF, как XML.


Вопросы:

Какой заголовок должен отдавать сервер?
Какой Doctype использовать и нужен ли он вообще?
Имеет ли смысл начинять описания под потолок разными левыми нэймспейсами или достаточно обойтись Dublin Core и FOAF?(здесь мне трудно определиться так как ежу понятно, что начинение всем подряд скорее вред т.к. должна быть какая-то унификация -- это избавит от мертвых данных и сделает данные более менее съедобными для большинства.)
Кто или что и в каком виде потом сможет употребить экстрагированные данные?(ну типа зачем я буду делать велосипед, если на нём кататься не будут)/
Является ли плохим тоном front-end XSL трансформация для дружественности к пользователю?


Поскольку это модуль и он может быть использован другими людьми, хочется предусмотреть все возможные косипоры и обойти подводные камни. Вот что у меня получилось на данный момент: http://www.shift-web.ru/xslrdf.xml, такой поток строит мой модуль, но я хотел бы описать ресурс максимально со всех сторон. Подтолкните в нужную сторону, пжалста.

с Уважением

2

Re: RDF конструкции простых описаний ресурса

В друпале есть модуль для RDFa http://drupal.org/node/378144
и ничего не надо программировать. нормально научитесь описывать доки на RDFa и все

3

Re: RDF конструкции простых описаний ресурса

Shcherbak пишет:

В друпале есть модуль для RDFa http://drupal.org/node/378144
и ничего не надо программировать. нормально научитесь описывать доки на RDFa и все

Сергей, если Вы в курсе, то этот модуль очень тяжелый и достаточно неудобный. Мне не нужна вся функциональность и лаги которые он обеспечивает. Как бы модуль модулем, но мне важно именно понимание технологии, это избавляет от кучи неувязок, как и в любой другой прикладной области.


RDFa да, я копаю в эту сторону и кое что получается, но в любом случае это тёмный лес. Я как и многие люди не понимаю что это даёт и какие "за" использовать эту технологию и тратить время на дополнительный кодинг.


В принципе Google кое что читает и кое что из этого показывает. Есть ли другие сервисы и где на них можно посмотреть? Про facebook в курсе.


Достаточно проблемно что то пытаться сделать, когда не видно для чего это нужно(я имею ввиду практическое смыслы, а не облачную философию). Собственно на RDFa я наткнулся вообще случайно, в дурпале как раз таки на модуле RDF и мне не понятно почему такой здоровенный пласт оказался в тумане.

Отредактировано DarkJoker (2010-12-14 20:53:59)

4

Re: RDF конструкции простых описаний ресурса

Shcherbak пишет:

нормально научитесь описывать доки на RDFa и все

Все таки, мне кажется, кошернее это сделать отдельно от основной разметки. Меньше путаницы, проще писать материалы, которые будут описываться автоматом, чем в html устраивать ацкую закись из атрибутов, которые захламляют трафик-канал.

Собсно, я понимаю, что RDFa ближе к тексту и чисто логически проще выдеть оттуда какую-то инфу чем из отдельного XML, но тем не менее ...

5

Re: RDF конструкции простых описаний ресурса

)) тяжелый - не тяжелый это вопрос другой - стоит взять любой плагин для вордпресса который добавляет разметку RDFa в блог и сделать аналогично в друпале... Честно сказать лекцию читать по RDFa не хочу...
это только своим студентам. а им тоже это не надо, они уже в курсе ))

единственно что может быть лучше RDFa - это делать что-то на базе триплестора. но с друпалом не получится скорее всего состыковаться. 
Может ARC поможет ...

6

Re: RDF конструкции простых описаний ресурса

Shcherbak пишет:

Может ARC поможет ...

Ну так модуль друпала это и есть интеграция ARC библиотеки.

Shcherbak пишет:

Честно сказать лекцию читать по RDFa не хочу...

Честно сказать, я понял Ваш контекст, но мне кажется вы не поняли сути вопросов. Если кратко то, это будет звучать: "Нафига это надо?", кроме философии о светлом будущем, разумеется.

7

Re: RDF конструкции простых описаний ресурса

текст на страничке хорошо, но контекст для машины лучше. Вы в тексте какую то мысль выразили, но использовали для этого много слов, информативными из них будут только некоторые. А если так, то информативные можно пометить например с помощью классических понятий сущность-связь создавая семантический граф текста, для машины это уже возможность использовать текст ваш не как просто текст, а как структуру пригодную для машинной обработки.

в блоге гугла по тегу RDFa очень правильно написан ответ на ваш вопрос )) А светлое будущее семантики оно и так светлое...

PS сущность-связь написал для примера RDFa может значительно больше, особенно если использовать предопределенные библиотеки тегов (например тот же DC).

PSS так вот в этом тексте написал много, а информативного представляющего ценность мало. а вот что ценно RDFa показал бы...

И главное RDFa интересен, так что подогревайте интерес на форуме, я приглашу сюда людей на тему эту пообщаться...

8

Re: RDF конструкции простых описаний ресурса

Ну вообще мне кажется RDFa проще и доступнее и если уж говорить о развитии, то оно за ним. Однако, корни уходят в RDF, именно поэтому я и пытаюсь понять, как например, тот же RDFa выглядел бы в RDF и наоборот(это даёт общую картину). Иногда возникает сомнения как описать то или иное, ведь тут важна точность.

У меня была идея сделать сайт на Flash, таким образом, чтобы данные брались в виде RDF. Ведь это по сути тот же XML. Идея как бы немного безумна, согласен, но достаточно интересна.

Спасибо!

Отредактировано DarkJoker (2010-12-14 22:39:41)

Re: RDF конструкции простых описаний ресурса

ну на самом деле я возможно открою тайну, но пока что парсеров rdfa, которые бы делали с полученными данными что то осмысленное не существует. Скажу больше - не существует парсера, который бы парсил не только тело ответа, но и заголовки (я имею ввиду тег link, а также всевозможные редиректы). Ответ на вопрос "кому это надо": надо всем. Однако пока эти "все" на rdfa забивают. Почему забивают это отдельный вопрос - думаю потому как нет стандарта обработки связанных rdfa документов в сети.

Вообще, если вы хотите выложить на страницу некую семантическую информацию о ней, то возможно стоит прицепить через Link к ней rdf+xml файлик. А также отдавать rdf вместо страницы если в запросе к вам указано Accept: application/rdf+xml.
Посмотрите как это сделано например здесь http://dbpedia.org/page/Berlin.

Отредактировано Евгений (2010-12-15 11:19:57)

Thumbs up Thumbs down

10

Re: RDF конструкции простых описаний ресурса

Евгений пишет:

парсеров rdfa, которые бы делали с полученными данными что то осмысленное не существует.

Да я заметил. Хотя Google вроде движется в этом направлении, но до сих пор не научился обрабатывать снипеты. Там есть микроформаты, но RDFa всё еще не обрабатывает.


Евгений пишет:

Почему забивают это отдельный вопрос - думаю потому как нет стандарта обработки связанных rdfa документов в сети.

Возможно и так, но тут очень трудно наверное такой стандарт предусмотреть.


Евгений пишет:

Вообще, если вы хотите выложить на страницу некую семантическую информацию о ней, то возможно стоит прицепить через Link к ней rdf+xml файлик. А также отдавать rdf вместо страницы если в запросе к вам указано Accept: application/rdf+xml.

Спасибо. В принципе достаточно информации и я понял, что нужно подправить.


Кстати, если кому интересно, я сделал пару переводов по RDFa и Open Graph, если что буду находить интересное -- буду переводить понемногу.


http://www.shift-web.ru/rukovodstvo-rdfa-dlya-html
http://www.shift-web.ru/open-graph-prot … lnih-media

Отредактировано DarkJoker (2010-12-15 18:31:21)

11

Re: RDF конструкции простых описаний ресурса

Евгений пишет:

ну на самом деле я возможно открою тайну, но пока что парсеров rdfa, которые бы делали с полученными данными что то осмысленное не существует.

Парсер должен парсить (ну и обычно рядом в кустах сидит загрузчик, который распарсенное утаскивает в хранилище). Что до "парсит как надо" или "парсит не как надо" --- на виртуозовский парсер вроде жалоб нет, а остальные меня не интересуют wink

12

Re: RDF конструкции простых описаний ресурса

iv_an_ru пишет:

Что до "парсит как надо" или "парсит не как надо" --- на виртуозовский парсер вроде жалоб нет, а остальные меня не интересуют wink

Ну думаю просто пока жаловаться некому:)
А если серьезно, то я имел ввиду что пока что нет парсера/бота, который бы мог связать воедино несколько перекликающихся rdfa страничек в сети. Особенно при условии что ссылка ему например дана одна. К тому же по опыту могу сказать что выкладывают люди такие странички кто как захочет. Надеюсь "стандарт" связей между документами появиться де факто раньше чем его w3c придумает:)

Thumbs up +1 Thumbs down

13

Re: RDF конструкции простых описаний ресурса

Евгений пишет:

т. Надеюсь "стандарт" связей между документами появиться де факто раньше чем его w3c придумает:)

Наверное так и будет, если кто-то захочет поднять тему.

14

Re: RDF конструкции простых описаний ресурса

Евгений пишет:

пока что нет парсера/бота, который бы мог связать воедино несколько перекликающихся rdfa страничек в сети.

Особой необходимости в таком боте нет. Кто хочет сделать свою публикацию видимой, тот уведомляет http://pingthesemanticweb.com/ , а роботы вместо обхода сайтов просто непрерывно читают ленту новостей PTSW.

15

Re: RDF конструкции простых описаний ресурса

iv_an_ru пишет:
Евгений пишет:

пока что нет парсера/бота, который бы мог связать воедино несколько перекликающихся rdfa страничек в сети.

Особой необходимости в таком боте нет. Кто хочет сделать свою публикацию видимой, тот уведомляет http://pingthesemanticweb.com/ , а роботы вместо обхода сайтов просто непрерывно читают ленту новостей PTSW.

О как ... Спасибо