1

Тема: Альтернативы XML

Как известно, XML обладает громоздкими конструкциями и ограниченной выразительностью. А существует ли ему альтернатива в Semantic Web? Например, в локальной системе сам XML является альтернативой ini-файлам. Сразу оговорюсь, что не углублялся в технологии, но с первого взгляда видно, что, например, закачивать клиентом метаинформацию после ее обработки поисковиком не эффективно. Кроме того, обработка документов, содержащих семантическую составляющую, происходит(может происходить) на локальной машине, т.е. может быть подготовлена заранее для индексирования поисковиком. Значит, метаданные в таких документах могут быть сокращены или вынесены из документа, отправляемого конечному пользователю.

Thumbs up Thumbs down

2

Re: Альтернативы XML

да так и есть. см альтернативу микроформатам приложения  RDF...

3

Re: Альтернативы XML

Shcherbak пишет:

да так и есть. см альтернативу микроформатам приложения  RDF...

Если я правильно понимаю, XML – только рекомендованный, но язык(и среда программирования) может быть любым?

Thumbs up Thumbs down

4

Re: Альтернативы XML

язык и среда может быть любым. вопрос в том, для чего рекомендован XML?

5

Re: Альтернативы XML

Shcherbak пишет:

язык и среда может быть любым. вопрос в том, для чего рекомендован XML?

С одной стороны, RDF – это ЯП общего назначения(general-purpose) для представления информации в сети. С другой, в спецификации http://www.w3.org/TR/rdf-syntax-grammar/ он привязан к XML. А были попытки использовать другие нотации?

Thumbs up Thumbs down

6

Re: Альтернативы XML

Мы говорим об RDF/XML, а не о XML в Semantic Web?

В RDF/XML много избыточной информации храниться из-за XML представления, файлы большого размера в результате получаются...

да, существуют другие нотации для представления триплетов RDF. например N3 (Notation3)

7

Re: Альтернативы XML

Да, N3 проще для начала при изучении. Но это не меняет сути. Когда браузер закачивает web-страницу с блоками <rdf:RDF…</rdf:RDF> понятно, что эти данные нужны для агента интернета(поисковика), но они бесполезны для конечного пользователя. Отсюда предположение, что возможна генерация страницы в нескольких вариантах. Простой текст для web-клиента пользователя, страница с метаданными, где ресурсы идентифицируются через квалифицированный URI, или с метаданными в какой-то другой форме. "В какой-то другой форме" не возможно из-за отсутствия другого стандарта или есть варианты?

Отредактировано identical (2011-06-27 13:23:32)

Thumbs up Thumbs down

8

Re: Альтернативы XML

XSLT и любой RDF получается в любом представлении вплоть до HTML5.
Насколько мне помниться  ед-ные блоки RDF которые интегрируются в середину веб-страницы - это Dublin Core. Все остальные подгружаются через ссылки... по крайней мере так лучше всего. Поэтому лишнее браузер грузить не будет.

что-то мыслится мне RDFa подойдет.

Re: Альтернативы XML

Вообще говоря rdfa наиболее "мягкое" решение проблемы если вам надо отдавать данные и агентам и пользователю.

Существует и другой подход - при получении запроса с заголовком Accept: application/rdf+xml, отдавать чистый rdf, в ином случае - html+rdfа. Так например делает dbpedia. Хотя если вы не хотите отдавать вообще ничего лишнего, то можно отдавать чистый html.

У этого подхода плюс в том, что парсить чистый rdf гораздо легче чем rdfa ( в rdf нет "мишуры" html тегов и css). К тому же при парсинге rdfa у разных парсеров могут возникать разночтения - например с тегами типа base, неймспейсами. Кроме того  js парсеры например могут отрабатывать после выполнения скриптов на странице, которые могут изменять ее содержимое и получать один результат, а "серверные" парсеры про js ничего не знают и будут работать с исходным содержимым и получать другой результат.

Отредактировано Евгений (2011-06-28 08:57:57)

Thumbs up Thumbs down

10

Re: Альтернативы XML

Евгений пишет:

...у разных парсеров могут возникать разночтения - например с тегами типа base, неймспейсами...

На этой странице уже присутствуют упоминания о нескольких ЯП + N3 + css и пр. Но как выработать системный подход с позиций метамоделирования так, чтобы он не упирался в уже существующие инструменты, но была возможность, использую любую среду программирования, добавить семантику к ресурсам в самом компактном виде? А самый компактный вид – это бинарный.

Thumbs up Thumbs down

11

Re: Альтернативы XML

в каком виде добавить семантику не важно, если ваше приложение может из бинарника извлечь семантические характеристики, то и бинарное представление подойдет...
про метамодели мы уже рассуждали много на форуме, если нужна универсальная метамодель для выражения семантики можно ее построить, но зачем? что вас не устраивает в существующих парадигмах?

12

Re: Альтернативы XML

Shcherbak пишет:

... если ваше приложение может из бинарника извлечь семантические характеристики...

Проблема в том, будет ли поисковик, заточенный под работу с URI, индексировать такие ресурсы. Под заявленной темой надо сказать, что Пролог является альтернативой XML, но проблема та же – есть стандарт, ориентированный на XML, а другие более удобные парадигмы надо как-то стыковать.

Thumbs up Thumbs down

13

Re: Альтернативы XML

В теме по представлению знаний (1-я на этом форуме) много различных рассуждений на тему альтернатив OWL // потому что рассуждать на тему XML в контексте семантики не имеет смысла, с RDF еще куда ни шло...

Альтернативой даталогу есть SWRL

http://forum.semanticfuture.net/viewtopic.php?id=225
http://forum.semanticfuture.net/viewtopic.php?id=25

что за стандарт ориентированный на XML?

XML внизу стека технологий Semantic Web над базовым WWW

14

Re: Альтернативы XML

Shcherbak пишет:

Альтернативой даталогу есть SWRL

http://forum.semanticfuture.net/viewtopic.php?id=225
http://forum.semanticfuture.net/viewtopic.php?id=25

Ок. о Пролог почитал.

Shcherbak пишет:

что за стандарт ориентированный на XML?

XML внизу стека технологий Semantic Web над базовым WWW

Синтаксис XML не несёт семантической нагрузки и, пусть, нет рекомендаций от W3C его использовать. Значит, его можно заменить синтаксисом любого другого ЯП? smile

Thumbs up Thumbs down

15

Re: Альтернативы XML

так и есть, в XML нет семантики...Можна. Если уж очень интересен XML в контексте знаний, тогда KML (не гугловский) подойдет - язык разметки знаний на основе XML