Тема: Семантическая организация доменных имен

Мы привыкаем ко всему хорошему. И в силу этих привычек не всегда осознаем, что можно сделать намного лучше....

К примеру, доменнная адресация в Инернете. Набираем в адресной строке браузера что-то вроде этого -"http://google.com", и здесь все так привычно - сначала тип протокола (да про это уже почти никто и не знает...), затем доменное имя, далее через флеш - путь к файлу нв сервере google....

Вроде все так просто, привычно, и что тут может быть улучшено?

А теперь представьте, что в той же адресной строке браузера можно будет набрать просто имя разыскиваемого объекта - к примеру "~ музей Эрмитаж", и вы сразу переходите на сайт Эрмитажа. Вы так же быстро войдете на сайт, если наберете и "~ музеи Эрмитажа", и "~ Museum the Hermitage", и "~ El museo el Ermitaje".

Как это так? - возмутитесь вы. Чего вы мне голову морочите!!!Так не бывает, так никогда не будет!!!!

А вот и не правы вы. Пока такая система не работает, но в будущем она возможна. Над такой системой (cистемой HDNS - Hyper Domain Name System) я работал в течении поледних двух лет.

Система уникальна. Посудите сами - в системе HDNS доменные имена мультиязычны, они могут состоять из словосочетаний и целых предложений, их можно склонять, и вообще у любого интернет-объекта (ноды) может быть неограниченное количество имен. В случае необходимости (если ваш запрс слишком неопределен) HDNS предложит пользователю контрзапрос, который поможет найти искомое....Кстати, HDNS решает и проблему "детского" интернета.

Но самое главное не в этом. Все ноды в HDNS связаны между собой семантически. Это значит, что результаты поиска в HDNS пертине́нтны (англ. pertinence) (т.е. более полно соответствуют информационным потребностям пользователя).

HDNS обладает достаточным потенциалом, чтобы стать основой семантического Web-а, о котором так много говорят в последнее время.

Однако кто тот добрый человек (или организация), которые пожертвуют несколько десятков человеко-лет для установки семантческих (смысловых) связей между нодами в HDNS ?

Эту проблема в HDNS решаема. При регистрации ноды (а регистрация предполагается бесплатной) пользователь осмысленно будет устанавливат эти семантические связи.

Впрочем, более подробно о HDNS можете прочитать на сайте проекта http://sites.google.com/site/servicehdns/   , а таже поучаствовать в дискуссии http://groups.google.com/group/group-hdns.

Проекту необходим умный инвестор. Спасибо за внимание.

Thumbs up +1 Thumbs down

2

Re: Семантическая организация доменных имен

Я злой человек --- не пожертвую. Ведь кнопка "I'm feeling lucky" Гугла _уже_ делает это. В случае Оперы достаточно добавить ещё одну поисковую машину, которая сформирует урло вида http://www.google.com/search?q=%D0%BC%D … amp;btnI=L и на этом всё.

Интерес может представлять расширение WordNet до PhraseNet и установление связей между PhraseNet, dbpedia и большими универсальными онтологиями. Задача большая, но зато с универсально полезным результатом, а HDNS станет просто маленькой примочкой на базе этого фрагмента LOD. "Маленькой" означает " в объёме студенческого курсовика".

3

Re: Семантическая организация доменных имен

Да и не просит никто жертвовать..... :-)

Логичней рассматривать HDNS лишь  как практический и реальный  инструмент, который позволит в массовом порядке подключить пользователей к формированию семанически связанному пространству доменных имен.

Ну а гугловское "мне повезет" - это на любителя

Thumbs up Thumbs down

4

Re: Семантическая организация доменных имен

Исходную идею (или, по крайней мере ее цели перечисленные в преимуществах (http://sites.google.com/site/servicehdns/) мне кажется, можно представить в виде смеси известных подходов

Сама задача мне кажется более интересной и финансово-привлекательной в случае, если она
1) в своей формулировке будет использовать существующие стандарты и библиотеки
2) будет нацелена на узкоспециализированный кусок интернета (локальной сети, спец сайты или интранет сегменты, распределенные соц/пиринг сети), - т.е. неГлобальна.
3) будет предлагаться как сервис / продукт с ясно прописанными USE CASEs.

BTW, Shanghai Tiger

Thumbs up +1 Thumbs down

Re: Семантическая организация доменных имен

Я заинтересовался этой идей. Сам я .Net программист.
На данном этапе вижу её полезность в качестве хорошой поисковой системы по сайту.
Если ли в открытом доступе алгоритм-библиотека, которую я мог бы попробовать в своих проектах?

Thumbs up +1 Thumbs down

6

Re: Семантическая организация доменных имен

Нет, к сожалению этого нет sad
Все пока существует на уровне идеи.....

Thumbs up Thumbs down

7

Re: Семантическая организация доменных имен

В вашей идее пока нету критериев, с помощью которых фонды или ангелы обычно  оценивают проект, - оценки команды, рынка, реализации. Более того, даже в техническом описании сильно размыты USE CASES.  Их нужно добавить.

Как вы  пишите, проект существует лишь на уровне идеи, поэтому в рамках инвестиций следует говорить о "посевной стадии" (http://blog.alpacom.ru/archives/10). Весьма помогло бы создание какого-то прототипа - пусть на весьма искусственном примере, пусть с весьма ограниченной семантикой, и пусть весьма медленном. Инвестору важно понять

  • (ПОЧЕМУ ВЫ) насколько вы / или ваша команда готовы что-то реализовать(вывать) на уровне структурированного описания, архитектуры, идей, и/или на уровне программирования.

  • (ОБЪЕМ ИНВЕСТИЦИЙ / КОНКУРЕНТНОЕ ПРЕИМУЩЕСТВО) насколько вы осознали техническую  реализуемость идеи и связанные с этим затраты (человеко-дни, привлекаемая экспертиза), насколько интересна ваша идея, какие есть конкурирующие технологии и компании

  • (ДОХОД/ ПРИБЫЛЬ) насколько сама идея ясна  и привлекательна с точки зрения рынка, в том числе в долгосрочном плане и с прописанными этапами.

Самое важное, если рассматривать вашу идею как инвестиционный проект, вы пока отчетливо не выписали, в чем состоят основные (пользовательские, бизнес) ценности вашего продукта / cервиса. Насколько они востребованы,  кем, и при каких условиях. Сколько и кто готовы за них платить.

Ниже мое понимание вашего проекта:

BTW, Shanghai Tiger

Thumbs up Thumbs down

8

Re: Семантическая организация доменных имен

Чтобы вы ни говорили,  на нижнем уровне находится именование по схеме XRI /i-names.
Смотрите по вашим же цитатам:

В качестве ноды может выступать организация, предприятие, фирма, документ, личность, и т. д. и т.п. (и только как частный случай – сайт).

Так это Reassignable XRI segments (i-name):

xri://broadview.library.example.com/(urn:isbn:0-395-36341-1)/(+softcover)
@Jones.and.Company/(+phone.number)

Далее вы пишите

В тоже время наименование ноды может быть не уникальным и может повторяться, а однозначная идентификация ноды достигается путем дополнительной информации

Для этих целей обычно используются persistent XRI segments (i-number):

@!280d.3822.17bf.ca48!78d2/!12

Итак, я считаю, что на нижнем уровне у вас XRI. И радостный факт состоит в том, что здесь все уже *почти* сделано до вас.

  • есть open source сервера (хотя их масштабирование не проверяли),

  • есть плагины http://foxri.sourceforge.net/

  • есть интеграция этих вещей с OpenID 2.0 и oauth.

  • есть платные и бесплатные (http://www.freexri.com/) сервисы регистрации i-names.

  • кое-что сделано по вопросу digital identity и представленных в виде XRI имен "профайлов пользователей". Например, service discovery over XRI (YADIS http://yadis.org/wiki/Main_Page ), когда автоматически определяется, что за identity протокол использовать для коммуникации с сервисом, представленном с помощью XRI URL.  Кстати, на тот же YADIS сайт вроде можно входить используя в качестве своего имени - XRI (i-name) и то же самое (http://yadis.org/wiki/Hosting_Yadis) можно сделать и для любого внешнего сайта....

Первый вопрос: КТО, В КАКОМ КОЛИЧЕСТВЕ, СКОЛЬКО И ПРИ КАКИХ УСЛОВИЯХ готов платить за XRI имена ? Насколько я слышал

  • бизнес у наиболее мощных XRI провайдеров в большей мере связан с предоставлением интегрированных решений Digital Identity (OPENID + ATTRIBUTE EXCHANGE, OAUTH, SIGNATURE) + XRI, а не отдельно XRI. 

  • XRI преимущественно используется для профайлов пользователей. Я не слышал примера сегмента сети (соц., пиринг), где бы все ссылки (а не только profile-based) были бы представлены в виде XRI и это ДАЛО бы ощутимые преимущества перед какими-то CUSTOM решениями или URL.

  • Очевидно, что заимев XRI, вы должны что-то с ним делать (или это же объяснить пользователю).   Суть XRI в том, что вы можете независимо, защищенно и легко управлять НАЗНАЧЕНИЕМ (резолвом) имен.  Гибче и быстрее, чем в DNS. Либо хотите управлять "более красивыми" (с метаданными) именами, чем представленными в URL. Если вы Digital Identity Provider (или являетесь владельцем ресурса),  то имеет смысл давать красивые имена. Если вы Dynamic DNS / Hosting Provider, то тоже возможно лучше давать XRI имена  (так как они  часто переназначаются).  Если вы владелец внутреней закрытой сети, то XRI имена нужны, так как вам нужно делать внутренний резолв (или на основе REST URL делать что-то похожее, но тогда все вопросы с переназначением и метаданными нужно переимплементировать). Вопрос в том, какой дополнительный смысл и BUSINESS VALUE приносит XRI, если вы не  имеете собственного ресурса, закрытой сети, хостинга. 

Мне кажется, что XRI у нас здесь - это прежде продукт или ВНУТРИ какого-то проекта, или сугубо технический проект. А тогда вопрос не столько в business value, сколько в scalability и хорошем уже готовом ядре и адекватной документации. Никто не цепляется или вкладывается в тех. проекты "без адекватного прототипа / решения".

Дальше по тексту вы вроде пропускаете другие достоинства XRI протокола, как то identifier management, explicit metadata, pear 2 pear assigning. И концентрируетесь исключительно на семантической составляющей... Отлично, предположим, что мы УЖЕ  стали использовать существующий стек технологий и решений для ИМЕНОВАНИЯ ресурсов (или вообще его отбросили), - поэтому проект редуцируется до использования семантической и сервисной составляющей ПОВЕРХ.

см. ниже.

BTW, Shanghai Tiger

Thumbs up Thumbs down

9

Re: Семантическая организация доменных имен

Ваша задача редуцируется до "ХОЧУ ПОСТРОИТЬ ПОИСКОВИК/ КАТАЛОГ, В КОТОРОМ БЫ САМИ ПОЛЬЗОВАТЕЛИ АННОТИРОВАЛИ СВОИ ДОБАВЛЯЕМЫЕ РЕСУРСЫ".

Вы предлагаете следующие аннотации (ниже самые интересные из них): geo-tag, timing, owner, возрастные / профессиональные / временные ограничения, доверительные отношения.

Вопросы

  • Какие конкретно выразительные возможности с точки зрения прикладной области, можно будет продемонстировать/реализовать в этих ограничениях

  • Каким образом ваша инфраструктура будет осуществлять защищенный (распределенный) контроль, валидацию, выполнение этих ограничений и хватит ли ей скорости / гибкости / простоты в реальном использовании

  • Какие конечные интеграционные технологии (markup, wiki, rest api, access  rules, owl) позволят вам интегрировать это решение в существующий технологический стек, сайты, языки.

На нашем сайте *кто-то* рассматривал вопрос 4G онтологий (как вовлекать пространство времени в вычисления). Понятно, что даже одно оно может эффективно позволить решать какие-то конкретные USE CASE (хотя и стоит их выписать)... Приведу красивую цитату (http://www.iph.ras.ru/~mifs/fraassen/Rel.html), относящуюся к физике,  "По отношению к времени некоторыми из наиболее важных отношений являются: одновременность, прежде, после и между... Теория времени должна дать объяснение этих отношений..., объяснить, что подразумевается под использованием этих временных терминов..., временных отношений порядка, длительности, метрики", - эту фразу можно переосмыслить к применению к онтологиям и вашему DHNS.

Самое странное или неожиданное, что провозглашение *ВОЗМОЖНОСТИ* (манипуляций вокруг ваших параметров аннотации)  -  не впечатляет ни меня, ни тем более инвесторов. Интереснее конкретный прототип или спецификации (с обоснованием реализации) - который демонстрирует как это сделать эффективно и какие USE CASE это может покрыть.

Аналогично с доверием (вокруг которого есть очень много заметок и работ, даже чисто алгоритмических).

Т.е. аннотации  интересны, и  такой проект может крутиться или как продукт (например, поверх того же Virtuoso), или в кластере, аналогично БОЛЬШИМ инфраструктурным проектам (как сейчас происходит с openID инициативами и стандартами безопасности в европе). Однако  во втором случае вам мало того, что нужно показывать конкретные статьи и наработки о реализации, будет нужно еще и убеждать гос./ венчур. в глобальной  важности этой темы.

Итак... по вопросу аннтотаций у нас  только декларации, поэтому переходим к семантике.

BTW, Shanghai Tiger

Thumbs up Thumbs down

10

Re: Семантическая организация доменных имен

Забыли про аннотации, забыли про XRI. Ни того, ни другого у вас нету. Мы просто хотим дать возможность пользователям ВВЕСТИ МЕТАДАННЫЕ, и ДЕЛАТЬ (МНОГОШАГОВЫЙ) СЕМАНТИЧЕСКИЙ ПОИСК ПО НИМ.

Здесь вы предлагаете три стандартных возможности.

1) Маппинг управляющих слов на онтологии в рамках поиска (относительно просто)

Ваша цитата.

Для удобства ввода (и обработки) информации могут применяться служебные слова (например предлоги «из», «для», и т. д.),

2) Морфологический анализ (реально, используя существующие лингв. и поисковые компоненты) - склонения и окончания в рамках запроса.
3) Семантический поиск, с влиянием аннотаций по самому клиенту (источнику запроса) на генерируемый системой результат - учитывать аннотации по геотаргетингу, регуляция точности выдачи информации в зависимости от настроек

В случае с поиском личностей промежуточные результаты поиска должны выдаваться с минимальной возможной точностью для предотвращения злоупотребления информацие

Насколько я помню, по последнему есть разные статьи (как поиск по зашифрованной базе, так и специфические расширения языков запросов)... Но здесь лучше меня подскажут оставшиеся товарищи.

Остался последний вопрос - у вас в центре - сам семантический поиск (все остальное витало вокруг) + технология понятийных координат (в т.ч. для многошаговости), поэтому..

BTW, Shanghai Tiger

Thumbs up Thumbs down

11

Re: Семантическая организация доменных имен

Просьба к участникам SWUG пояснить мне и автору, в чем   суть "Теории пространства понятий" http://www.taktaev.com/russian/cnp и какие преимущества при ее использовании возникают, по сравнению со ~"стандартным" выводом, используемом в ракурсе Semantic WEB.

Цитата с сайта

Несмотря на ряд, внешне близких концепций (семантические сети, проекты CYC, Semantic Web/OWL, фасетные каталоги, подробнее на http://www.taktaev.com/russian/cnp/), предлагаемая концепция координатного подхода, является передовой, оригинальной и представляется наиболее продуктивной, поскольку открывает возможность расчета смысловых расстояний, что необходимо в решении задач распознавания смысла и построении систем искусственного интеллекта. Более того, по мнению автора, именно отсутствие координатного подхода и не позволяет до сих пор решить задачи распознавания, связанные с учетом смыслового контекста, что является одним из основных препятствий на пути создания полноценных систем искусственного интеллекта.

BTW, Shanghai Tiger

Thumbs up Thumbs down

12

Re: Семантическая организация доменных имен

Как мне показалось, это старинная идея описать понятие набором "ортогональных" более-менее универсальных свойств. Уже не помню, из какого примитивного языка был пример: "маленький (а не большой) кусок (один отдельный) съедобного (а не ядовитого) мясного (а не растительного) бегает и шумит громко" --- собака. Для категорий с грехом пополам годится, для индивидуально определённых объектов выразительности не хватает совсем.

13

Re: Семантическая организация доменных имен

Прошу прощения, долго не мог присутствовать на форуме по причине высокой загрузке на работе...

Во первых очень признателен участникам iv_an_ru и xasima за внимание к моей идее. Я буду детально разбираться (для мня это действительно важно). Но я уже понял, что для достойного представления идеи инвестору необходима серьезная работа, и я её обязательно сделаю.

К сожалению, в конце года я не могу бросить все дела на основной работе (тем более, что на следующей неделе "светит"  еще одна командировка для утверждения проектных решений), поэтому появляться на сайте буду изредка.

Но пока есть немного времени, позвольте задать следующие вопросы участникам SWUG.

Xasima довольно методично разложил по полочкам идею HDNS - "....вот это реализовано в такой-то технологии, вот это - в такой-то, а вот здесь вообще можно брать алгоритмы почти без изменений и использовать, и вообще все  редуцируется до "ХОЧУ ПОСТРОИТЬ ПОИСКОВИК/ КАТАЛОГ, В КОТОРОМ БЫ САМИ ПОЛЬЗОВАТЕЛИ АННОТИРОВАЛИ СВОИ ДОБАВЛЯЕМЫЕ РЕСУРСЫ".....".

Однако, в связи с этим возникает вопрос: а почему все эти замечательные технологии и схемы (как то WordNet, Persistent addressing, Decentralized secured DNS, /i-names и т.д.) не используются в массовом порядке? Почему они лишь милые игрушки авторов и рядовой пользователь Интернета никак не может использовать эти технологии в своих целях? И вся эта мощь сводится к милой кнопке "мне повезет" в Google? Не кажется ли вам, что вектор усилий разработчиков приложен не к нужной точке?
И сможет ли HDNS стать той самой правильной точкой приложения усилий, ибо что может быть нужнее современному Интернету, чем построение единой системы семантически связанных доменных имен?

Кстати, а не кажется ли вам тогда, что утверждение - "ХОЧУ ПОСТРОИТЬ ПОИСКОВИК/ КАТАЛОГ, В КОТОРОМ БЫ САМИ ПОЛЬЗОВАТЕЛИ АННОТИРОВАЛИ СВОИ ДОБАВЛЯЕМЫЕ РЕСУРСЫ" несколько утрированно? smile


PS. Краткое описание HDNS для инвестора выложу в ближайшее время на сайте проекта.

Thumbs up Thumbs down

14

Re: Семантическая организация доменных имен

> Уже не помню, из какого примитивного языка был пример: "маленький (а не большой) кусок (один отдельный) съедобного (а не ядовитого) мясного (а не растительного) бегает и шумит громко" --- собака.

Вдогонку. Я не помню, а жена помнит. Язык --- ба-урук-гым-ня, а собака, соответственно --- тыгы-дым-ля-хаш-ба-ори smile

15

Re: Семантическая организация доменных имен

???

Thumbs up Thumbs down

16

Re: Семантическая организация доменных имен

Однако, в связи с этим возникает вопрос: а почему все эти замечательные технологии и схемы .... не используются в массовом порядке?

Здесь несколько составляющих.

  • Само окружение (общество, рынок), в котором планируется использовать технологию,  иногда не вполне готово для ее принятия. Например, OpenID не имеет смысла пока   нету самой задачи централизованного входа в несколько ресурсов (пользователь пользуется входом лишь на 1-2 сайтах). Интернет (HTTP + HTML) не имел слишком большого смысла для обывателя, пока в нем не было ресурсов, важных и локализированных под потребности пользователя.  Веб2.0 (как порождаемый пользователями контент) не имел смысла пока этих пользователей или время их доступа   было мало для возникновения "сетевых" эффектов.

  • Сами технологии плохо согласуются с целями индивидуальных участников или компаний. Пример - нерешенность паритетного разделения доходов от рекламы и вследствие, экономическая нецелесообразность пускать под логином (exposed as OpenID) одной соц. сети пользователя на чужие соц. сети. Либо привнесение технологией "слишком малого" с точки зрения business value, чтобы было экономически оправдано что-то менять. Например, REST API для обычного сайта, не сфокусированного на сервисы, - вещь приятная, но как бы и бесполезная с т.з.  business value  Так же как и бесполезен юзабилити аспект приложения, поставляемого игроком-монополистом,  - ведь  "возьмут и такое неудобное".

  • Сложность вхождения, интеграции, технические, правовые или аспекты безопасности самой технологии. Небольшое число конечных (пользовательский) решений или простых средств интеграции. Неготовность существующих инфраструктур для развертывания. Например - поставить "весь такой замечательный и готовый java фреймворк для semantic web, который сам все сделает за вас" на обычные хостинги на которых СЕЙЧАС крутиться только LAMP стек... Отсутствие пользовательской документации и пользовательской базы. Маркетинг.

И сможет ли HDNS стать той самой правильной точкой приложения усилий... современному Интернету


это можно понять только по прототипу.

BTW, Shanghai Tiger

Thumbs up Thumbs down

17

Re: Семантическая организация доменных имен

это можно понять только по прототипу.

да, это  безусловно правильно

xasima, спасибо

Thumbs up Thumbs down

18

Re: Семантическая организация доменных имен

> И сможет ли HDNS стать той самой правильной точкой приложения усилий, ибо что может быть нужнее современному Интернету, чем построение единой системы семантически связанных доменных имен?

Вопрос соотношения денег и полезного выхлопа. Выхлоп не очевиден, а денег на вытеснение обычного DNS надо весьма и весьма много.

19

Re: Семантическая организация доменных имен

Хм....15000 просмотров....чего-то многовато.....

кстати, раз я здесь. вот вам на обсуждение

Аксиомы имен нодов HDNS, или каким в идеале должно быть доменное имя

   1. Имя ноды состоит из одного и более чем одного слова. Максимальная длина имени ноды ограничена только протоколом передачи, как частный случай - протоколом http;
   2. Имя ноды мультиязычно, в том числе в одном имени ноды могут присутствовать слова на разных языках;
   3. Имя ноды мультикодировочно;
   4. Имя ноды может существовать в любом лице, числе, склонении и в любых других словоформах;
   5. У каждой ноды может быть неограниченное количество имен;
   6. Имя ноды содержит любые знаки алфавита, цифр и пунктуации, за исключением знака точка;
   7. Ноды имеют семантические (смысловые) связи;
   8. Существует минимально необходимые связи нодов (связи с геонодами и хрононодами). Связи могут устанавливатся регистратором ноды - при регистрации ноды, системой HDNS - при работе;
   9. Количество связей нодов не ограничивается;
  10. Ноды могут иметь принудительные связи (к примеру с нодами ограничения), которые устанавливаются ситемой HDNS.

Примечание. Здесь и далее под словосочетанием "имя ноды" понимается имя ноды в HDNS.

Скоро в сети заработает прототип HDNS. Желающие потестить прототип - оставляйте заявки в группе http://groups.google.com/group/group-hdns. Пока точка входа в HDNS будет работать только в Google Chrome.

Отредактировано Сергей (2010-04-02 08:06:09)

Thumbs up Thumbs down