Автор работы: Пользователь скрыл имя, 04 Ноября 2012 в 20:39, реферат
В основе исследований в области искусственного интеллекта лежит подход, связанный со знаниями. Опора на знания — базовая парадигма искусственного интеллекта. Как и многие фундаментальные научные категории (например, алгоритм, интеллект, деятельность и т. д.), понятие «знание» относится к интуитивно определяемым. В БСЭ дается следующее его толкование: «Знание — проверенный практикой результат познания действительности, верное ее отражение в сознании человека. Знания бывают житейскими, донаучными, художественными, научными (теоретическими и
Можно будет также создать неких персональных агентов, чтобы употребить всю мощь Сети на пользу конечному пользователю. Например, такой персональный агент вполне мог бы провести подготовку к празднованию дня рождения, получив лишь минимальные входные данные от пользователя (рис. 3). Подобный агент мог бы скомбинировать сервисы по заказу товаров, их покупке и доставке самостоятельно, преследуя поставленную перед ним пользователем на языке высокого уровня цель — подготовку праздника. Когда такие вещи будут делаться автоматически, пользователь сможет экономить как время, так и деньги [2].
Рис.3. Использование Семантической сети персональными агентами.
Превращению Интернета в семантическую сеть способствует и Военное научное агентство DARPA. Оно разрабатывает новый язык программирования DAML (DARPA Agent Markup Language), основанный на XML. Он предназначен для детального описания смысла хранимой на Web-странице информации. Рабочая версия DAML появится летом, и DARPA надеется, что консорциум утвердит W3C в качестве стандарта. Предполагается, что DAML послужит существенным стимулом для превращения Интернета из "свалки" информации в семантическую Сеть.
DAML позволит Web-агентам и
поисковым системам
Другое преимущество DAML – возможность унификации жаргонных выражений, применяемых в разных областях промышленности и относящихся к одному и тому же технологическому элементу.
Еще одним важным проектом
в сфере семантического веба является
DBpedia.org. Авторы этого проекта формализовали
(привели к одной форме) данные Википедии,
а доступ к базе данных открыли. Данные
эти связаны, в результате можно делать
запросы и получать очень интересные результаты.
Так, в конце сентября был запущен фасетный
поиск на данных, которые DBPedia извлекла
из Википедии. Проект делался совместно
с немецкой поисковой компанией Neofine и
находится здесь: http://dbpedia.neofonie.de/
Таким образом, теперь для
ответа на вопросы типа «Какие ученые
родились в России в период с 1900 по
1910 год» достаточно использовать соответствующие
фильтры в интерфейсе поисковика
от DBPedia и Neofine: http://dbpedia.neofonie.de/
Рис. 4. Пример запроса в DBpedia.
ReadWriteWeb опубликовал свою версию топ 10 Semantic Web продуктов за 2008 год [3]:
1. Yahoo! SearchMonkey
Продукт от Яху позволяет получать структурированный контент прямо на SERP (Search Engine Result Page). Работает это следующим образом:
- Cоздатель сайта добавляет RDF разметку в XHTML или использует микроформаты, задавая таким образом семантику на странице. Также можно выгружать семантическую информацию роботу Яху в виде xml feed.
- Любой разработчик, в
том числе и создатель сайта,
может написать небольшое
- Любое разработанное
приложение можно расшарить
В общем, персонализация (которой, правда, мало кто будет пользоваться, наверное) и семантизация в одном продукте, причем от одного из гигантов интернет-поиска. Однозначно можно согласиться с ReadWriteWeb, поставившем его на первое место среди Semantic Web продуктов в этом году.
2. Powerset
Один из двух самых известных семантических поисковиков (2-й – Hakia – тоже попал в наш топ, речь о нем пойдет чуть ниже). В этом году в июле состоялась сделка, в результате которой Powerset был куплен Майкрософтом. Следов сильной интеграции поисковика и продуктов от Майкрософт пока не видно, разве что на странице результатов поиска появилась кнопка «Try this search on Live Search».
Powerset позиционирует себя как поисковую систему, умеющую извлекать факты. Существенным ограничением является то, что пока он умеет работать только с двумя источниками, причем очень качественными: википедией и социальной базой знаний freebase.
В результатах иногда случаются
накладки, например по запросу «Vladimir
Putin» (http://www.powerset.com/
3. Open Calais
Reuters в конце 2007 года купила ClearForest, которая занималась разработкой Open Calais. В этом году они выпустили Open Calais API, позволяющее через web-сервис извлекать из переданного текста людей, компании, события и места. Поддерживается только английский язык:( Пример использования API есть в книге Practical Artificial Intelligence Programming With Java.
В настоящий момент на сервисе уже зарегистрировано более 6000 разработчиков и выполняется больше 1 миллиона транзакций в день.
4. Dapper MashupAds
Сервис для создания семантической рекламы от Dapper реализует подход сверху вниз, при котором сам пользователь указывает какие поля что означают на его сайте и создает рекламу, в отличие от традиционных алгоритмов контекстной рекламы, которые автоматически по содержимому страницу принимают решение о том, какие объявления размещать на этой ней. Сделать это можно за 10 минут (смотрите видео).
Благодаря технологии можно создать такую рекламу, которая, например, по рецепту блюда предложит купить все его ингридиенты в одном месте.
Реализовано все на базе
потрясающего воображение сервиса
для создания mashup’ов dapper.net. Вы просто
указываете шаблоны страниц с интересующим
вас содержимым, отмечаете интересующие
вас поля и создаете из этого компонент
в одном из многочисленных поддерживаемых
форматов (flash widget, rss, xml, html). За 5 минут можно
создать сервис, который отдает текущее
содержимое тизера на морде Яндекса: http://www.dapper.net/
5. Hakia
Hakia один из поисковиков, фокусирующихся на методах NLP (Natural Language Processing) для того, чтобы предоставлять пользователю наиболее значимые результаты. Они лицензировали свою внутреннюю технологию OntoSem для использования другими компаниями и открыли Semantic API, которое помимо поисковых возможностей позволяет с помощью Summarizer’a по тексту или его url’у получить сниппет.
Hakia использует поисковый индекс от Yahoo! Boss, что позволяет им искать по всему мировому интернету.
На мой взгляд, выдача Hakia еще требует существенного улучшения в плане релевантости.
6. TripIt
Классный сервис для огранизации путешествия. Вы просто форвардите все входящие подтверждения о бронировании на адрес plans@tripit.com и сервис берет на себя все остальное.
Правда, если письма не на английском языке или от неизвестного провайдера, то могут возникнуть определенные проблемы.
7. BooRah
BooRah – агрегатор обзоров и отзывов на рестораны, использующий семантический анализ и методы NLP для сбора информации из блогов о еде. BooRah распознает похвалу и критику в обзорах и соответствующим образом ранжирует рестораны. Недавно они также открыли API, позволяющее по ресторану получить его рейтинг, обзоры, меню, скидки и т.п.
Впечатляющий сервис, жаль, что пока только для США.
8. BlueOrganizer (AdaptiveBlue)
Основным продуктом компании AdaptiveBlue является плагин к Firefox BlueOrganizer, который анализирует информацию на посещаемых вами web-страниц и предлагает полезные ссылки и действия, в зависимости это ее содержимого.
В течение года они работали над новым продуктом Glue, позволяющем осуществлять социальный браузинг. Например, если вы находитесь на странице книге, то видете с помощью плагина, что о ней думают ваши друзья.
9. Zemanta
Zemanta – инструмент для блоггинга, предлагающий добавить релевантное содержимое к посту, во время его написания. В сентября они проапргейдили сервис и теперь позволяет блоггерам самим выделять интересующие их источники для Zemanta.
10. UpTake
Вертикальный туристический поисковик нацелен на облегчение процесса выбора отелей и бронирования поездки. С помощью семантических технологий UpTake извлекает информацию о более чем 400 000 отелей из более чем 1000 источников. Но все это опять-таки только для США.
Технологии семантического
веба могут быть использованы в разных
прикладных областях. Например: в области
интеграции данных, чтобы данные из
разных источников и в разных форматах
можно было использовать в одном
приложении; в области выявления
и классификации ресурсов из определенной
предметной области для более
качественного поиска; в области
каталогизации содержимого веб-
Список источников.
http://paulcowles.ulitzer.com/
http://ezolin.pisem.net/logic/