Автор работы: Пользователь скрыл имя, 23 Мая 2013 в 21:05, реферат
Интернет – это информационное пространство, в котором можно отыскать ответ практически на любой интересующий пользователя вопрос. Это огромная глобальная сеть, в которую как информационные ручейки стекаются потоки более мелких сетей
Оператор |
Полное обозначение |
Сокращённое обозначение |
ИЛИ |
OR |
| , пробел |
И |
AND |
& + |
НЕ |
NOT |
~ |
В языке запросов обычно
один значок оператора означает его
действие в пределах абзаца, а два
подряд - в пределах всего текста.
Скобки.При построении
запросов иногда возникает необходимость
объединения слов запроса в группы, которые
будут аргументами некоторого оператора.
Такие группы заключаются в скобки. Как
правило, в большинстве поисковых машин
используют только скобки вида ( ). Часть
запроса, заключенная в скобки, сама является
запросом, и на нее распространяются все
правила языка построения запросов. Использование
скобок позволяет строить вложенные запросы
и передавать их операторам в качестве
аргументов, а также перекрывать приоритеты
операторов, принятые по умолчанию.
Кавычки.Для
поиска цитат можно использовать типовые
(двойные) кавычки, вида « или “. Слова
запроса, заключенного в двойные кавычки,
ищутся в документах именно в том виде
и в том порядке, как они были заданы в
запросе. Это весьма эффективный способ
поиска. Его применение обеспечивает успешность
более 60%. Здесь важно учитывать только
два момента. Во-первых, цитирование должно
быть точным, т.е. без изменения по падежам,
числам и лицам, во-вторых, материал, который
вы ищите, как минимум должен быть в Интернете.
Если при такой форме поиска будет допущена
грамматическая ошибка, поиск даст отрицательный
результат.
Таким образом, двойные кавычки можно
использовать и просто для поиска слова
в заданной форме (по умолчанию слова находятся
во всех формах). Например, запросу: <поезд
"прибыл" посадка> удовлетворяет
документ, содержащий текст '... поезд прибыл
для осуществления посадки пассажиров
...', и не удовлетворяют документы: с '..
поезд подошел к платформе для посадки
пассажиров ...', или '… поезд был подан
для проведения посадки пассажиров…'
и т.п.
Метасимволы или
маски.Далеко не всякая поисковая
машина может поддерживать поиск строк
с использованием метасимволов ('*', '?'),
которые обычно используются в значении
"любая подстрока" и "произвольный
(любой) одиночный символ" соответственно.
Тем не менее, эти операторы нередко бывают
зарезервированы для подобного использования
в будущем.
Рассмотрим конкретный пример. Откроем
в браузере начальную страницу поискового
сервера Яндекс. В поле поиска введём ключевые
слова, например, «информатика учебники
тесты CD-ROM», либо «информатика&учебники&тесты&
ПРИМЕР
Теперь зададим в поле
поиска следующую фразу: «информатика|учебники|тесты|
ПРИМЕР
Используя оператор NOT, введём в поле поиска следующую фразу: «информатика ~учебники тесты CD-ROM»/ В результате будет найдено 3695907 страниц и не менее 4056 сайтов, которые будут содержать ключевое слово «информатика» с исключением слов, стоящих в запросе после значка «~».
ПРИМЕР
Яndex также позволяет использовать вместо слов целые логические выражения, при этом его необходимо заключить в скобки. Используя наш пример, введём в поле поиска следующее выражение: (информатика учебники) тесты CD-ROM. В результате поиска будет найдено 3564 страниц и не менее 701 сайта, содержащие в себе такую группу слов как (информатика учебники).
ПРИМЕР
Теперь найдем фразу, для этого введём в поле поиска следующее выражение: «мороз и солнце, день чудесный». В результате этого поиска будет найдено 14195 страниц и не менее 756 сайтов.
ПРИМЕР
При поиске информации в
Интернет очень важно учитывать
морфология языка запросов. По каждому
слову запроса поиск ведется
с учетом правил словоизменения соответствующего
языка. Поисковая машина «понимает»
и «различает» слова русского и английского
языков - по умолчанию. Поиск ведется, с
учетом изменения по склонению, спряжению,
числу и лицу, т.е. по всем формам слова;
включая даже совпадающие по смысловому
значению. Например, при поиске по слову
машина будут также найдены документы,
содержащие слова 'о машине', ' промашину',
'машиной', и т.п., но и, что особенно важно,
даже слова 'машины', 'машинам', 'машин' окажутся
соответствующими запросу. Чтобы провести
поиск только по одной строго определенной
форме слова, нужно взять его в двойные
кавычки или воспользоваться знаком "!".
Также существуют некоторые слова и символы,
которые по умолчанию исключаются из запроса
в связи с их малой информативностью. Это
- самые частотные слова русского и английского
языков, например, предлоги, частицы и
артикли. Очень часто опускаются апострофы
и тире. Большинство поисковых машин их
знают и сами освобождают от них сформулированный
Вами запрос. Это связано с тем, что факт
присутствия этих слов может заметно замедлить
поиск и отрицательно повлиять на его
результат и полноту, а, в конечном итоге,
и успешность. В тоже время есть возможность
обозначить необходимость этих слов в
запросе. Для этого, следует взять запрос
в двойные кавычки или воспользовавшись
поиском точной фразы в расширенном поиске.
Существует также поиск, с помощью ограничения
расстояния. Например, если запрос составлен
из нескольких слов без применения операторов
и конструкций языка запросов, то машина
будет пытаться найти документы, в которых
встречаются все слова запроса. При этом
для каждого запроса всегда вводится так
называемое ограничение контекста - положительное
число. По умолчанию принимается расстояние
равное 40 словам. Документ, в котором встретились
все слова запроса, будет выдан только
в том случае, если расстояние между словами
запроса будет меньше этого числа. В поисковых
системах есть возможность задавать порядок
следования и расстояние между словами.
Расстояние между словами А и В равно:
1 ( В следует сразу за А ), 2 ( В следует за
А через одно слово ) и т. д. Или -1 ( В стоит
перед А ), -2 … Знак "/" между словами,
за которым стоит число, означает, что
расстояние между ними не должно превышать
этого числа слов.
Например, нам необходимо найти документы,
в которых будут содержаться слова «информатика»
и «учебники», и расстояние между ними
не должно превышать 2 слов. Для этого введём
в поле поиска следующее выражение: "информатика/2учебники".
В результате по нашему запросу получим
9 страниц и не менее 5 сайтов
ПРИМЕР
Если же мы немного изменим
наш запрос - информатика/(+1+4)учебники
– то мы получим документы, в которых
данные ключевые слова будут идти
друг за другом в таком порядке
на расстоянии от 1 до 4 слов.
Очень часто приходиться также проводить
поиск уже в найденной информации, т.е.
можно осуществить поиск по документам,
найденным по предыдущему запросу. Для
этого в конце запроса нужно поставить
"$$" или просто сделать отметку в
окошке "поиск в найденном", расположенном
на странице запроса. Эта функция очень
удобна для последовательного сужения
поиска.
Язык поисковой машины Яndex обладает наиболее
полным набором возможностей в русскоязычном
поиске, поэтому, освоив его, вы без труда
сориентируетесь в языке запроса любого
другого средства поиска.
Владение пользовательскими инструментами и техникой
Заключение
В заключении хотелось бы определить базовый алгоритм поиска.
Современному человеку необходимо
уметь проводить поиск в