Интересно и полезно!

Давайте посмотрим что такое URL, зачем он нужен и из каких частей состоит. Как вы знаете, поисковые системы производят индексацию сайтов ни как единого целого, а как совокупность отдельных web страниц. Ну так вот, любой документ (web страница) в сети интернет имеет свой уникальный адрес, который очень часто называют аббревиатурой URL (урл), которая расшифровывается как Uniform Resource Locator (определитель местонахождения ресурса). URL, равно как и протокол HTTP, а так же как и язык гипертекстовой разметки Html с валидатором W3C, был разработан и создан одним и тем же человеком — Тимом Бернерсом-Ли (отцом основателем проекта Всемирная паутина WWW — World Wide Web). По большому счету URL является частным случаем другого идентификатора под названием URI (Uniform Resource Identifier — унифицированный идентификатор ресурса). URL адрес — это способ однозначно указать на что-то в интернете. URL используется не только для работы с сайтами по протоколу http, но нас, конечно же, будет интересовать именно применение идентификатора URL применительно к Web (протоколы http и https). Например, URL применительно к Web будет выглядеть примерно так (чуть ниже я приведу общую блок-схему построения URL, но пока хотелось бы начать с простого частого примера):

http://hatypova.blogspot.com

В этом примере URL часть «http» обозначает протокол передачи данных или же, если следовать терминологии спецификации URL, схему (ибо тот же mailto не является протоколом передачи данных, в отличии от http или ftp, но используется в URL адресах). Далее в приведенном примере URL адреса следует «hatypova.blogspot.com» (или же это может быть «www.hatypova.blogspot.com») — это так называемое доменное имя или же имя узла (хоста). В Web-е есть специфика обозначения доменного имени в URL адреса сайта — доменное имя может быть с WWW или без WWW. Т.е. для поисковиков сайты с WWW или без WWW являются абсолютно разными и без их склейки, ссылочная масса будет делиться между ними в неизвестной вам пропорции. WWW в URL адресе по своей сути — это некий атавизм, который делает ваше доменное имя второго уровня доменом третьего. Ничего плохого в использовании WWW в URL адресе сайта нет, но нужно четко определить главное зеркало (через Яндекс Вебмастер и через Гугл Вебмастер, а так же через прописывание директивы Host в файл robots.txt вашего сайта), которое будет индексироваться поисковиками и которое будет участвовать в ранжировании.

Та часть URL, которая расположена за третьим слешем (/) — в нашем примере это «papka/fail.html», называется путем до конкретного документа или файла. В нашем случае — это документ «fail.html», который лежит в папке «papka», которая в свою очередь лежит в корневой папке сайта (корне сервера, который в URL всегда соответствует третьему слешу).

Но это еще не все, что может быть записано в URL адресе. Посредством URL различные движки сайта (CMS) передают так называемые GET параметры, которые добавляются в самый конец URL адреса веб страницы после простановки знака вопроса, например, так:

http://www.ktonanovenkogo.ru/papka/fail.html?print=yes

(даже по трем — еще и http://ktonanovenkogo.ru/) и в любом случае откроется главная страница. Это довольно плохо, т.к. поисковики найдут у меня три разных страницы (имеющих с их точки зрения разные URL адреса), но с одинаковым содержанием, что поисковикам ох как не нравится. Поэтому у меня сделано так, что при вводе любого из приведенных чуть выше URL адресов будет выполнено перенаправление на URL вида «http://ktonanovenkogo.ru/». Делается это, как правило, с помощью 301 редиректа в файле .htaccess, либо напрямую в настройках сервера вами самими, либо вашим хостером.

Интересно и полезно!

суббота, 19 мая 2012 г.

Комментариев нет:

Отправить комментарий

суббота, 19 мая 2012 г.

Комментариев нет:

Отправить комментарий

суббота, 19 мая 2012 г.