Как найти на сайте ссылку на файл

Обновлено: 06.07.2024

Отыскать чужие исходящие ссылки в теле сайта бывает очень непросто. И задача существенно усложняется, если веб-мастер не обладает должным опытом, не знает структуры своего ресурса и не может самостоятельно точно и быстро найти «леваки».

Убеждаемся, что на сайте есть левые ссылки

Проверить сайт на внешние ссылки можно с помощью программы XENU, которая детально описана в пошаговых инструкциях. Только открывайте ссылки в новых вкладках (клик по колесику мышки на ссылке или через правую клавишу мышки), чтобы не закрыть эту инструкцию. Либо возвращайтесь сюда позже, после изучения прошлых тем:

1. Проверить битые ссылки: скачать и установить программу XENU
2. Проверить битые ссылки XenuИли любым другим способом. Например, с помощью Вебмастера.Яндекс, сервиса pr-cy, визуального просмотра кода и др.

Убеждаемся, что FTP соединение настроено и работает

Вторым важным шагом является настройка ФТП связи с сервером, на котором расположен сайт. О том, как это сделать, детально описано в пошаговой инструкции:

При этом подключиться можно и через файлменеджер хостинга, и через любой другой FTP-клиент.

И если предыдущие условия выполняются, на сайте присутствуют левые ссылки, которые сложно найти в ручном режиме, если мы можем работать с ресурсом по соединению FTP, а на компьютере установлен архиватор WinRAR, приступаем к действиям!

Как найти файлы с левыми ссылками на сайте: пошаговая инструкция

Как уже было сказано выше, данный метод не слишком быстр, но отыщет в коде почти 98% ваших левых ссылок. И здесь важно понимать разницу

Мы ищем зараженные файлы, а не сами ссылки.

Адреса левых ссылок мы узнаем заранее из результатов сканирования программы XENU.

1. Подключаемся к сайту по FTP и открываем корневую папку.

2. Создаем на компьютере специальную папку, в которую копируем ВСЁ содержимое своего сайта:

1394725566_kak-nayti-levye-ssylki-v-kode-1.jpg

Примечание: копирование файловой структуры сайта с хостинга выполняется точно так же, как и копирование простых документов, папок, файлов. Если вы пользуетесь TotalCommander, для копирования нужно:

3. Как только копирование будет завершено, все эти документы и материалы НА КОМПЬЮТЕРЕ нужно заархивировать стандартным WinRAR. Для этого:

1394725606_kak-nayti-levye-ssylki-v-kode-2.jpg

1394725624_kak-nayti-levye-ssylki-v-kode-3.jpg

Примечание: ваши действия могут отличаться от вышеуказанных.

1394725599_kak-nayti-levye-ssylki-v-kode-4.jpg

1394725569_kak-nayti-levye-ssylki-v-kode-5.jpg

1394725559_kak-nayti-levye-ssylki-v-kode-6.jpg

1394725559_kak-nayti-levye-ssylki-v-kode-7.jpg

8. Дальнейшие ваши действия будут идти по схеме:

Говоря проще, если файл style.css лежал глубоко в структуре файла, то и поместить его нужно на прежнее место(. ), а не просто в главную директорию сайта.

Именно так, пусть медленно, зато надежно, мы отыскиваем каждый отдельный посторонний линк, открываем соответствующий файл и удаляем ссылку, которая проставлена спамерами, хакерами, мошенниками или рекламщиками. Удаление таких ссылок улучшает позиции сайта в выдаче и способствует скорому продвижению к вершинам ТОП.

Кстати, и не забывайте возвращать исправленные чистые файлы обратно на сайт, предварительно сохранив резервную копию!

Послесловие: данная пошаговая инструкция окажется нерабочей лишь тогда, когда внешняя ссылка берется из стороннего источника. В этом случае необходимо найти тот линк, который и запрашивает новообразованную ссылку, а это немного другие процедуры.

Я совсем не специалист, но надеюсь, что здесь мне смогут помочь. Прошу прощения, если вопрос "мимо".

Как можно посмотреть все, в том числе и скрытые ссылки на чужом вебсайте и конкретно на одной странице? Есть полученный случайно доступ к некоторым ссылкам со спрятанным контентом, который не отображается ни на странице сайта, ни в поиске по сайту, ни в гугл поиске по содержимому сайту, но прямой доступ по ссылке нет, а в каталоге, в котором эта ссылка должна быть, ее не видно. Хотелось бы посмотреть все скрытые ссылки, но не получается, все сервисы выдают только открытый контент.

Простой 1 комментарий

hitasu

Смотря как и чем " спрятанный"
для ламеров, юзеров и прочих начинающих халявщиков есть несколько (по степени трудоёмкости) вариантов

1 - синтаксис/операторы запроса в поисковой системе
в поисковой строке набрать по следующему шаблону " [содержимое][пробел]site:[адрес домена/сайта]
*пример поиска слова "скидка" по сайту(корневому домену) site.ru - "скидка site:site.ru" данный синтаксис просканирует доступные страницы для просмотра и покажет все страницы в которых присутствует слово "скидка"
*пример поиска файлов с любым названием но только с расширением pdf - ".pdf site:site.ru" как вариант *.pdf всё зависит от конкретной поисковой системы. Как следствие можно играться - "название." Соответственно будет искать файл с любым расширением но с названием название. так же есть синтаксис который позволяет искать как в названии так и в расширении файла часть этого названия/расширения.

2 - Специализированные программы закачки сайта полностью
так как я понятия не имею о вашей платформе искать вам нужно такими запросами - "site download", "site sucker" site как вариант заменить web

3 - Ну и как тут уже писали ранее, зайти в исходный код страницы, что зависит как от платформы/ОС так и от конкретного браузера.

В принципе если файл вообще существует а не редирект этого файла на каком то ресурсе, файл достать всегда можно. Однако на всякую хитрожо..ую хитрость найдутся методы защиты. Делайте собственный уникальный контент, ибо за кражу, плагиат и копипаст, по рукам будут давать всё чаще и чаще, и просто жалобой уже не отделаетесь.

RTFM. кибер сопляки. RTFM
Халява переоценённый и насквозь утопичный фактор. Так или иначе платить придётся.

Команда Discript подготовила несколько практических советов по работе с программой Screaming Frog SEO Spider (в народе “фрог” или “лягушка”).

Сразу уточним, что для получения точного результата все манипуляции проводим только после полного сканирования сайта или раздела.

И начнем нашу рубрику с внутренних ссылок.

Как узнать все входящие внутренние ссылки на страницу?

При работе с сайтом часто бывает нужно выяснить сколько внутренних ссылок имеет страница, откуда они и какие имеют анкоры.

Получить данную информацию можно несколькими способами.

Способ первый. Используем интерфейс программы.

Первые данные можно найти на вкладке “Internal” столбец “Inlinks” .

Число напротив каждой страницы и есть, количество внутренних ссылок, ведущих на нее.

Рядом находится столбец “Unique Inlinks” - количество уникальных внутренних ссылок ведущих на страницу, т.е. если с одной страницы на нашу стоит несколько ссылок, засчитана будет только одна.

Следующий интересный столбец - это “% of Total”, показатель того, какой процент страниц от общего числа найденных страниц на сайте ссылается на нашу страницу.

Оценив эти параметры, можно понять, насколько весома страница в рамках всего сайта.

Отсортировав столбец “% of Total” по возрастанию, можно увидеть список страниц, которые имеют малый внутренний вес. Если важные страницы имеют менее 5 % (на самом деле число приблизительное и может варьироваться для разных сайтов в диапазоне от десятых долей процента до более чем 50%), требуется как для продвижения, так и для чисто пользовательского удобства, продумать способ по увеличению количества внутренних ссылок.

Для получения информации о том, какие именно страницы ссылаются на интересующую нас, кликаем по строке с этой страницей, далее в нижнем окне выбираем вкладку Inlinks, тут мы получим список всех доноров, на которых есть ссылки на анализируемую нами страницу.

Также в этой вкладке есть информация об анкорах ссылок. Это может быть полезно, если мы пытаемся определить причины снижения позиций страницы и у нас есть подозрения на переоптимизацию, либо если мы хотим оценить и скорректировать внутренний анкор лист страницы. Да и просто поиск ссылки на странице доноре становится проще, когда ты знаешь ее анкор.

Примечание: возможна ситуация, когда страница есть, но внутренних ссылок на нее 0, т.е. в колонке Inlinks указано 0 ссылок. Причин может быть несколько и если кликнуть по такому URL и выбрать вкладку Inlinks в нижней панели, то Screaming Frog заботливо нам подскажет все возможные варианты:

  • Первый URL в сессии
  • URL загружен в режиме “List” (режим когда вручную загружается список страниц)
  • Ссылки на страницу находятся в атрибуте canonical
  • URL с ссылкой был удален
  • URL был пересканирован

Все эти моменты разберем отдельно, в одной из следующих статей.

Способ второй. Используем выгрузку.

Программа SFSS хороша тем, что любые данные из нее можно получить в виде .csv файлов, которые удобно обрабатывать в Excel.

Не исключение и входящие внутренние ссылки. Причем сделать это можно как целиком для всех страниц сайта, так и по отдельности для различных типов внутренних ссылок, но обо всем по порядку.

Получаем все внутренние ссылки на все страницы сайта.

Для получения ссылок в формате .csv нажимаем на “Bulk Export” в верхнем меню и выбираем “All Inlinks” , он будет первым в выпадающем меню.

Программа предложит скачать файл. Полученный CSV файл открываем с помощью Notepad++. Копируем полностью содержимое и переносим в Excel файл. Сделать это нужно для того, чтобы устранить возможные проблемы с кодировкой и не получить вместо кириллических символов - кракозябры.

В этой статье мы с вами поговорим о скрытых исходящих ссылках на сайте (никто не застрахован от этой напасти), научимся их находить и безболезненно для себя удалять.

Не очень давно, я уже писал о проблематике исходящих ссылок в этой статье. Там же рассмотрены способы их закрытия метатегами и java скриптом.

Но как быть с паразитами, которые пробрались на сайт обманом, скрыты от глаз человека, откуда они вообще берутся, как их найти и ликвидировать.

У вас наверное уже чешутся руки побыстрее приступить к поиску скрытой напасти (или убедиться в ее отсутствии) на сайте и, ликуя, уничтожить пакость. Весь вопрос в том, как это сделать. Для начала узнаем врага поближе.

Какие бывают скрытые ссылки

Рассмотрим и разберем самые распространенные способы сокрытия кровососов, их всего два.

В этом случае ссылку, кроме того что она уже невидима, еще и кодируют.

В браузере ее не видно, но только не в исходном коде как и в первом случае. А в одном из сотен файлов, куда ссылка установлена, она будет состоять из такой пугающей конструкции:

<!--?php $str='PGEgc3R5bGU9ImRpc3BsYXk6IG5vbmU7IiBocmVmPSJodHRwczovL3dvcmRwcmVzcy1ib29rLnJ1Ij7Qo9GH0LXQsdC90LjQuiBXb3JkUHJlc3M8L2E+'; echo base64_decode($str); ?-->

Я вставил вышеуказанный код в footer.php этого блога и вот что получилось:

Делается это для того, чтобы максимально затруднить администратору ресурса обнаружение и поиск гидры.

Просто скопируйте код, заключенный в одинарные кавычки, вставьте его в верхнее окошко формы и нажмите на зеленую кнопку <DECODE>.

Сервис умеет не только раскодировать, но и кодировать ссылки (вкладка Encode).

Черному оптимизатору останется только такую конструкцию вставить в любой элемент распространяемого шаблона, плагина, модуля и т.д.

Как найти скрытые исходящие ссылки

Плагин был переведен на русский язык одним деятелем и им же была вставлена ссылка на свой АГС в файл расширения. Пиявка в блоке облака терялась среди множества меток и ее с удовольствием индексировали поисковые машины. Я же обнаружил вампира тогда случайно с помощью одного сервиса (ссылку не привожу, сдал сервис в последнее время). Вот старый скриншот:

Поиск внешних ссылок

А вот повествование давно минувших дней, как я эту ссылку удалял.

Как видим, на блог без приглашения пробрались 3 ссылки, одна из них полностью открыта для индексации.

И следующей задачей будет найти и удалить паразитов. Для этого в вашем файл менеджере (рекомендую Total Commander ) нужно перейти в корень сайта (более подробно я писал об этом в статье- Доступ к сайту через ftp.

Поиск и удаление внешних ссылок на сайте

Удалить внешнюю ссылку

В открывшемся файле зловредную ссылку с радостью удаляем.

Невидимые или закодированные ссылки вы найдете точно также, как в примере выше. Только в строку для поиска (пункт 4) вставьте другой искомый текст, в нашем случае display:none или base64.

Следует заметить, что не все найденные конструкции кода, включающие в себя display:none или base64 следует вносить в черный список.

Делитесь своими успехами или неудачами в комментариях, буду рад помочь. Желаю удачи!

Читайте также: