❓Вопрос #627 Как вытянуть тексты страниц с помощью Screaming Frog?

192

#ответы

❓Вопрос #627

Как вытянуть тексты страниц с помощью Screaming Frog?

❗️ Ответ (можно прочитать в виде статьи telegraph)

Автоматизировать процесс парсинга текстов с помощью Screaming Frog можно с помощью выражений Xpath.

👆Xpath — это язык запросов к элементам xml или xhtml документа. Для того, чтобы пользоваться данным языком запросов не обязательно быть программистом. Для примера покажем как им пользоваться на сайте https://siteclinic.ru/.

👉 Необходимо:

1️⃣ Составить список страниц, в которых необходимо выгрузить текст.

2️⃣ На одной из страниц скопировать Xpath для элемента статьи. Например, для того, чтобы найти соответствующий Xpath на выбранной странице нажимаем Ctrl+Shift+I, копируем Xpath нужного элемента для парсинга: правая кнопка мыши → Copy → Copy XPath (скрин).

3️⃣ Далее настраиваем лягушку:

▫️Переключаемся в режим списка (меню Mode → List) (скрин);

▫️Переходим в меню Configuration → Custom → Extraction (скрин), выбираем XPath и Extract Text (скрин) и вставляем скопированный код скопированный код XPath (скрин).

4️⃣ Запускаем парсинг по списку URL-ов.

В соответствующем столбце спарсится нужный текст — скрин.

🤜 via @siteclinic_doctor

Источник новости https://t.me/siteclinic_doctor...

<< Вернуться на канал

16.10.2019 14:38