❓Вопрос #627 Как вытянуть тексты страниц с помощью Screaming Frog?
#ответы
❓Вопрос #627
Как вытянуть тексты страниц с помощью Screaming Frog?
❗️ Ответ (можно прочитать в виде статьи telegraph)
Автоматизировать процесс парсинга текстов с помощью Screaming Frog можно с помощью выражений Xpath.
👆Xpath — это язык запросов к элементам xml или xhtml документа. Для того, чтобы пользоваться данным языком запросов не обязательно быть программистом. Для примера покажем как им пользоваться на сайте https://siteclinic.ru/.
👉 Необходимо:
1️⃣ Составить список страниц, в которых необходимо выгрузить текст.
2️⃣ На одной из страниц скопировать Xpath для элемента статьи. Например, для того, чтобы найти соответствующий Xpath на выбранной странице нажимаем Ctrl+Shift+I, копируем Xpath нужного элемента для парсинга: правая кнопка мыши → Copy → Copy XPath (скрин).
3️⃣ Далее настраиваем лягушку:
▫️Переключаемся в режим списка (меню Mode → List) (скрин);
▫️Переходим в меню Configuration → Custom → Extraction (скрин), выбираем XPath и Extract Text (скрин) и вставляем скопированный код скопированный код XPath (скрин).
4️⃣ Запускаем парсинг по списку URL-ов.
В соответствующем столбце спарсится нужный текст — скрин.
🤜 via @siteclinic_doctor
Источник новости https://t.me/siteclinic_doctor...