Получи даты контента для твоих URL в G`oogle Sheets` за секунды!
240
Получи даты контента для твоих URL в G`oogle Sheets` за секунды!
Сделать это до глупости просто - достаточно занести список URL-адресов ваших сайтов в лист Google.
Перейдите на страницу и найдите нужный вам элемент, например DATE, щелкните правой кнопкой мыши на тексте и нажмите INSPECT.
Когда откроется devtools, он автоматически покажет вам выделенный HTML-элемент.
Щелкните правой кнопкой мыши, COPY > Full XPATH.
Затем вставьте XPATH в эту формулу
=IMPORTXML(A2, "Вставьте сюда свой полный xpath")
Таким образом, это выглядит примерно так:
=IMPORTXML(A2, "/html/body/main/section/div[2]/div[2]/span[2]")
Скопируйте функцию ячейки и вставьте ее в свой лист, а затем просто проведите CASCADE по всем УРЛам.
В первый раз она запросит у вас разрешение на доступ к внешним URL-адресам, дайте разрешение и запустите снова.
Это СУПЕР ПРОСТОЙ и быстрый способ получения дат контента.
Но это можно сделать с любым видимым элементом страницы - лучше всего работают последовательные элементы, т. е. авторы, даты и т. д.
Можно сделать это и другим способом:
1 . Откройте URL-адрес и просмотрите исходный код
2. Найдите "datePublished", если он отображается в исходном тексте.
3. Скопируйте этот скрипт:
function getDatePublished(url) {
const html = UrlFetchApp.fetch(url).getContentText();
const match = html.match(/"datePublished":"([^"]+)"/);
return match ? match[1] : "Not found";
}
4. Вернитесь на лист, нажмите EXTENSIONS > APPS SCRIPT, вставьте скрипт, сохраните и запустите, дайте разрешения.
5. Вызовите скрипт следующим образом:
=getDatePublished(A2)
Что вы можете сделать с этими удивительными данными?
Используйте VLOOKUP, чтобы сопоставить ваши URL-адреса с данными поисковой консоли за последние 3, 12 и 16 месяцев, загруженными в лист.
Примените фильтр и найдите устаревший контент, у которого мало или совсем нет кликов и показов.
Проверьте наличие внешних ссылок с помощью пакетного анализа AHREFS - все, на которые есть внешние ссылки, URL-адреса 301, те, на которые нет ссылок, удаляют контент и HTTP 410 URL-адреса, чтобы устранить их.
@MikeBlazerX

– https://www.linkedin.com/feed/update/urn:li:activi...
– https://t.me/MikeBlazerX
Источник новости https://t.me/mikeblazerx/4867...

