Интентный кластеризатор "Если долго мучиться, что-нибудь...
733
Интентный кластеризатор
"Если долго мучиться, что-нибудь получиться..."
Написал свой кластеризатор:
https://tools.soltyk.ru/clustering.php
С авторской методикой сортировки. Это не SOFT и HARD кластеризация, это более точнее.
По сути это HARD-4 + лидер по топ-3. Но достиг тех же результатов по своей математической формуле.
Я уже описывал принципы в посте https://t.me/soltykseo/5635
Я пробовал и через БД и через загрузку CSV, Ajax, парсинг выдачи и т.п.
Оставил самый быстрый по выполнению код. Пришлось даже изучить высший пилотаж по оптимизации кода для высоконагрузочных проектов, хоть я и любитель программист.
Для теста можете скачать файлик таблицы, выделить в формате 3 столбцов: "фраза", "позиция", "url". Потом вставить данные в поле согласно инструкции.
В результате получите группировку по запросам в формате:
"URL лидер", "фраза".
Думал передавать частотности и другое... Но трудозатраты в обработке будут большие на стороне сервера, соответственно меньше можно будет обработать...
Я выставил следующие пороги:
100000 строк, это примерно 10000 фраз (фраза имеет данные по топ-10).
А также 4000 URL лидеров, по которым происходит группировка.
Если что-то не сгруппировалось, так и будет написано несгруппировано. Можно остаток обработать в следующих итерациях.
В общем у кого есть данные выдачи, из того же Кей Коллектора, можете протестировать.
Жду обратную связь 😊
Источник новости https://t.me/soltykseo/5683...

