3.7 миллиона внутренних URL Гугла раскрывают стек ранжирования...
3.7 миллиона внутренних URL Гугла раскрывают стек ранжирования — ни одна страница не была открыта
Команда RESONEO спарсила 3 729 456 внутренних урлов Гугла на 7542 уникальных хостах и не открыла ни один из них.
Почти каждый адрес отдает 302 редирект на login.corp, поэтому тела страниц остаются закрытыми.
Метод считывает только путь, исходя из того, что сам путь — это уже разведданные: имя хоста или файла выдает команду, систему или машину еще до загрузки контента.
Одно только наличие badurlsdemoteindex доказывает, что пессимизация (demote) и удаление (remove) разделены прямо в именах файлов гуглобота.
Живые пути подтверждают компоненты ранжирования, которые до этого светились только как слитые кодовые имена.
Ascorer, главный скорер информационного поиска, отображается открытым текстом в живом дебаг-флаге eng-hip-ascorer.
Выше по стеку Twiddlers (189 упоминаний в путях) переранжируют результаты под управлением SuperRoot (474 упоминания).
Два списка гуглобота лежат бок о бок: badurlsspamindex (килл) и badurlsdemoteindex (пессимизация).
Завязанный на SuperRoot файл youtubecontroversialqueryblacklist подтверждает ручное редакторское вмешательство в рамках отдельных вертикалей.
Последний пункт — самая острая находка: некоторые решения о ранжировании — это файлы, которые правятся вручную, а не алгоритмы.
Урлы для youtubecontroversialqueryblacklist содержат 42 отдельные ревизии, чьи токены cl= кодируют точные ключи, добавляемые руками — список пополнялся во время стрельбы в Лас-Вегасе в октябре 2017 года.
Имя файла, призванное скрыть его содержимое, раскрывает всю историю правок.
Цензура оставляет след версий.
Управляющая плоскость (control plane) тоже названа.
Mendel — это главная платформа A/B-тестирования и рубильников (kill-switch), а Finch — ее двойник на стороне Chrome; там буквально есть KillSwitchExample.gcl.
Один урл querydebugger.corp замораживает в строке полный конфиг поискового эксперимента — закрепленный бинарник GWS, именованные флаги и маркер __data_rollout__…__launched__:true (тот самый флаг, который говорит, что эксперимент выкачен в прод).
А тема, за которой все гоняются, утекает через свой staging-хост: hc-ai-mode-staging.corp.google.com вскрывает режим AI Mode и его внутреннее тестирование, пока сама фича остается заблокированной.
Домен пре-прода доказывает существование продукта и его внутреннее кодовое имя — без необходимости открывать саму страницу.
https://think.resoneo.com/google-internal-urls/
@MikeBlazerX
⚠️ Закрытый канал: @MikeBlazerPRO
Ссылки из поста:– https://t.me/MikeBlazerX
– https://t.me/tribute/app?startapp=sE4X
Источник новости https://t.me/mikeblazerx/6481...
8 
