З великого витоку коду «Яндекса» стало ясно, як російський пошуковик блокував зображення Путіна, коли користувачі шукали «бункерного діда» та «ху*ло»

Минулого тижня стався масштабний витік вихідного коду сервісів «Яндекса» (компанія сама його підтвердила). Невідомий оприлюднив архіви внутрішнього репозиторію “Яндекса”. Вивчивши їх, можна дізнатися багато нових деталей про те, як влаштована найбільша російська пошукова система, яку в останні роки постійно критикують за співпрацю з Кремлем. З витоку, зокрема, з’ясувалося, що «Яндекс» цензурує пошукову видачу картинок та відео — так, щоб зображення Путіна та символи Z не з’являлися у неприємних для влади контекстах, зазначає видання “Медуза“. 

Цензурування запитів користувачів

Коли хтось шукає картинки в Яндексі, в деяких випадках пошуковий запит автоматично коригується: компанія вилучає частину зображень з пошукової видачі.

За це відповідає спеціальне правило внутрішнього сервісу “Бегемот” під назвою ImgPatch (дослівно – виправлення зображень). Ось такий опис цього правила можна побачити в його коді :

Ось такий опис цього правила можна побачити в його коді :

Дозволяє організувати швидкий бан картинок і відео за допомогою виправлення вихідних запитів. Від невеликих змін до повного переформулювання.

Найчастіше виправлення застосовуються для того, щоб усунути з видачі «Яндекса» порнографічні фото та відео (особливо дитячі). На другому місці за кількістю заведених правил – вилучення зображень президента РФ Володимира Путіна. Раніше за інших на це звернув увагу користувач твіттера @bantg.

Захист Путіна

«Яндекс» постарався, щоб на зображення чинного російського президента не можна було натрапити під час пошуку за окремими словами:

  • пиздабол
  • плешивый
  • хуйло / хуйла / хуйлы / хуило / хуила

А також словосполученням:

  • бункерный дед
  • главный вор
  • гондон всея руси
  • хуй в скафандре
  • xуйло в проруби

І цілим пропозиціям:

  • как выглядят педофилы
  • когда он сдохнет
  • странное создание машет рукой

Всі ці правила повинні застосовуватися незалежно від того, де користувач.

Ці правила повинні застосовуватися незалежно від того, в якій країні є користувач. Ми не знаємо, коли вони з’явилися і чи діють досі. Перед виходом цього матеріалу журналістам вдалося знайти зображення російського президента у пошуку «Яндекса» за всіма запитами, окрім хуй у скафандрі (якщо не уточнювати, що ми шукаємо саме Путіна).

Захистіть символ Z

«Яндекс» оберігає від неприємних асоціацій і букву Z, яка стала символом російської війни проти України (і  заборонена в деяких європейських державах). Користувачі «Яндекса» не повинні побачити символіку нацистської Німеччини за запитами зі словами « z » або « z» спецоперація логотип. Для цього «Яндекс» автоматично додає до них безліч різних замінованих слів:

символ z * patch -luftwaffe -знак -люфтваффе -emblems -немецкий -german -президент -германский -славянский -army -рейх -вермахт -symboly -нацисты -германия -ss -hitler -nazi -сша -us -germany -сс -postimages -калмыкия -крест -членский -гитлерюгенд -message -ww2 -symbol -фон

z спецоперация логотип * patch -азов -spartan -япония -всу -одесса -спецуха -blackwood -спецназ -фарм -сша -ссо -warface -csgo

Перевірити, чи функціонує правило досі, складніше. У випадку з Путіним програма повинна блокувати зображення президента РФ, якщо користувач шукає конкретне слово, словосполучення чи речення. У разі Z шукати програмі доводиться «заборонені» символи, що складніше. Наберіть у пошуку символ z або z спецоперація логотип  – і ви можете зустріти у видачі, наприклад, свастику; але невідомо, чи це пов’язано з тим, що фільтр вже вимкнений або він просто погано працює.

Два останні слова в чорному списку капчі

У витоку можна знайти списки заборонених та  дозволених слів для використання у  капчі «Яндекса».

Заборонений список починається зі слів піндос! смерть , смертю , google – а закінчується словами левів і  здатися . Він не відсортований за абеткою: окремі нові заборонені слова або списки, швидше за все, записували до кінця файлу.

Обидва останні слова, мабуть, внесли до списку після початку повномасштабного вторгнення Росії в Україну. Слово здатись могли забанити, щоб його випадково не розцінили як прихований заклик; попадання до списку слова левів також важко пояснити поза воєнним контекстом. Ні в чорному, ні в білому списку немає власних назв, але  “львов”— це одночасно і назва міста на заході України, і родовий відмінок множини слова «леви». Ні в яких інших формах ( леви, леви, леви, леви) це слово в чорному списку не зустрічається, а в білому, навпаки, можна знайти це слово в іншій формі ( левах ), а також кілька однокорінних ( левина, левовика та ін.). ).

Тож, ймовірно, внести слово левів у заборонений список могли лише через його омонім — місто Львів, яке зазнає ракетних ударів російських військ із самого початку війни.

You may also like...