Приложение к приказу Генерального директора
ООО «Хэдхантер» № 12/03-ОД от 14.12.2023 г.

 


Правила применения рекомендательных технологий

1. ООО «Хэдхантер» (ИНН 7718620740) (далее — «Общество») является владельцем сайта www.hh.ru (далее — «Сайт»), сайта и приложения Сетка www.setka.ru (далее — «Сетка»), сайта www.career.ru (далее — «Карьера»), а также владельцем запатентованной в реестре изобретений Российской Федерации за № 2711717 рекомендательной системы подбора персонала с использованием машинного обучения и с понижением размерности многомерных данных (далее — «Рекомендательная система»), на которых применяются информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети «Интернет», находящихся на территории Российской Федерации (далее — «Владелец информационного ресурса, на котором применяются рекомендательные технологии»).

 

2. Настоящие Правила применения рекомендательных технологий (далее — «Правила») содержат описание процессов и методов сбора, систематизации, анализа сведений, относящихся к предпочтениям пользователей сети «Интернет», предоставления информации на основе этих сведений, способов осуществления таких процессов и методов, а также описание видов сведений, относящихся к предпочтениям пользователей сети «Интернет», которые используются для предоставления информации с применением рекомендательных технологий, и источников получения таких сведений.

 

3. Владелец информационного ресурса, на котором применяются рекомендательные технологии, не допускает применение рекомендательных технологий, которые нарушают права и законные интересы граждан и организаций, а также не допускает применение рекомендательных технологий в целях предоставления информации с нарушением законодательства Российской Федерации.

 

4. Под рекомендательными технологиями здесь и далее понимаются программные комплексы, которые с помощью алгоритмических вычислений и машинного обучения на основании данных о пользователе или характеристиках элементов в системе осуществляют индивидуализированный подбор, а также ранжирование контента для конечного пользователя.

 

5. Для алгоритмических вычислений и машинного обучения Общество использует полученные от пользователей Сайта данные, а именно:

 

  • данные о любых действиях пользователя на Сайте;
  • данные о любых запросах пользователя на Сайте;
  • данные из текстов резюме и вакансий;
  • IP адрес;
  • файлы cookies;
  • идентификатор пользователя, присваиваемый сайтом;
  • посещенные страницы;
  • количество посещений страниц;
  • информация о перемещении по страницам сайта (в т.ч. запись движения мыши, нажатий на ссылки и элементы сайта);
  • длительность пользовательской сессии;
  • точки входа (сторонние сайты, с которых пользователь по ссылке переходит на сайт);
  • точки выхода (ссылки на сайте, по которым пользователь переходит на сторонние сайты);
  • страна пользователя;
  • геопозицию;
  • регион пользователя;
  • часовой пояс, установленный на устройстве пользователя;
  • провайдер пользователя;
  • браузер пользователя;
  • цифровой отпечаток браузера (canvas fingerprint);
  • доступные шрифты браузера;
  • установленные плагины браузера;
  • параметры WebGL браузера;
  • тип доступных медиа-устройств в браузере;
  • наличие ActiveX;
  • перечень поддерживаемых языков на устройстве пользователя;
  • архитектура процессора устройства пользователя;
  • ОС пользователя;
  • параметры экрана (разрешение, глубина цветности, параметры размещения страницы на экране);
  • информация об использовании средств автоматизации при доступе на сайт;
  • дата и время посещения сайта;
  • источник перехода (UTM метка);
  • значение UTM меток от source до content;
  • уникальный идентификатор, присваиваемый интернет-сторонним сервисом, обеспечивающим обработку статистических данных;
  • данные, содержащиеся в личном кабинете пользователя, зарегистрированного на Сайте;
  • метрические данные;
  • данные сетевого трафика.

5.1. Помимо перечисленных в п.5. настоящих Правил данных, Общество использует полученные от пользователей Сетки данные, а именно:

 

  • идентификатор пользователя, присваиваемый Сеткой;
  • данные о карьерном пути пользователя, которые берутся из одного из источников:
    • данные указываются и редактируются пользователем вручную при регистрации в Сетке и в процессе использования приложения;
    • данные берутся из резюме пользователя на Сайте в случае, если аккаунты Сетки и Сайта связались между собой (произошла авторизация по номеру телефона или через сервис HH ID, номер телефона в Сетке и на Сайте совпал и пользователь смог подтвердить свой номер с помощью одноразового кода, и/или использовался одинаковый токен авторизации в двух мобильных приложениях).
  • данные о реакциях на элементы контента (посты, вопросы, ответы);
  • данные о связях пользователя (наличие и состав коннектов и подписчиков, вхождение в круги и сообщества);
  • данные о просмотрах контента пользователем;
  • метаданные постов, которые читает и создает пользователь, в том числе их семантика;
  • данные о поисковых запросах в Сетке;
  • данные о переходах по экранам и других действиях внутри Сетки.

5.2. Помимо перечисленных в п.5. настоящих Правил данных, Общество использует полученные от пользователей Карьеры данные, а именно:

 

  • данные о карьерном пути пользователя, которые берутся из одного из источников:
    • данные берутся из резюме пользователя на Сайте в случае, если вход на Карьеру осуществлен через Сайт.
  • данные о реакциях на элементы контента (вопросы, ответы);
  • данные о просмотрах контента пользователем;
  • метаданные постов, которые читает пользователь, в том числе их семантика;
  • данные о поисковых запросах в Карьере;
  • данные о переходах по экранам и других действиях внутри Карьеры.

6. Для работы рекомендательных технологий Общество применяет алгоритмы фильтрации на основе контента (алгоритмы градиентного бустинга) и коллаборативной фильтрации.

 

Данные, указанные в п.5. настоящих Правил, Общество оцифровывает и представляет в векторном виде. При фильтрации на основе контента алгоритмы рекомендуют контент, похожий на тот, который пользователь Сайта выбирал в прошлом или которые он изучает в настоящее время. При коллаборативной фильтрации используется информация о поведении пользователей с похожими интересами. Система находит пользователей или элементы с историей оценок, аналогичной текущему пользователю или элементу, и генерирует рекомендации на основании этой схожести.

 

7. Общество использует рекомендательные технологии как для обработки запросов работодателей при поиске в базе резюме, так и для обработки запросов соискателей при поиске вакансий, в целях быстрого предварительного отбора вакансий и резюме, из которых пользователь Сайта может выбрать наиболее подходящие.

 

В Сетке Общество использует рекомендательные технологии для предложения релевантного контента в ленте рекомендаций и вариантов подписок на людей и сообщества внутри приложения, а также для ранжирования постов в лентах подписок и рекомендаций.

 

В Карьере Общество использует рекомендательные технологии для предложения релевантного контента в ленте или рекомендаций в соответствующих разделах Карьеры, а также для ранжирования постов и иных информационных сообщений.

 

8. В рекомендательных технологиях Общество использует обучающую и рабочую базы данных, при этом обучающие последовательности формируются путем сортировки и обработки матриц обучающей базы данных на основании отзывов пользователей о степени соответствия представленных им результатов тематике запросов.

 

9. Процесс работы рекомендательных технологий Общества заключается в следующем:

 

  • формируется обучающая индексная матрица, в качестве строк которой используются индексные строки, соответствующие документам обучающей базы данных;
  • с использованием заранее заданной процедуры сжатия матриц обучающая индексная матрица сжимается с частичной потерей данных с понижением размерности для формирования сжатой индексной матрицы;
  • строки сжатой индексной матрицы группируются по заранее заданным формальным признакам сходства, где документы, соответствующие сгруппированным строкам в одной группе, составляют обучающую группу документов;
  • формируется решающая система, для обучения которой в качестве исходных данных используются индексные строки документов соответствующей обучающей группы документов, а в качестве ожидаемых результатов — отзывы пользователей для документов из обучающей группы;
  • для поискового выражения пользователя формируется индексная табличная строка, в которой отдельные ячейки соответствуют заранее заданному признаку, а значения, занесенные в ячейку, соответствуют наличию соответствующего признака в поисковом выражении;
  • для индексной строки поискового выражения, определяется один из заранее заданных формальных признаков сходства, соответствующий поисковому выражению;
  • из рабочей базы данных отбираются документы, индексным строкам которых соответствуют признаки сходства, соответствующие поисковому выражению;
  • пользователю представляются документы, отобранные решающей системой из документов, предварительно отобранных из базы данных.