[Войти]

+7(918)3883-585

Готовые программы и решения

VK ВЫЛОЖИЛА ДАТАСЕТ ДЛЯ РАЗВИТИЯ РЕКОМЕНДАТЕЛЬНЫХ СИСТЕМ

Дата публикации: 27.08.2025

Исследователи AIVK выложили в открытый доступ датасет VK-LSVD (Large Short-Video Dataset). С его поддержкою инженеры и ученые смогут делать лучше и совершенствовать рекомендательные алгоритмы, чтобы делать сервисы и продукты более персонализированными.

Датасет включает 40 миллиардов обезличенных уникальных взаимодействий 10 миллионов пользователей с 20 миллионами кратких видео за шесть месяцев (январь-июнь 2025) в том числе агрегированные лайки, дизлайки, шеры, продолжительность просмотра и контекст воспроизведения.

Вся информация представлены в формате числовых идентификаторов, что отлично обеспечивает полную конфиденциальность. Для каждого ролика предоставлен эмбеддинг (числовое описание содержимого), а для каждого пользователя предоставлены социально-демографические характеристики. Это позволяет исследователям строить модели, ориентированные и на поведенческие данные, и на контент.

«Сейчас не так много больших открытых датасетов, на базе которых можно обучать и оценивать модели. Для построения безошибочных рекомендательных алгоритмов важно учитывать не только очевидные реакции пользователей, но и многие дополнительные сигналы: продолжительность просмотра, контекст, содержимое. VK-LSVD - с помпой шаг к формированию исследовательской среды, в какой можно проверять гипотезы и строить безошибочные модели на основании реальных данных. Мы планируем делать лучше датасет, отныне спустя время проведем открытое соревнование для инженеров», – отметил Дмитрий Кондрашкин, директор по AI в VK.

Вместо разделенья на фиксированные размеры датасета, VK-LSVD позволяет настраивать выборку под задачи конкретного исследования. Инженеры могут в отдельности задать нужный объём данных, выбрать, как именно их отбирать - случайным образом или по популярности. Такой подход позволяет адаптировать датасет под реальные задачи и вычислительные мощности, которые есть у команд. И применять VK-LSVD как для академических проектов, так и для масштабных индустриальных экспериментов.

Фото: Unsplash

Рекомендуем:

Комментарии

Для того, чтобы добавить комментарий необходимо
войти на сайт

Пока материал никто не комментировал.

Новости

«Авито»: 75% объема креативных услуг приходится на 10 регионов-лидеров

Технологическая платформа «Авито» при поддержке Единого центра креативной экономики (АНО «Креативная экономика») представила на Российской креативной неделе реально существующий обзор «Рынок услуг в области креативных индустрий: структура, драйверы и цифровая трансформация», сообщает пресс-служба компании.

Дата публикации: 21.07.2026

Эксперты UserGate uFactor прогнозируют всплеск мошенничества на фоне нестабильности фондового рынка

Эксперты UserGate uFactor предостерегают о возможном росте мошеннических схем, нацеленных на игроков на бирже Форекс. Причиной беспокойного тренда становится текущая нестабильность и волатильность российского фондового рынка, которой киберпреступники пользуются для хищения средств и персональных данных граждан, сообщает пресс-служба компании.

Дата публикации: 21.07.2026

полный список...

Статьи

МегаФон стал партнёром финансовой платформы Банки.ру

1 июня 2023 МегаФон и финансовая платформа Банки.ру (АО «Цифровые технологии») запускают партнёрство. Первый совместный проект позволит предоставить клиентам доступ к финансовым предложениям любого российского банка?участника платформы, независимо от наличия его отделения поблизости.

Автор: prteammf

Дата публикации: 30.07.2023

«МегаФон Облако» поможет учебным заведениям совершенствовать образовательный процесс

14 июня 2023 МегаФон предоставил виртуальную инфраструктуру Институту развития образования Свердловской области. Преподаватели, сотрудники и слушатели образовательного учреждения получили дополнительные возможности для развития дистанционных программ в безопасной облачной среде.

Автор: prteammf

Дата публикации: 30.07.2023

МегаФон разработает систему экомониторинга морской акватории Камчатского края

23 июня 2023 МегаФон стал партнёром Правительства Камчатского края в области обеспечения экологической безопасности морской среды. Оператор поможет внедрить технологии мониторинга для сохранения и восстановления морской экосистемы, а также предотвращения возможных природных и техногенных катастроф.

Автор: prteammf

Дата публикации: 30.07.2023

...

полный список...

Вопросы

Автор: Guest

Дата публикации: 23.06.2020

Здравствуйте! Как мне зайти в личный кабинет? Напомните, пожалуйста, логином является e-mail? И если я забыла пароль?

Автор: denchik

Дата публикации: 17.06.2020

Работал в программе Accounting of food 5.0 и в один момент у меня вылезла ошибка, после которой практически все мои введенные данные исчезли, кроме данных Свойства продуктов. Как решить эту проблему?

Автор: SASHA77777