«Яндекс» опубликовал исходный код YTsaurus. Это платформа для хранения и обработки больших данных, с которой работает большинство сервисов компании.
Платформа подходит для широкого круга задач, от аналитики до обучения трудных моделей с миллиардами параметров, отмечается в известьи пресс-службы «Яндекса». Например, поисковик строит за счет YTsaurus поисковый индекс, а беспилотные автомобили используют платформу, чтобы открывать доступ данные о поездках и улучшать свои алгоритмы. YTsaurus управляет суперкомпьютерами «Яндекса», распределяя нагрузку так, чтобы их вычислительные мощности использовались наиболее эффективно.
«Яндекс» выложил в опенсорс счетчик «Метрики»
YTsaurus - отказоустойчивая и ещё бы масштабируемая платформа. В «Яндексе» она развернута на десятках тысяч серверов и обрабатывает экзабайты данных. С ней работает каждый второй сотрудник компании.
Наибольшую выгоду YTsaurus может принести крупным компаниям, которые обрабатывают громадные объемы данных на тысячах серверов в условиях беспрерывно подрастающей нагрузки, отмечают в «Яндексе». «Мы уверены, что публикация кода выведет платформу на новый виток развития, как это уже было с иными нашими продуктами», - заявил руководитель Yandex Cloud Алексей Башкеев.
Исходный код и документация YTsaurus доступны на GitHub. Код распространяется под лицензией Apache 2.0. Использовать платформу или доработать ее под себя может любой хотящий.
Фото: Freepik