Меню

ИТ-аккредитация

Реквизиты

Наименование организации: Общество с ограниченной ответственностью «КОГНИТО»

Адрес места нахождения: 125167, г. Москва, вн. тер. г. муниципальный округ Аэропорт, пр-кт Ленинградский, д. 36, стр. 40, помещ. 215

ИНН: 9714049015

ОКВЭД: 63.11.1 Деятельность по созданию и использованию баз данных и информационных ресурсов

Почта: info@cognito.ru

Номер телефона: +7 (495) 212-19-77

Коды видов деятельности в области информационных технологий, осуществляемых организацией, в соответствии с перечнем видов деятельности в области информационных технологий, утвержденных приказом Министерства цифрового развития, связи и массовых коммуникаций Российской Федерации от 11.05.2023 № 449:

Код 3.01 Деятельность по созданию баз данных и информационных ресурсов (включая разработку концепций, структуры, состава баз данных), формированию и ведению баз данных (включая сбор данных из одного или более источников, а также ввод, верификацию и актуализацию данных), администрированию баз данных (включая обеспечение возможности доступа к базе данных в режиме непосредственного или телекоммуникационного доступа), поиску данных, их отбору и сортировке по запросам, предоставлению отобранных данных пользователям

Код 10.01. Деятельность по созданию, обучению и поддержке функционирования нейросетей, а также оказание услуг (выполнение работ) по автоматическому распознаванию различного вида изображений, видеопотока, и (или) текстов, и (или) речи, или иных звуков, а также их верификации и преобразованию

Описание программного обеспечения:

Система «Сорока» представляет собой комплекс аппаратно-программных средств, обеспечивающих распознавание речи на 99 языках различной жанровой принадлежности.

Система решает следующие задачи:

— распознавание речи на 99 языках для аудио файлов;

— формирование субтитров, для дальнейшего использования в видео файлах;

— выделение говорящих (дикторов) для распознанного аудио (диаризация);

— формирование результата распознавания с выделенными дикторами в формате docx;

— автоматическая расстановка знаков пунктуации и заглавных букв с учетом интонации дикторов;

— импортозамещение, обеспечение перехода на отечественные аналоги распознавания речи.

Технологический стек:

Языки программирования: Rust, SQL, Python, Haskell.

Системы хранения данных: PostgreSQL, ClickHouse.

Фреймворки: Tokio, Hyper, DataFusion, gRPC.

Библиотеки: ffmpeg.

Описание реализуемых (разрабатываемых) товаров и/или выполняемых работ и/или оказываемых услуг:

Разработка, развитие и эксплуатация системы перевода речи в текст на базе ИИ «Сорока» для автоматической транскрибации речи из аудио и видео файлов в текст, включая сайт, мобильное приложение, личные кабинеты, функционал записи, транскрипции, диаризации, суммаризации, субтитрирования, протоколирования, поиска, ИИ-агента, работы с документами, аудио-, видео- файлами и клиентской поддержкой.

Процесс транискрибации звука с помощью системы «Сорока» включает в себя несколько ключевых этапов, которые позволяют автоматически транскрибировать звуковую речь в текст, транскрибация аудио в текст и видео выполняется следующим образом:

Захват аудиосигнала. Захват звукового сингала с записи речи.
Предварительная обработка. На этапе предварительной обработки звука аудиоданные файла очищаются от шума и нормализуются, чтобы улучшить качество транскрибации и перевода речи в текст.
Акустическое моделирование. Система анализирует звуковые характеристики речи с записи аудио или видео файла и сопоставляет их с фонемами — минимальной звуковой единицей языка.
Лексическое моделирование. Лексическое моделирование, которое помогает системе определить слова на основе распознанных звуков.
Языковое моделирование. Языковое моделирование учитывает контекст и грамматические правила, чтобы выбрать наиболее вероятный и осмысленный вариант для транскрибации текста.
Все этапы работы системы вместе обеспечивают сервису точную и эффективную транскрибацию аудио в текст и видео файлов.

Система «Сорока» поддерживает различные форматы для транскрибации и перевода аудио и видео записи в текст: mp3, mp4. Экспорт транскрибированной записи поддерживает различные форматы: TXT, DOCX, SRT, JSON. Интеграция с различными платформами.

Система «Сорока» активно развивается благодаря совершенствованию технологий ИИ и регулярно обновляется, поддерживает более 99 языков для транскрибации аудио и видео в текст.

Информация о стоимости:

Стоимость предоставления лицензий, оказания услуг, выполнения работ отнесена к коммерческой тайне и может быть предоставлена заинтересованным лицам на условиях конфиденциальности. Стоимость определяется в зависимости от сроков, объема и сложности технического задания, используемых модулей, количества интеграций с внешними системами, требований к производительности и масштабируемости, объема и длительности технической поддержки, а также иных требований заказчика в рамках конкретного проекта.


Для получения коммерческого предложения свяжитесь с нами по телефону +7 (495) 212-19-77 или электронной почте info@cognito.ru


Сведения о программном обеспечении, исключительные права на которое принадлежат ООО «КОГНИТО»:

Наименование Классы ПО/ПАК Дата включения в реестр Номер реестровой записи Ссылка на реестр
Программное
обеспечение Сорока
07.04 Средства распознавания и синтеза речи 17.04.2026 32957https://reestr.digital.gov.ru/reestr/9502901/?sphrase_id=20064451