Hitech logo

Идеи

Нейронный поиск Jina.ai умеет работать с неразмеченными аудио, видео и фото

TODO:
Степан Икаев23 ноября 2021 г., 09:45

Стартап из Берлина обещает снять ограничения традиционных поисковиков на анализ информации с помощью глубоких нейронных сетей. Jina.ai разрабатывает «нейронный поиск» — систему, которая в отличие от Google, Bing и других сервисов, обрабатывает неструктурированные, никак не размеченные данные из видеороликов, изображений и аудиозаписей.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

В разговоре с журналистами TechCrunch основатель и гендиректор Хан Сяо сравнил свою работу над Jina с фреймворком машинного обучения Google TensorFlow. Точно так же, как TensorFlow определил шаблоны для проектирования систем в области искусственного интеллекта, стартап хочет определить, как люди должны создавать нейронные поисковые системы, и стандартизировать этот процесс.

Jina.ai применяет нейросети с глубоким обучением, которые выходят за рамки обычных программных инструментов поиска на основе ключевых слов. В основу технологии стартапа легла комбинация из трансферного обучения и репрезентативного обучения. Сервис Jina превращает любые данные в «универсальное представление» из математических векторов, чтобы платформа могла искать информацию не только по тексту, но и по файлам новых форматов.

«Учитывая изображение, аудио, видео или что-то еще — мы сначала используем глубокие нейронные сети, чтобы преобразовать этот формат данных в универсальное представление. В данном случае это в основном математический вектор — 100-мерные векторы. Алгоритм сопоставления не считает количество совпадающих букв, но считает математическое расстояние, векторное расстояние между этими двумя векторами», — объяснил Сяо и добавил, что подобная методология решает любые проблемы при поиске данных и анализе релевантности.

В дополнение Jina работает над торговой площадкой Jina Hub — местом, которое позволяет разработчикам из разных стран делиться и запускать новые строительные блоки для приложений нейронного поиска. Таким образом стартап мотивирует сторонних программистов создавать собственные системы и поддерживает экосистему нейронных поисковиков.

Сейчас сообщество разработчиков Jina AI насчитывает около 1000 пользователей. Среди клиентов и партнеров стартапа числятся компании, разрабатывающие видеоигры, и коммерческие предприятия, которые заинтересованы в управлении масштабными облачными средами. Кроме того, по словам Сяо, услугами Jina уже заинтересовались юридические фирмы, обрабатывающие большие объемы PDF-файлов и отсканированных документов.

На этой неделе Jina.ai успешно закрыл раунд финансирования на $30 млн. Серию A возглавил венчурный фонд Canaan Partners, к которому присоединились Mango Capital, GGV Capital, SAP.iO и Yunqi Partners. Сейчас общий объем привлеченного капитала составляет $39 млн. Стартап направит полученные средства на расширение своей деятельности в США и поиск новых разработчиков, специализирующихся на создании продвинутых алгоритмов.