DeepSeek штурмует рейтинги, OpenAI запускает первого автономного агента: главные события января в сфере ИИ

Специальный корреспондент
Собака

Собака

Пресс-служба
Ветеран пробива
Private Club
Регистрация
13/10/15
Сообщения
56.284
Репутация
63.950
Реакции
280.437
RUB
0
2eb32334d0f0148f8ea0edc7614c944f.jpg

Первый месяц 2025 года задал высокую планку для развития ИИ. DeepSeek выпустила открытую модель уровня о-1, которая переполошила весь интернет и обрушила акции гигантов индустрии. Американские коллеги ответили настоящим шквалом релизов: OpenAI анонсировала сразу три значимых обновления, а NVIDIA презентовала новую линейку RTX и бюджетный суперкомпьютер для работы с ИИ-моделями.

Пока все отходили от новогодних праздников, индустрия ИИ продолжала развиваться с космической скоростью. Разбираем главные события января: новые модели, неожиданные исследования и амбициозные проекты.


Новые модели​

DeepSeek vs OpenAI: китайская компания выпустила открытую модель уровня o1​

В мире ИИ новая заявка на лидерство: китайская компания DeepSeek представила модель, способную на равных конкурировать с о1. И не просто конкурировать — R1 с 685 миллиардами параметров уже вошла в топ арены LMSYS, прописавшись по соседству с флагманом от OpenAI в категориях Hard Prompts, Coding, Math и Creative Writing.

Что известно про модель?​

R1 построена на базе DeepSeek-V3-Base и содержит 685 миллиардов параметров. Самое интересное в ней даже не результаты тестов, а то, как команде DeepSeek удалось их достичь. Главная инновация — применение чистого обучения с подкреплением без предварительного файнтюнинга на размеченных данных. Исследователи алгоритм GRPO (Group Relative Policy Optimization), который, в отличие от классического PPO, не требует отдельной модели-критика такого же размера, а оценивает базовую линию на основе групповых показателей.

В процессе обучения модель самостоятельно развила несколько интересных паттернов рассуждения. Например, она научилась помещать процесс размышлений внутри специальных тегов <think> и </think>, а также проводить самопроверку решений.

Показатели модели впечатляют: на математическом бенчмарке MATH-500 она достигает точности 97.3%, на AIME 2024 — 79.8%, что превосходит показатели o1. В области программирования R1 достигла рейтинга 2029 на Codeforces, обойдя 96.3% участников соревнований. При этом модель демонстрирует сильные результаты и в других областях: 90.8% на MMLU, 84% на MMLU-Pro и 71.5% на GPQA Diamond.

Результаты бенчмарков (источник изображения)

Результаты бенчмарков
Главный сюрприз — цены. R1 доступна через API по $0.55 за миллион токенов на входе — это в 20 раз дешевле, чем у OpenAI. Плюс есть бесплатный чат с лимитом в 50 сообщений в день.

Вместе с основной моделью выпустили шесть дистиллированных версий от 1.5B до 70B параметров, и тут тоже есть чему удивиться: даже самая маленькая модель на 1.5B обходит Claude Sonnet по некоторым метрикам.

Мультимодальная Janus-Pro​

Помимо R1, DeepSeek также выкатили Pro-версию своей мультимодальной модели Janus. Однако из-за шумихи вокруг R1 это новшество как-то ушло на второй план. Исправим несправедливость.

Janus-Pro — усовершенствованная версия уже существующей мультимодальной модели Janus. Главная фишка — раздельное кодирование для задач image2text и text2image. В отличие от предшественника, где использовался единый энкодер, Janus-Pro SigLIP для понимания изображений и VQ Tokenizer для их генерации. Каждый компонент дополнен специальным адаптером, который преобразует визуальные признаки в формат, понятный языковой модели.

Janus Pro и Janus в сравнении (источник изображения)

Janus Pro и Janus в сравнении
Результаты говорят сами за себя: на бенчмарке MMBench версия с 7B параметров достигает 79.2 баллов, оставляя позади TokenFlow (68.9) и MetaMorph (75.2). В задачах генерации изображений модель набрала 84.2% на GenEval, превзойдя как DALL-E 3 (67.0%), так и SD3 Medium (74.7%). Интересно, что даже младшая версия с 1B параметров показывает конкурентоспособные результаты. Обе модели уже выложены в открытый доступ на Hugging Face.

Утечка данных и теории заговора​

Естественно, такой внезапный успех DeepSeek породил немало вопросов и попал под пристальное внимание конкурентов.

Известный ИИ-инвестор Дэвид О. Сакс высказал предположение, что R1 — это дистилляция о1, а Microsoft уже начала расследование возможной «кражи» данных OpenAI. Есть и другая гипотеза от CEO ScaleAI Александра Ванга: за успехом стоит серьезный вычислительный кластер из 50 тысяч NVIDIA H100, который компания не афиширует из-за экспортных ограничений США. Илон Маск согласен с этим предположением.

(Источник изображения)


Следующий удар команда Wiz Research, обнаружившая публично доступную базу данных ClickHouse на серверах DeepSeek. База, расположенная на oauth2callback.deepseek.com:9000 и dev.deepseek.com:9000, содержала более миллиона записей с историей чатов, секретными ключами и внутренними данными компании. Самое неприятное — база была доступна без какой-либо аутентификации и позволяла выполнять произвольные SQL-запросы через веб-интерфейс.

DeepSeek пока никак не комментируют ни одну из ситуаций, но думается, что новые инциденты не заставят себя ждать.

А что вы думаете о прорыве DeepSeek и его «закулисье»? Поделитесь своим мнением в комментариях!

Ответка от OpenAI​

Лидеры индустрии стараются не ударить в грязь лицом на фоне своих китайских коллег и радуют пользователей тремя мощными релизами: Operator, Tasks и o3-mini. Рассказываем о каждом из них.

Operator: первый автономный агент от OpenAI​

OpenAI наконец представила своего долгожданного ИИ-агента Operator — и это действительно впечатляет. В основе агента лежит модель Computer-Using Agent (CUA), построенная на GPT-4o, которая умеет самостоятельно управлять браузером: кликать кнопки, заполнять формы и навигировать по меню. Все действия выполняются в отдельном защищенном окне браузера прямо внутри чата.

Пример работы Operator (источник изображения)

Пример работы Operator
С помощью Operator можно автоматизировать множество задач: от заказа доставки еды до планирования путешествий. При этом OpenAI уделила отдельное внимание вопросам безопасности: для операций с конфиденциальными данными (например, ввод данных банковской карты или доступ к почте) требуется подтверждение пользователя. В системе также предусмотрен мониторинг подозрительной активности, который автоматически останавливает исполнение задач при обнаружении потенциальных угроз.

Пока Operator доступен только американским пользователям с подпиской Pro ($200 в месяц), но OpenAI обещает постепенно расширить доступ на другие страны и тарифы. Правда, как отметил Сэм Альтман во время презентации, для Европы это «займет некоторое время». Про РФ почему-то ничего не сказал.

Tasks: ChatGPT выходит за рамки диалога​

В ChatGPT появилась новая функция Tasks — первый шаг к превращению чат-бота в полноценного цифрового ассистента. Теперь можно планировать задачи на определенное время и создавать регулярные напоминания, например «присылай прогноз погоды каждое утро в 8» или «напомни про встречу через час».

Примеры тасков (источник изображения)

Примеры тасков
Особенность Tasks в том, что бот выполняет задания, даже когда пользователь оффлайн. Система поддерживает до 10 активных задач одновременно и может сама предлагать их создание, опираясь на контекст разговора. Например, если вы не закончили писать код, ChatGPT заботливо спросит, не хотите ли запланировать возвращение к задаче позже.

Для использования Tasks нужно выбрать опцию «4o with scheduled tasks» в селекторе моделей. Сейчас функция доступна только для подписчиков Plus, Team и Pro. OpenAI планирует интегрировать Tasks с другими экспериментальными инструментами, включая Operator и систему Caterpillar для продвинутой обработки информации.

o3-mini: новая и более доступная​

В OpenAI поднапряглись из-за шумихи с DeepSeek и оперативно выпустили o3-mini — новую модель в линейке reasoning, которая достигает уровня o1 в задачах STEM, но работает быстрее и требует меньше ресурсов. Это первая из мини-версий, поддерживающая Function Calling и Structured Outputs, но главная ее инновация — три уровня «глубины размышлений», которые позволяют оптимизировать баланс между скоростью и точностью ответов.

И действительно, маленькая, да удаленькая: версия с high reasoning достигает точности 87.3% на AIME 2024, 77% на научных вопросах уровня PhD (GPQA Diamond) и решает 32% задач на FrontierMath с первой попытки. В области программирования модель получила рейтинг 2073 Elo на Codeforces. При этом ответы генерируются на 24% быстрее предшественника: в среднем 7.7 секунд против 10.16 у o1-mini.

Результаты математического бенчмарка AIME 2024 (источник изображения)

Результаты математического бенчмарка AIME 2024
Самое приятное — o3-mini стала первой reasoning-моделью, доступной бесплатным пользователям ChatGPT. Для платных подписчиков увеличен лимит с 50 до 150 сообщений в день, а Pro-пользователи получили неограниченный доступ к версиям medium и high reasoning.

Qwen 2.5: миллионный контекст и новый флагман​

Еще один участник ИИ-гонки от Китая, команда Qwen от Alibaba Group, продолжает удивлять темпами: за два дня они выпустили сразу две значимые модели. Первая — Qwen 2.5 с рекордным контекстным окном в 1 миллион токенов. Модель доступна в открытом доступе на Hugging Face в версиях 7B и 14B параметров.

Такого впечатляющего размера контекста удалось достичь благодаря использованию memory layers — специальных слоев, заменяющих классические feed-forward компоненты. В этой архитектуре ключи и значения механизма внимания становятся обучаемыми связками, что позволяет модели выбирать только наиболее релевантные пары вместо поиска по всему пулу key-values. Результат — более эффективные вычисления и улучшенная долгосрочная память.

Следом команда представила Queen 2.5-Max — масштабную Mixture-of-Expert модель, предобученную на 20 триллионах токенов с последующим файнтюнингом и RLHF. На бенчмарках она достигает уровня DeepSeek-v3 и GPT-4o, а на HumanEval показывает внушительные 73%. Обе модели уже доступны для бесплатного тестирования через API и веб-интерфейс.

Perplexity расширяет границы: новый API и ассистент для Android​

Perplexity AI уже давно известны своим комбо ИИ и поисковика, и вот наконец они представили сразу два значимых отдельных продукта: Sonar Pro API для разработчиков и нового AI-ассистента для Android, способного управлять приложениями.

позволяет разработчикам встраивать в свои приложения инструменты генеративного поиска с поддержкой цитирования источников. В отличие от большинства современных решений, которые ограничены данными обучения, Sonar Pro подключается к интернету в реальном времени, что обеспечивает актуальность и достоверность ответов. В рамках API разработчики получили доступ к расширенным функциям вроде JSON mode и возможности фильтрации поисковых доменов.

Результаты Sonar Pro на бенчмарке SimpleQA (источник изображения)

Результаты Sonar Pro на бенчмарке SimpleQA
Параллельно компания выпустила , способного управлять приложениями и выполнять сложные задачи: от бронирования столиков через OpenTable до вызова Uber. Система поддерживает как голосовые команды, так и визуальный ввод через камеру. По словам CEO Аравинда Сриниваса, это знаменует переход Perplexity от простой поисковой системы к полноценному интегрированному ассистенту. Интересно, что релиз состоялся сразу после анонса аналогичных возможностей в Google Gemini.

Hunyuan3D 2.0: Tencent превращает 2D-изображения в детализированные 3D-объекты​

Tencent новую версию своей системы для создания трехмерных моделей из обычных изображений. Hunyuan3D 2.0 использует двухкомпонентную архитектуру: Hunyuan3D-DiT отвечает за создание базовой геометрии объектов, а Hunyuan3D-Paint накладывает реалистичные текстуры с учетом поверхностных углов и позиций.

Пример работы Hunyuan3D 2.0 (источник изображения)

Пример работы Hunyuan3D 2.0
Технически система работает через диффузионный трансформер, который сначала анализирует и представляет основные формы в сжатом виде, а затем генерирует 3D-модель, максимально соответствующую входному изображению. Особое внимание уделено текстурированию: система удаляет эффекты освещения из оригинального изображения, что позволяет текстурам корректно отображаться при любом освещении. Попробовать Hunyuan3D 2.0 можно уже сейчас через веб-интерфейс , правда, для доступа потребуется авторизация через WeChat, QQ или китайский номер телефона.

Новости от гигантов индустрии​

Project Stargate: США начинают новую технологическую гонку​

Свой второй срок Дональд Трамп решил начать с изменения расстановки сил в мире ИИ. Он анонсировал запуск — масштабной частной инициативы по развитию ИИ-инфраструктуры в США. Стартовые инвестиции составят $100 млрд, а к 2029 году общий объем вложений планируется довести до $500 млрд. Для сравнения: это в 10 раз больше последнего инвестраунда OpenAI и в 7 раз превышает совокупные инвестиции во все европейские ИИ-стартапы за 2024 год.

(Источник изображения)


За реализацию отвечает необычный альянс технологических компаний. OpenAI берет на себя операционное управление и технологическую часть, SoftBank выступает главным инвестором, а Oracle, Arm, Microsoft и NVIDIA обеспечивают техническую экспертизу. Первым делом консорциум займется строительством сети датацентров, начиная с Техаса. Интересно, что проект полностью частный — государственные деньги в нем не участвуют.

Stargate серьезно меняет расклад в индустрии. OpenAI, получив доступ к собственной инфраструктуре, больше не зависит от вычислительных мощностей Microsoft. При этом сотрудничество с Azure продолжится, но теперь на более равных условиях. Помимо технологического лидерства, проект должен дать мощный экономический эффект: создание сотен тысяч рабочих мест, развитие смежных отраслей и реиндустриализация отдельных регионов США.

В ответ на американскую инициативу правительство Китая объявило о выделении 1 триллиона юаней (около $137 млрд) на развитие искусственного интеллекта. В отличие от частного Stargate, китайский проект полностью государственный: субсидии получат пять ключевых вендоров, включая DeepSeek. Хотя сумма в три раза меньше американской, массовое государственное финансирование может дать более быстрый эффект.

CES 2025: яркие новинки от NVIDIA​

В Лас-Вегасе завершилась главная технологическая выставка года, и NVIDIA, похоже, решила устроить настоящую революцию в мире персонального ИИ. Джен-Сун Хуанг представил целую экосистему продуктов — от домашних суперкомпьютеров до специализированных моделей для роботов. Разбираем главные анонсы.

RTX 50: новое поколение видеокарт​

NVIDIA начала презентацию с главного — новой линейки RTX 50 на архитектуре Blackwell. Флагманская RTX 5090 впечатляет: 92 миллиарда транзисторов, 3,352 триллиона AI-операций в секунду (TOPS) и пропускная способность памяти 1.8 ТБ/с.

(Источник изображения)


Линейка включает:

  • RTX 5090 — флагман для профессионалов;
  • RTX 5080;
  • RTX 5070 Ti;
  • RTX 5070 — производительность на уровне прошлого топа 4090.
Особый акцент сделан на поддержке NIM (NVIDIA AI Microservices) — это позволит запускать локальные LLM даже на домашних компьютерах.

Project DIGITS: суперкомпьютер размером с Mac mini​

Одна из главных сенсаций выставки — Project DIGITS, персональный ИИ-суперкомпьютер по цене игрового ноутбука.

Архитектура суперкомпьютера (источник изображения)

Архитектура суперкомпьютера
За $3000 вы получаете устройство размером с Mac mini, способное запускать языковые модели до 200B параметров без подключения к облаку. В основе — новый чип GB10 Grace Blackwell Superchip, обеспечивающий производительность в 1 петафлопс. А если объединить два таких устройства, можно работать с моделями до 405B параметров — это уже уровень серьезных датацентров.

Cosmos: фундамент для роботов будущего​

NVIDIA выходит на рынок world models с открытой платформой Cosmos World Foundation Models. Это набор предобученных моделей для роботов, которые уже используются Toyota и Uber в разработке беспилотников. Главная фишка — «колесо данных»: система превращает тысячи реальных поездок в миллиарды виртуальных симуляций для тренировки ИИ.

Одно из применений Cosmos — создание специализированных наборов данных для обучения ИИ-моделей (источник изображения)

Одно из применений Cosmos — создание специализированных наборов данных для обучения ИИ-моделей
«ChatGPT-момент для робототехники уже на подходе», — заявил Джен-Сун Хуанг во время презентации. И судя по тому, что платформа уже доступна на GitHub, NVIDIA намерена повысить доступность инструментов для разработки роботов.

AI Blueprints: конструктор агентов​

Компания также представила AI Blueprints — шаблоны для разработчиков, упрощающие разработку ИИ-агентов. Это готовые фреймворки с предустановленными инструментами: от микросервисов NIM до фреймворка NeMo. Особое внимание уделили различиям между обычными ИИ-агентами и агентным ИИ:

  • Обычные агенты: ограниченная автономность, заранее прописанные инструкции;
  • Агентный ИИ: высокая автономность, способность к обучению и адаптации.
Похоже, NVIDIA всерьез взялась за демократизацию ИИ-технологий и их доступность в частном использовании.

OpenAI оказались причастны к созданию бенчмарка FrontierMath​

Неожиданный поворот в истории с нашумевшим математическим бенчмарком FrontierMath. , OpenAI не просто тестировали на нем свою модель o3, но и спонсировали его создание, имея доступ к большинству задач и решений.

EpochAI, разработчики бенчмарка, долгое время скрывали этот факт даже от собственной команды. Шесть математиков, участвовавших в проекте, заявили, что не знали об эксклюзивном доступе OpenAI к тестам и не стали бы участвовать в разработке, если бы владели этой информацией. И это при том, что именно результаты на FrontierMath (25% против обычных 2% у других моделей) стали одним из главных козырей при презентации o3.

EpochAI признали ошибку, объяснив ее контрактными обязательствами перед OpenAI. По их словам, существует «устное соглашение» о неиспользовании задач для обучения моделей. Однако ведущий математик проекта Эллиот Глейзер подтвердил, что они до сих пор не смогли независимо верифицировать заявленные OpenAI результаты.

Meta отказывается от фактчекинга в пользу «народной модерации»​

Марк Цукерберг о радикальных изменениях в политике модерации контента Meta. Компания откажется от услуг сторонних фактчекеров в пользу системы «community notes», похожей на ту, что используется в X (бывший Twitter). Изменения коснутся всех платформ компании — Facebook, Instagram, WhatsApp и Threads.

По словам Цукерберга, это возвращение к «корням свободы самовыражения». Он признал, что существующая система модерации делает слишком много ошибок: даже если блокируется всего 1% постов, это затрагивает миллионы пользователей. Кроме того, компания переносит команды модерации из Калифорнии в Техас, чтобы снизить «предвзятость» в принятии решений.

Кадр из обращения Цукерберга (источник)

Кадр из обращения Цукерберга
Многие видят в этом решении политический подтекст — попытку наладить отношения с новой администрацией Трампа и республиканским Конгрессом. Эксперты опасаются, что отказ от профессионального фактчекинга может привести к новой волне дезинформации, особенно в преддверии выборов. Для бизнес-аккаунтов это означает как новые возможности в создании контента, так и риски столкнуться с неконтролируемой критикой и теориями заговора.

Франсуа Шолле запускает амбициозный ИИ-проект после ухода из Google DeepMind​

Создатель Keras и один из ведущих исследователей Google DeepMind Франсуа Шолле объявил о запуске собственной лаборатории . К проекту присоединился его бывший коллега по Google Ники Кнуп, и, похоже, они замахнулись на что-то действительно масштабное.

(Источник изображения)


Название Ndea (читается как «идея» с буквой «n») отсылает к древнегреческим концепциям ennoia (интуитивное понимание) и dianoia (логическое мышление). Главная цель — объединить глубокое обучение с программным синтезом для создания AGI. Но самое интересное не это: команда планирует построить своего рода «фабрику научного прогресса», способную генерировать и коммерциализировать новые идеи в промышленных масштабах.

В фокусе внимания не только очевидные направления вроде беспилотного транспорта или разработки лекарств, но и потенциальные прорывы в областях, которые мы пока даже не можем себе представить. Учитывая репутацию Шолле как создателя Keras и бенчмарка ARC AGI, а также его вклад в развитие глубокого обучения, за этим проектом определенно стоит следить.

Новинки и открытия​

Postman и Zapier запускают конструкторы ИИ-агентов​

2025 потихоньку начинает подтверждать свое звание года ИИ-агентов: сразу две популярные платформы для автоматизации представили свои no-code решения.

Postman визуальный конструктор агентных воркфлоу, делая ставку на свою обширную экспертизу в работе с API — ключевым компонентом агентной архитектуры.

4f0ac59fb3326e29dd7878b2e186fcf2.gif

Следом свой конструктор Zapier, предложив доступ к более чем 7000 интеграций с популярными сервисами вроде Notion, Jira и Google Docs. 2025 год явно станет годом демократизации агентных технологий: теперь создавать ИИ-агентов смогут не только инженеры, но и обычные пользователи.

Anthropic рассказали о проблемах и будущем alignment​

Команда Anthropic выпустила интересное об элайменте с участием четырех ведущих разработчиков, включая Яна Лейке, известного по работе в OpenAI. Главный вывод — существующие подходы вроде RLHF и constitutional AI достигли своего предела и требуют переосмысления.

Ключевая проблема — масштабирование. Текущие методы работают для предсказуемых задач, но что делать, когда ИИ начнет решать проблемы, которые человек не может напрямую проверить? Отдельный вызов — ризонинг: сейчас модели «думают» на английском, что позволяет анализировать их рассуждения, но это может измениться.

Исследователи видят два перспективных направления: интерпретация фичей для контроля «честности» моделей и супер-элаймент для работы со сложными автономными системами. В Anthropic уже экспериментируют с делегированием элаймента другим ИИ-моделям и создали специальные red-blue команды: одни разрабатывают «злые» модели, другие учатся их исправлять.

Hugging Face запускает бесплатный курс по созданию ИИ-агентов​

Hugging Face представили новый бесплатный сертифицированный , посвященный разработке и развертыванию ИИ-агентов. Программа охватывает как теоретические основы (как агенты воспринимают окружение, рассуждают и принимают решения), так и практическое применение популярных фреймворков вроде LangChain и LlamaIndex.

Общий план курса (источник изображения)

Общий план курса
Особый акцент сделан на реальных примерах использования: от автоматизации SQL-запросов до генерации кода и анализа документов. По завершении курса участники получают сертификат, подтверждающий их навыки в создании агентных систем. Записаться на курс может любой желающий — специальных технических знаний не требуется.

Трансформер научился предсказывать активность мозга​

Команда Университета Сиднея впечатляющую разработку: трансформер, способный предсказывать состояния мозга на 5 секунд вперед на основе всего 21 секунды сканирования. В основе — архитектура с 8 головами внимания, которая анализирует активность 379 областей мозга.

Архитектура трансформера (источник изображения)

Архитектура трансформера
На тестах модель показывает феноменальные результаты: MSE 0.0013 на одной точке предсказания и корреляция >0.85 для последовательности из семи состояний (5.04 секунды). С увеличением горизонта предсказаний точность модели снижается, но в пределах первых пяти секунд прогнозы остаются исключительно точными.

Самое интересное, что это первый подход, который действительно имеет шанс на практическое применение. В мире много пациентов, которые не могут проходить длительные сеансы МРТ, и возможность получать надежные данные с коротких сканирований может стать для них настоящим прорывом.

Исследование показало эффективность ИИ в обнаружении рака груди​

Масштабное исследование в Германии преимущества использования искусственного интеллекта при скрининге рака молочной железы. Исследователи проанализировали данные 461 818 женщин, часть из которых проходила обследование с применением ИИ, а часть — по стандартной методике с двумя радиологами.

В группе с ИИ выявляемость оказалась на 17.6% выше — 6.70 случаев на 1000 обследований против 5.70 при стандартном подходе. Важно, что количество ложных срабатываний осталось на том же уровне. Система не только помечает «нормальные» снимки, но и выдает предупреждения, если радиолог пропускает подозрительный участок: благодаря этой функции было выявлено 204 случая рака.

Если рентгенологи ошибочно оценивают случай как нормальный, система выдает алерт и подсвечивает на снимке подозрительную область, предлагая пересмотреть решение.

Если рентгенологи ошибочно оценивают случай как нормальный, система выдает алерт и подсвечивает на снимке подозрительную область, предлагая пересмотреть решение.
Особенно актуально это для стран вроде Великобритании, где наблюдается 29%-й дефицит радиологов. Правда, эксперты отмечают необходимость долгосрочных исследований: увеличение выявляемости медленно растущих форм рака может привести к избыточной диагностике.

Свежие инструменты​

Для работы с данными​

— конвертация Git-репозиториев в текстовый формат для обучения LLM.

— опенсорсный семантический движок для быстрой обработки данных с помощью LLM.

— Python-пакет для сбора и структурирования веб-контента в различные форматы.

575885063538cbdc19a9e51d53f249fc.gif

— конвертация PDF, DOCX, PPTX и других форматов в JSON для обучения ИИ.

— инструмент для data pipeline, объединяющий прием данных, SQL/Python трансформации и контроль качества.

— быстрый и точный инструмент для удаления дубликатов из текстовых датасетов.

Для разработки​

— опенсорсная IDE для эффективной работы с Jupyter Notebooks.

— конвертация Jupyter Notebooks в Markdown, Julia, Python или R-скрипты.

— ИИ-расширение для IPython, помогающее быстрее писать и отлаживать код.

— инструмент для создания пайплайнов синтетических данных.

8fac3c151eb0c50581413a5f21110a27.gif

— наборы данных и модели для работы с геопространственными данными от Microsoft.

Для обучения и продуктивности​

— персонализированное изучение языков с ИИ-генерацией упражнений.

— практика языков с ИИ-репетитором.

— ИИ-помощник для работы с тревожными мыслями.

Для автоматизации​

— Chrome-расширение для сохранения контента в Google Sheets.

— создание команд ИИ-агентов для выполнения рабочих процессов.

e390d3727153f59263a4f04d46fe7c01.gif

— end-to-end QA продукт для автоматизации тестирования.

— ИИ-агенты для проверки соответствия продукта нормативным требованиям.







 
  • Теги
    ии возможности
  • Назад
    Сверху Снизу